ドロップ率推定の必要サンプル数見積もり

ハクスラモンスターズで、「アイテムLv(★)1024の装備あまりにも出なさ過ぎてブーストチケットがちゃんと聞いてるのか疑わしいのでドロップ率開示してくれ」という要望に対して、「実装に工数掛かるし、表示が間違ってた時の詫びがヤバいし、確率の意味分かってない奴からクレーム受けるのが嫌だし、ユーザーが統計取れば動作が正常かはすぐ明らかになる」と答えてたので、サンプル数どれくらい必要なのか考えてみた(ついでに統計周りでググった知識のリンク張っておくメモ)。

サンプル数計算(多分Wald法)

有意水準5%、推定確率と有効範囲を年1として0.00003805175%((1年が525600分・1周20分・4パーティ=1/420,480)でサンプル数計算・信頼区間計算・ドロップ率検定機に入れたら10,095,722。1000万週は記録する気にならないので諦め。

Wald法(正規分布

俺も統計学の授業で習った気がする方法だけど、正規分布へ近似しているので、サンプルが少数の場合に誤差が大きいらしい。ただ、上のリンクの95%信頼区間で欲しい区間を1%の時n=38,416になる奴を、後述のClopper-Pearsonの正確法(F分布)で計算したら0.92%だったので誤差は誤差かも。

Clopper-Pearsonの正確法(F分布)

正確というのは近似してないという意味で、古い方法らしい。有効範囲は(上側-下側)で良いとしても、試行回数の式への変形が分からん。

Sterneなどその他

上のPDFによるとSterne検定?が優秀らしくRで使えるらしいけど、オンライン実行環境だとexactciライブラリがなかったのでインストール面倒だからやめた。下のリンクのAgresti-Coull法(調整Wald法)/Jeffreys法は表記揺れなのか別手法なのか分からん。