どうもすらいむ(@slime_dual)です。
今回は先日から行っていました、アビリティ発動率の検証が一段落ついたので、検証結果についてまとめていきたいと思います。
1.検証結果
早速、今回検証したものを表形式で載せていきます。
アビリティ名 | Lv | 試行回数 | 発動数 | 発動率 |
---|---|---|---|---|
スタンドショー | 1 | 1000 | 573 | 57.3% |
スタンドショー | 3 | 1500 | 1331 | 88.7% |
ピックヘイト | 1 | 1000 | 386 | 38.6% |
ピックヘイト | 2 | 1000 | 621 | 62.1% |
ピックヘイト | 3 | 2000 | 1599 | 80.0% |
ソウルドレイン | 1 | 1000 | 530 | 53.0% |
ソウルドレイン | 3 | 1000 | 705 | 70.5% |
フルスラッシュ | 3 | 1000 | 679 | 67.9% |
レストブロー | 3 | 800 | 564 | 70.5% |
セットアクト | 1 | 1000 | 616 | 61.6% |
セットアクト | 3 | 100 | 100 | 100.0% |
パワースマッシュ | 2 | 500 | 264 | 52.8% |
パワースマッシュ | 4 | 500 | 349 | 69.8% |
ライフコンバート | 2 | 500 | 251 | 50.2% |
ライフコンバート | 4 | 500 | 342 | 68.4% |
コンビネーション | 2 | 500 | 257 | 51.4% |
コンビネーション | 4 | 500 | 365 | 73.0% |
カットシールド | 2 | 500 | 255 | 51.0% |
カットシールド | 4 | 500 | 349 | 69.8% |
シャットオーバー | 1 | 100 | 42 | 42.0% |
シャットオーバー | 5 | 50 | 39 | 78.0% |
カーズパワー | 2 | 500 | 256 | 51.2% |
カーズパワー | 4 | 500 | 352 | 70.4% |
ウィルバインド | 1 | 1000 | 754 | 75.4% |
プロテクション | 1 | 500 | 208 | 41.6% |
プロテクション | 2 | 500 | 243 | 48.6% |
プロテクション | 3 | 500 | 293 | 58.6% |
プロテクション | 4 | 500 | 346 | 69.2% |
プロテクション | 5 | 1000 | 789 | 78.9% |
ブレイブ&メイル | 2 | 300 | 155 | 51.7% |
ブレイブ&メイル | 5 | 300 | 241 | 80.3% |
ヒール | 4 | 500 | 405 | 81.0% |
ヒール | 5 | 500 | 454 | 90.8% |
ヒールオール | 4 | 500 | 343 | 68.6% |
ヒールオール | 5 | 500 | 402 | 80.4% |
試行回数については、上の方(MaxLv3)のアビリティが1,000回、下の方(MaxLv5)のアビリティが500回、協力者さんに頼んだものや検証が面倒なものは500回以下という基準を設けつつ、状況に応じて変更していきました。
もちろん全て手作業での検証となります。
2.発動率のまとめ
上記結果を基に、アビリティの発動率を綺麗な値でまとめました。
記載方法は、Lv1から順に%を省略した形とし、赤字は検証したもの、青字は直接検証せず検証結果から推測した値です。
(40-60-80の場合、Lv1が40%、Lv2が60%、Lv3が80%)
・レベル3攻撃系 :50-60-70
・ピックヘイト :40-60-80
・スタンドショー :60-75-90
・セットアクト :60-80-100
・ウィルバインド :75-80-85-90-95
・ヒール :50-60-70-80-90
・その他のアビリティ:40-50-60-70-80
※レベル3攻撃系は「レストブロー」「ソウルドレイン」「フルスラッシュ」のこと
※プレッシェンドは不明
3.ちょっと難しい話
上のまとめを見て「おいちょっとまてよ」と思った方、いると思います。
というのも、例えばスタンドショーLv1の検証結果である57.3%を60%と決めつけていいのかという問題が出てきます。自分としても60%としてしまっていいのかは気になるところです。
その問題を解決すべく、ここでちょっくら「確率」と「統計」の勉強をしましょう。
と言っても、自分はこの分野に詳しいわけではないので、あくまでざっくりとです。間違えていることがあったら申し訳ありません。
Z検定とは
まず、アビリティのように試行結果が「成功か失敗か」といった2種類しかない試行のことを、統計学では「ベルヌーイ試行」と言い、「互いに独立したベルヌーイ試行をn回行ったときにある事象が何回起こるかの確率分布」のことを「二項分布」と言います。
そして、「二項分布は標本サイズが大きい場合、正規分布に近似可能」というド・モアブル-ラプラスの定理によって、「Z検定」と呼ばれる「正規分布を用いて推定値と測定値を比較し、有意性の有無を確認できる仮説検定」を用いることができます。
要するに、「Z検定=推定確率と測定確率を比べて、妥当かの判断ができるすげーやつ」程度に考えておいてください。(かなり雑な表現ですが…)
実際にやってみる
難しい話はこのくらいにして、実際にこのZ検定をした表を見てみましょう。
(有意水準α=0.05、両側検定)
アビリティ名 | レベル | 検定統計量 | 妥当 |
---|---|---|---|
スタンドショー | 1 | -1.74 | ○ |
スタンドショー | 3 | -1.64 | ○ |
ピックヘイト | 1 | -0.90 | ○ |
ピックヘイト | 2 | 1.36 | ○ |
ピックヘイト | 3 | -0.06 | ○ |
ソウルドレイン | 1 | 1.90 | ○ |
ソウルドレイン | 3 | 0.35 | ○ |
フルスラッシュ | 3 | -1.45 | ○ |
レストブロー | 3 | 0.31 | ○ |
セットアクト | 1 | 1.03 | ○ |
セットアクト | 3 | 0.00 | ○ |
パワースマッシュ | 2 | 1.25 | ○ |
パワースマッシュ | 4 | -0.10 | ○ |
ライフコンバート | 2 | 0.09 | ○ |
ライフコンバート | 4 | -0.78 | ○ |
コンビネーション | 2 | 0.63 | ○ |
コンビネーション | 4 | 1.46 | ○ |
カットシールド | 2 | 0.45 | ○ |
カットシールド | 4 | -0.10 | ○ |
シャットオーバー | 1 | 0.41 | ○ |
シャットオーバー | 5 | -0.35 | ○ |
カーズパワー | 2 | 0.54 | ○ |
カーズパワー | 4 | 0.20 | ○ |
ウィルバインド | 1 | 0.29 | ○ |
プロテクション | 1 | 0.73 | ○ |
プロテクション | 2 | -0.63 | ○ |
プロテクション | 3 | -0.64 | ○ |
プロテクション | 4 | -0.39 | ○ |
プロテクション | 5 | -0.87 | ○ |
ブレイブ&メイル | 2 | 0.58 | ○ |
ブレイブ&メイル | 5 | 0.14 | ○ |
ヒール | 4 | 0.56 | ○ |
ヒール | 5 | 0.60 | ○ |
ヒールオール | 4 | -0.68 | ○ |
ヒールオール | 5 | 0.22 | ○ |
この表の中の「検定統計量」がZ検定によって求められた値です。そして、この値が-1.96~1.96の間にある場合、妥当である(有意性が無い)と言えます。
どうやら全て妥当である(有意性が無い)と言えそうですね。ここでようやく「一項で示した測定確率」を「二項で示した推定確率」としても問題無さそうということがわかりました。
4.謝辞と言い訳
検証協力者様へのお礼
今回の検証では、何名かの方に協力してもらいました。
セットアクトLv3をちゅらさん、シャットオーバーLv5をきこさん、レストブローLv3をルチェリオさんに。
そして最大の協力者であるポォポルドさんには、スタンドショーLv3、ピックヘイトLv3、フルスラッシュLv3、プロテクションLv1,2,3の検証を手伝ってもらいました。
4名の方、改めて協力ありがとうございました!
前者2名は自分も所属している「デュアルソード」、後者2名は「奈落の探窟家」所属の方です。
デュアルはともかく奈落さんはとても良い部隊なので、メンバー募集があった時にはぜひ検討してみてください。(ダイレクトマーケティング)
このような地味で得られるものがほとんど無い検証に力を貸してくれて、本当に助かりました。
ここから言い訳
ここまで読んでくれた方、ありがとうございます。中には「なんでこんな大事なこと調査してなかったんだよ!!」と言いたい方がいると思うので言い訳しておきます。
まず第一に、答えが確定しない点。
発動率は確率なので、どれだけ時間をかけて調査しても答えが一意に定まることはありません。さて、答えが一意に定まるものと定まらないもの、どちらの方が調査が楽でしょうか。
・・・当たり前ですが定まるものの方が楽ですし、何より終わった後すっきりします。これが確率関連に触れようとしない一番の理由です。
第二に、試行回数が膨大で時間がかかる点。
どのくらいの精度を求めるかにもよりますが、半端な数では正しい結果が得られません。個人的には1,000回はやりたいと思っていますが、いくつものアビリティで1,000回ずつ試行するとなると、かなりの時間がかかるということが容易に想像できます。そしてなによりめんどくさい。
実際、今回途中から辛くなって500回にまで減らしていますし、それでも自分だけで18,800回試行したことになります。ビスケット小袋換算すると大体700個ほどです。
第三に、rinが大量にかかる点。
検証中は10ターン生き延びることを第一に考えているため、まず勝てません。そのため、今回検証に使ったビスケット小袋700個(約20m)は全部パーです。
また、ステータス調整用の装備、シャットオーバーLv1用メルベルンの錬成代、各拠点移動代を考えればもっとrinが消し飛んでいます。
・・・と、多くの時間をかけて、多くのrinをかけて、得られるものが確定しない情報のみ。こんなの進んでやりたい人居ますか?居るなら代わりにやってくれ。
検証期間中は部隊でアロマ祭りしていようが、英雄持ち寄りしていようが、レイドやっていようが全てスルーして検証に集中していました。そしてこういう時に限って周囲で色々起きてその対応しなきゃならなかったり。
こんな感じで精神擦り減らせながらも何とかやりきりました。でもこれから討伐シミュの修正やら、検証期間中に溜まったやるべきことがたんまりと控えています。休めるのはまだ先みたいですね。
最後はなんだか愚痴みたくなってしまいましたが、これにて結果報告を終わります。ご清聴ありがとうございました。