レーティングその１：最も単純なモデル

おはようございます。なんちゃって研究企画をやると前言ってて、その時は蟻がどうこうにしようと思ってたけど、色々調べてるとなんというかやる価値があまりなさそう(結構研究されてるのはいいとしても、自分でやれる範囲で展望が望めない的な意味で)

そして、昔からムカついていたぷよぷよ20thanniversaryのクソ&クソレーティングがなんでクソなのかとか、理想的なレーティングってなんだ、とか考えたくてこれにしました。(後は軽くサーベイしたけどそれっぽいのが出なかったのもある、でも多分適切な検索ワードじゃないだけ)

と言っても式とかから収束性を考える純数学は無理なので、お決まりの簡単プログラミングで、乱数引いてレート推移を覗く形に。全体を通してだけど、あくまでなんちゃってなので許して(懇願)

まず大きなところから書く。一貫(多分)して仮定する要素は以下

勝敗は実力でのみ決まる
実力はスカラーである
思いついたら書きます

1.は厳密な書き方ではなく、正確には実力で決まる確率で勝敗が決まる。

2.これは多少１とも被るけど、簡単に言うと戦術を考慮しないことに相当する。おそらく本当のゲームでは実力はある成分(ぷよなら凝視、中盤、連鎖力とか、、、直交はしてないだろうけど)を持ったベクトルの長さで決まっていて、実際の勝敗はこの成分同士の優劣や、大きさで決まりそう。

色々書いたけど言いたかったことは大体1に集約されてる。

さて、今回紹介するのは一番簡単なモデルの結果です。はっきり言って20thのレーティングよりクソです。ぶっちゃけデバッグの一環です。

今回の計算条件をまとめると

実力：(0:1)の間の値を一様に乱数で振る。(現実では極値を持って、x=1付近で0に近くなりそう)

f:id:ta_ichi:20170207195512p:plain

勝敗：勝率が以下の実力差(gap)の関数として線形で決まる。さらにその勝率の元で乱数を引いて勝敗を決める(全然関係ないけどこういう時の実力って英語でなんていうんだ、、、ability?capability?)
レート計算：ぷよぷよレート戦を想定して２本先取を設定し、本数に比例して線形に増減、幅は１勝につき+10(2本とれば+20、2本取られれば−20)また、初期レートは2000とした
マッチング：今回はレートに依らず同じ確率で誰とでも当たるようにした。
その他：プレイ人数(以下N_p)は1000人、総ゲーム数(以下N_g)は300で計算

この条件のもとで計算。

①最強vs最弱たち

構成上申し訳ないが初めに純粋にデバッグ作業でしかないけど一人だけ実力を1にして他を0にして計算をする。

期待される結果→プレイヤー1のみ勝ち続け、レートは線形に増大。他は正確ではないが(プレイヤー1の存在のため)適正レートが初期レートで収束し、そこを軸としたランダムウォークをする。(勝率が半々なので)

①の結果

f:id:ta_ichi:20170207202507p:plain

まずプレイヤー1の結果、図のタイトルは前述の通り、図中の1.00~ってやつは実力の数値。期待通り負けることなく勝ち続ける。まるで僕みたいダァ

次は他の奴ら

f:id:ta_ichi:20170207202651p:plain

f:id:ta_ichi:20170207202708p:plain

だいたい大丈夫そう。余談でもあり、本質なのかもしれないけど、ランダムウォークにおいて平均値を軸として正負の領域を定めると、そのどちらかにいる確率というのは等価でない。調べれば無限に出てくるし、多分ランダムウォークの本とかにも絶対書いてあると思う。この設定において試合数が大きければ大きいほどその傾向は大きくなる。じゃあ適正レートってなんだ、どうやって調べるんだまぁ、、、適正レート(収束値)の定義はゆくゆく(？)・・・。もう誰か考えてください。(増減の期待値とかで決まるのかなぁ・・・)