統計分析。
統計分析
麻雀は、感性や経験によって語られることが多い。
感性や経験に因らずに、麻雀を語る方法は、2通りあり、1つは数学的解析で、もう1つは統計分析である。
数学的解析とは、理論上計算できるもので、例えば配牌のトータルパターン数の計算や、天和の確率計算、理論上裏ドラの乗る確率計算、和了期待点計算などである。
統計分析とは、実際の牌譜から実績データとして偏りなどを見るものである。
例えば、ロンはツモの何倍多いか? 理論上4人で打っていて、ツモは自分1人、ロンは他家3人だから、ロンはツモの3倍というのが、数学的解析(解析というほどのものでもないただの算数)であるが、統計分析で得た実績上はもっと低いのである。
三色同順と一気通貫は、どちらが多いか? 同じ2飜であり、同じ食い下がり1飜であり、同じ9枚の牌を使うこの2つの役はよく並び称される。
数学的解析では、三色同順は123、234、・・・789の7パターンある。一気通貫は3つの色で3パターンある。よって、7:3の割合で三色同順が多い、2.33倍三色同順が多いと単純に計算できる。
統計分析の結果では、2.15倍である。母数が充分に多いので、この数値の差は誤差の範囲ではない。
では、なぜこのような差が出るのか?
数学的解析において、単純に面子構成要素だけを計算しているが、これは乱暴な方法である。123という順子よりも456の順子の方が遥かに構成しやすいのである。では、どれくらい構成しやすいのか、という計算をする上において、「手作りの意図」という概念が生まれてくる。つまり人間は「何でもいいから聴牌して和がればいい」と考えるのではなく、特定の役を意識して打つのである。
2.33倍という数学的解析の結果と、2.15倍という統計分析の結果を、きっちりと分けて認識する必要がある。つまり、自分が手作りをする場合においては、2.33倍を考え、他家の牌構成読み・役読みをする場合においては、2.15倍を考えればよいのである。(数学的解析における2.33倍という数値は端寄りと中寄りの順子構成のしやすさの考慮をしていないものなので、別途パターンを分けて計算する)
人間は、自分の経験からパターンを抽出し、そのパターンに当てはめて物事を考える。「三色同順に行くか、一気通貫に行くか、悩んでどちらか決めた。そして成功または失敗した」というような経験を自分なりに汎化している。しかし、このような経験を牌譜を取ってしっかり検証していない場合が殆どであるし、また、その母数もたかが知れている。また、人間は長い蓄積をすべて生かせず、直近に経験したことの印象で決断しやすいし、さらに言えば、成功または失敗の認識そのものが誤っていることが多いのである。「三色同順に行くか、一気通貫に行くか、悩んで三色同順に決めた。そして成功した」という経験の認識において、本当にその判断が成功だったという確固たる検証作業がないのである。判断は失敗だったが、たまたま成功したのかもしれないのである。
統計は、母数が多ければ多いほどその信頼性は高いものになる。
1人の人間が一生かかっても経験しきれない、また、経験したとしても、記憶しきれないほどの多くのデータを客観的・定量的に捉えることは、雀力向上に寄与するところ大である。
この分析の元となるデータは東風荘の牌譜データによる。多くの方の協力を得て大量の牌譜データを入手することができた。メールで牌譜データを送って頂いた方、牌譜データがある場所を教えて下さった方、ありがとうございました。
従ってこのデータは東風荘の麻雀ルールによるものである。特に注意しなければならない点は、東風荘では食い断なし、東風戦であるが南入があるということである。
分析には対局者数にして1万人以上が含まれる。初心者もいれば上級者もいる。これらのすべての平均と思っていいであろう。
母数となる素データの局数は120,589局分、うち、和了数は103,737和了である。
プログラムを設計して製造し、テキストファイルを読み込んで分析して出力するということにより下記結果を得ている。
●2−10−1 統計分析 局・役分析
局ごとのパラメータ、場・本場・符数・飜数・収入点などを統計分析。
および、各役の発生頻度の統計分析。
●2−10−2 統計分析 牌分析
個別の牌がどれくらい面子構成に寄与するのか、どれくらい持たれやすいのか捨てられやすいのか、に関する統計分析。
●2−10−3 統計分析 待ち分析
待ちのパターン、待ちの種類に関する統計分析。
●2−10−4 統計分析 捨て牌分析
捨て牌と待ち牌の相関の分析。(ただいま分析中。近日公開、乞うご期待)
|
|