「夫子憮然曰、鳥獣不可與同羣。吾非斯人之徒與、而誰與。
「論語」微子、第十八、六

2014/04/27

ピークの間隔は3

午前中は「統計学とは何か」(C.R.ラオ著/藤越康祝・柳井晴夫・田栗正章訳/ちくま学芸文庫)を読んだり。ある動物の毎年の個体数を調べていると、おおまかに三年周期であると分かった、これは「新発見」だろうか、という問題が出ている。

ランダムな数字が三つ並んでいれば、(同点を無視すれば)真ん中の数が一番大きい確率は明らかに三分の一である。同様に、乱数列の中のあるデータがピーク(前後よりも値が大きいデータ)である確率も三分の一であり、ピークの個数の期待値はデータ数の三分の一である。したがって、ピークの間隔は約 3 になる。つまり、ランダムなデータ列からは常に周期 3 が読み取れてしまう!

ほほう……と感心して読んだのだが、あるデータがピークになる確率が三分の一になることはいいが、二つのデータがそれぞれピークになるかどうかは独立ではないので(例えば、あるデータがピークなら、その次のデータはピークになりえない)、列の中のピークの個数の確率分布を正しく求めることはかなり難しそうに思える。おそらく既知だとは思うが、腕に覚えのある方は計算してみてはいかがだろう。連休の暇つぶしとして。