6章 ランダムウォーク 漸化式


今回はランダムウォークを取り上げてみます。


ランダムウォークの定義 

確率過程Ziが1次元対称ランダムウォークであるとは、Z0=0, Zt=X1+X2+X3..Xtを満たしていることである。

このとき、X1,X2,X3...Xtは独立な確率変数で、P(Xi=1)=P(Xi=-1)=InftyProjectである。


分りますか、これ。


最初はゼロで、そこから1つ1つ進みます。

どっちに進むかはその時その時に決めますが、+に進むか-に進むかは半々です。

という意味です。




image001.png

0地点から始まって、必ず+1か-1へ進み、どっちに進むかは半々です。

数字はY軸の値でランダムに進んだ時の着地点ですね。

4回全部+方向だと+4になり、-方向だと-4になります。

進む回数が増えると着地点も拡がりそれだけ確率も拡散する事になります。


ランダムウォークは時系列でもよく見聞きします。

時系列で気になるのは、t時間後どの位置にいるかです。

4日でも4時間でもいいですが、t4後にどの位置にいる確率が高いでしょうか。

t4後の確率をInftyProjectとします。この時+2に居る確率はInftyProjectで表せます。

この式は、4回進んだとして、その時2に到達するまでに通る経路の確率を全部足し合わせてしまいましょう、との意味です。

経路全部書き出すと、

{+,+,+,-}

{+,+,-,+}

{+,-,+,+}

{-,+,+,+}

の4通りです。+方向に動く確率をp、-をqとするとInftyProjectが求まります。

pもqもInftyProjectなのでこれを計算すると0.25です。

+2以外も全部計算してみましょう。

4になるには{+,+,+,+}の経路しかありませんので、InftyProjectで0.0625です。

0なら、

{p,p,q,q}

{p,q,p,q}

{p,q,q,p}

{q,p,p,q}

{q,p,q,p}

{q,q,p,p}

の6通りですのでInftyProjectで0.375です。


組み合わせで計算するなら、

-2に到達する経路はInftyProjectもしくはInftyProjectで4通りで、-4ならInftyProjectで6通りです。


ですので、確率分布はInftyProjectとなります。

問いはt4後にどの位置にいる確率が高いでしょうか、というものでしたので0ということになります。


同じ図ですが、少し変えています。

image002.png

先ほどのランダムウォークの図を、そこに辿り着くまで何通りの道順があるかで表してみました。

そうすると、パスカルの三角形が出来てしまいます。

InftyProject

InftyProject

InftyProject

InftyProject

InftyProject

無限に続きますが、図に合わせて4つまでにします。


InftyProjectの展開式はt4の確率分布を計算した式そのものです。

これは、二項定理そのものですね。

InftyProject


二項定理、パスカルの三角形は確率計算でよく使われます。

ランダムウォークでは+-でしたが、コインの裏表でも同じです。

表がa、裏がbとします。

コインを4回投げて、表が4回出る確率は、InftyProjectInftyProjectの計算ですから0.0625です。

4回投げて表3回裏1回は、InftyProjectのところを見れば分ります。

{表、表、表、裏}

{表、表、裏、表}

{表、裏、表、表}

{裏、表、表、表}

の4通りあって確率は0.25です。


ちなみにInftyProjectの時、展開式の係数、べき乗の和は、常にnになります。

4乗の、InftyProjectは係数は4です。InftyProjectInftyProjectの意味ですから3乗と1乗で係数は4です。InftyProjectInftyProjectInftyProject係数は4になります。

当たり前と言えば当たり前ですが、そういう規則性があります。



ランダムウォークにまで二項分布が出てきましたね。


どんなに複雑な問題でも、2つのうちどちらか、と置き換えて考えるのと解決の糸口になります。


仮説検定も、A=BかA≠Bかの二者択一の判定です。

サイコロも1の目が出るか、それ以外かの二者択一としました。

ランダムウォークも+か-のどちらに動くかです。どちらにも動かないは無しです。

どうしても動かない、を扱いたければ、動くか動かないで一度考えて、もし動いたなら+か-かと考えるとシンプルになりますよね。

P(+or-|動いた)と考えると分り易いです。


そして、そこには必ず二項分布が登場します。



二項分布。


それは好むと好まざるとに関わらず常にそこに居ます。




さて、少し話を変えてみます。


{1,6,15,28,45,66....}こんな集合Aがあるとします。

この7番目の値A7はいくつでしょうか。


少し変形してみます。B=A(n+1)-Anとして次の集合を得てみます。

{5,9,13,17,21....}これをBとしましょう。今度は5個しかありませんので6番目の値、B6ならいくつでしょう。

4ずつ増えているだけですので、B6は、25です。


並べてみます。

A{1,6,15,28,45,66...}

B{5,9,13,17,21,25...}



Bは4の等差数列です。

6番目のBの値は、その前値までに4が5回足されています。

つまり4×5で最初の値から20が足されている事になります。

最初の値は5なのでB6=5+4×5で求まります。

この×5と言うのは6番目だからでした。7番目なら6です。

これはn番目のひとつ前という意味なので、n-1で表せます。

ですので、Bn=5+4(n-1)=4n+1で何番目でも計算できますね。


Aの方は、An=InftyProjectです。 A4なら、1+(4×1+1)+(4×2+1)+(4×2+1)+(4×4+1)で45ですね。

InftyProjectという等差数列の和の公式を覚えていますか。

{1,2,3,4,5}の和はInftyProjectで15です。

原理は{1,2,3,4,5}と元の数列をひっくり返した{5,4,3,2,1}を順番に足していくと{6,6,6,6,6}の数列が出来ます。

これを全部足します。つまり6×nの掛け算ですね。これは2つ分の数列の和なので、2で割って15という意味です。

つまりInftyProject(1+n)(n)です。これはInftyProjectの公式そのものですね。


InftyProjectもこれを使って展開すると、InftyProjectになります。

ですが、Anの求めるには1つ前のnですので、InftyProjectInftyProjectとなり

An=InftyProjectが求まります。


このように、ひとつ前の数字から次の数字を求める式を、なんて呼ぶか覚えていますか。

そうです、漸化式です。


なんでこんな計算を突如始めたのか。


ベイズの本には必ずと言っていいほど、カルマンフィルターやマルコフ連鎖モンテカルロ法(MCMC:Markov Chain MonteCarlo)が載っています。


今回は、それらに進む代わりにベースとなるであろう知識として、漸化式とランダムウォークに触れてみました。


時系列データは規則性とノイズ成分を分ける計算をしてそれをさらにくっ付けて分析します。

規則性は漸化式になり、ランダムウォークのようなノイズ成分は確率変数として加え、t時間後はどこにいる確率が高いのか、のような予測をします。

いつ起きるかを予想することは、何が起きるかを予想することより何倍も難しい、と言った投資家が居たようですが、

金融データは月足、週足、日足、時間足でトレンドが一致しなくて当たり前ですし、ノイズばかりでそのノイズも常に一定しない変化の激しく、なかなか手に負えないやっかいなものです。


ただ、研究を続けていくつもの計算式を用意しておけば、ある環境では式Aが有効、この状態では式Bが有効、などのように精度を高めていくとは出来るような気がしています。


聖杯を手にされた方は、筆者までご連絡下さい。



次回、最終回は確率という数字が手元にあった場合、どのように意思決定につなげるのか。

ゲーム理論のさわりを紹介したいと思います。

前章へ 次章へ

メインメニュー