【入門】投資のリスクを徹底理解!サイコロの例で学ぶ標準偏差【分散、標準偏差について】

経済学において「リスク(risk)」という言葉は非常に重要な概念です。

投資や金融政策、企業経営から個人の意思決定に至るまで、リスクはあらゆる経済活動に影響を与えます。

しかし、一般的な日常用語としての「リスク」と、経済学における「リスク」では、その意味合いがやや異なることもあります。

本記事では、経済学におけるリスクを詳しく解説します。

この記事で学べること

  • リスクとは何か
  • 期待値
  • 偏差
  • 分散
  • 標準偏差

結論だけを最初に

  • 経済学では、リスク=標準偏差が一般的
  • 標準偏差とは、値のバラつきの期待値の目安(厳密には期待値そのものではない)
  • xの期待値と予測値とのズレが偏差
  • 偏差の2乗が分散
  • 分散の平方根が標準偏差:\(\sigma = \sqrt{\mathrm{Var}(\tilde{x})}\)

リスクとは何か

通行人A
僕知ってるよ!投資のリスクって危険じゃなくて、値上がりも値下がりも含めた幅のことなんだよね!
黒野
そうだね!リスクは幅みたいなものなんだ。
通行人A
でもなんで値幅がリスクなんだろ?そもそも幅ってどうやって求めるの?
黒野
リスクを理解するにはその辺が大事なんだよ。じゃあ一緒に基礎から見ていこうか!

リスクとは

経済学においてリスクとは、将来の事象について、その発生確率が既知である不確実性のことを指します。

もし、発生確率確率分布)が全く不明な場合は「(真の)不確実性」といい、リスクとは区別されます。

たとえば、「サイコロの出目が分からない」のはリスクですが、「好きな女性に告白してOKされるか分からない」は不確実性です。

この不確実性の区分はフランク・H・ナイト(1921)によって初めて定義されました。彼は、「不確実性(Uncertainty)」という広い概念を「リスク(Risk)」と「真の不確実性(Uncertainty)」に厳密に区分したのです。ただし、経済学では「真の不確実性」は、「狭義の不確実性」あるいは単に「不確実性」と呼ばれることが多いです。

不確実性の区分

  1. リスク(Risk)
    結果の確率分布が分かっている(もしくは推定可能な)不確実性

  2. 真の不確実性(Uncertainty)
    確率分布自体が不明で、定量的に予測できない不確実性

リスクの指標

リスクを測る指標として使われるものは、

  • 分散
  • 標準偏差

の2つがあり、特に標準偏差σが使われるのが一般的です。

たとえば、証券会社が投資信託のリスクとして表示する値は標準偏差のことです。

標準偏差(リスク)の求め方

黒野
標準偏差は以下の流れで求められます。

標準偏差の導出

  1. 確率変数から期待値を求める
  2. 偏差を求める
  3. 分散を求める
  4. 標準偏差を求める

1. 確率変数から期待値を求める

確率変数とは、将来時点において、いくつかの状態が存在し、それらの状態が実現する確率、そのときに取りうる値が事前に与えられている変数のことです。

定義はややこしいですが、記号に分ければシンプルです。

  • 状態(State)・・・\(S\)
  • 確率(Probability)・・・\(P\)
  • 取りうる値・・・\(x(S)\)

この\(x(S)\)は、「状態が\(S\)のときに、確率変数\(x\)がとる値」です。

なお、経済学では確率変数\(x\)はチルダ\((\text{~})\)をつけて\(\tilde{x}\)のように表現されるのが一般的です。

ここで、状態の集合を、

\[\mathcal{S} = \{s_1, s_2, \dots, s_n\}\]と定義すると、各状態\(s_i\)において、

  • 取りうる値:\(x_i\)
  • 発生確率:\(p_i\)

が与えられます。
※便宜上、各状態\(s_i\)における取りうる値\(x(s_i)\)、発生確率\(p(s_i)\)をそれぞれ、\(x_i\)、\(p_i\)と表記しています。

この定義で確率分布表を作成すると以下の通りです。

状態\(s_1\)\(s_2\)\(\cdots\)\(s_n\)
確率\(p_1\)\(p_2\)\(\cdots\)\(p_n\)
得点\(x_1\)\(x_2\)\(\cdots\)\(x_n\)

ただし、すべての状態の確率の合計は1であることが前提です。(\(\sum_{i=1}^{n}p_i=1\))

期待値の定義

さて、確率分布は情報量が多く比較が難しい。そこで確率分布から期待値\((μ)\)を求めます。待値とは、確率分布における重心となるような値で、各状態の取りうる値にその確率を掛けて合計した加重平均として定義されます。すなわち、

\[\mathbb{E}(\tilde{x})=\sum_{i=1}^{n}p_i\cdot x_i\]

で表されます。このように、\(\tilde{x}\)の期待値\(\mu\)は\(\mathbb{E}(\tilde{x})\)のように書かれます。

たとえば、サイコロの出目を例にとると、

状態123456
確率1/61/61/61/61/61/6
得点123456

これの期待値を計算すると、

\[
\begin{align}
\mathbb{E}(\tilde{x}) &= \sum_{i=1}^{6}p_i\cdot x_i \\[1.2em]&= \left(\frac{1}{6}\cdot 1\right)+\left(\frac{1}{6}\cdot 2\right)+\left(\frac{1}{6}\cdot 3\right)+\left(\frac{1}{6}\cdot 4\right)+\left(\frac{1}{6}\cdot 5\right)+\left(\frac{1}{6}\cdot 6\right) \\[1.2em]&= 3.5
\end{align}
\]

つまり、サイコロの得点の期待値は3.5となります。(ちなみに得点とサイコロの出目が同じなので、サイコロの出目の期待値も3.5ですね)

2. 偏差を求める

偏差とは、確率分布における取りうる値の期待値からの乖離のことです。つまり、期待値からのズレであり、リスクの正体です。

具体的には、各状態において得られる値\(x_i\)から、期待値\(μ\)を引いた値として定義されます。

\[\text{偏差} =x_i-\mu \]

したがって、偏差は状態\(S\)の数だけ存在します。なお、偏差は「距離」ではなく「乖離」であり、期待値からどれだけ、どの方向にずれているか(\(+,−\)の符号を持つ)という方向性のあるズレを意味します。絶対値ではないことに注意してください。

サイコロの例の偏差\((x_i-3.5)\)は以下のようになります。

状態123456
偏差-2.5-1.5-0.5+0.5+1.5+2.5

3. 分散を求める

偏差はリスクそのものですが、状態の数だけ存在するので扱い難い。そこで、偏差から期待値を求める操作をします。それが分散です。

分散とは、偏差を2乗した値の期待値です。それは、\(p_i\)をウェイトとした偏差の2乗の加重平均として定義されます。すなわち、

\[\operatorname{Var}(\tilde{x} )=\sum_{i=1}^{n} p_i \cdot (\overbrace{x_i-\mathbb{E}(\tilde{x})}^{\text{偏差}}) ^2\]

\(\text{Var}\)は分散(variance)を表しており、\(\tilde{x}\)における偏差を2乗した値の期待値を示しています。

通行人A
なぜ、分散は偏差の2乗をしてるの?
黒野
偏差は正の値にも負の値にもなります。単純に平均を取ると、正負が打ち消し合ってしまうので、偏差を2乗してすべて正にしてから平均をとっているんだよ!
(実際、\(\sum (x_i -μ)=o\)になるからね)

サイコロの例から分散を求めると、

\[
\begin{aligned}
\operatorname{Var}(\tilde{x}) &= \sum_{i=1}^{6} p_i (x_i – \mu)^2 \\[1.2em]&= \frac{1}{6} \left( 6.25 + 2.25 + 0.25 + 0.25 + 2.25 + 6.25 \right) \\[1.2em]&= \frac{17.5}{6}\approx 2.9167 \\[1.2em]\end{aligned}
\]

4. 標準偏差を求める

分散は、リスクの指標になるのですが、偏差を2乗した数値を基にしているので、単位も元の単位の2乗になります。たとえば、「\(\text{円}^2\)」とかだと直感的に理解しづらい。

そこで、分散の平方根をとって元の単位に戻す操作をします。これが標準偏差\((σ)\)です。

\[\sigma(\tilde{x})= \sqrt{\operatorname{Var}(\tilde{x})}\]

標準偏差は、元の単位に戻っているので直感的に理解しやすくなります。そして、標準偏差はズレの2乗の期待値の平方根であり、ズレの分布の広がり(バラつき)の目安なので、リスクの指標として一般的に使用されます。

サイコロの例から標準偏差を求めると、

\[\sigma(\tilde{x})= \sqrt{\operatorname{Var}(\tilde{x})}= \sqrt{2.9167}\approx 1.708\]

黒野
以上が標準偏差の求め方です!

標準偏差の意味

標準偏差は、バラつきの目安なので、リスクの指標になるものと上で説明しました。ではこれを直感的に理解できるように説明します。

ここで、サイコロの例で以下のように得点を変更したものを用意しました。

状態123456
得点-113468

明らかに得点に幅がありますよね。

これの期待値は、\(\operatorname{E}(\tilde{x})=3.5\)、標準偏差は、\(\sigma \approx 6.013\)という値になります。

これは、先ほどの例(得点が1〜6の均等な出目)の\(\sigma \approx 1.708\)と比べてかなり大きく、得点の開きが大きくなっている=リスクが高まっていることがわかります。その結果、得点の期待値は同じなのに、より大きな得点や小さい得点になる可能性があることがわかります。

ただし、ここで重要なのは次の点です。

  • 標準偏差は「得点のばらつき」を示すものであって、「得点の大きさ」を表すものではない。
  • たとえば、すべての得点がマイナスであってもばらつきが大きければ\(\sigma\)は大きくなります。
  • 逆に、すべての得点が100で同じだったとしたら、ばらつきはゼロなので\(\sigma = 0\)になります。

つまり、標準偏差はあくまで「ズレの度合い」の指標であり、リターンの大きさ自体を評価するものではないという点に注意が必要です。

仮に同じ期待値であれば、\(\sigma\)が大きいほど高リターンが狙える反面、相対的にマイナスになる可能性を秘めてるということです。

正規分布を考える

同じ平均・同じ標準偏差でも、どんな分布形状をしているかは一意に決まりませんが、仮に「データが正規分布に従うなら」、標準偏差には確率的な意味が出てきます。

正規分布とは、

  • 平均を中心に左右対称で、ベル形カーブ(ガウス曲線)を描き。

  • 中央が最も確率が高く、遠ざかるほど低くなる。

こんな感じのグラフです。

正規分布では、以下のルール(68–95–99.7則といいます)が成り立ちます。


68–95–99.7則

  • 平均 ±1σ の範囲に約 68%
  • 平均 ±2σ の範囲に約 95%
  • 平均 ±3σ の範囲に約 99.7% のデータが含まれる

\(±1\sigma\)ということは、山の中心から左右に\(1\sigma\)ずつの範囲に68%の確率で結果が収まるよということです!

こんな感じで、赤の範囲に68%の確率で収まるよってイメージ!さらに\(\sigma\)を広げれば確率が高くなるけど分布の範囲が広がってしまう感じ。

また、\(x\)が30%以下に収まる範囲は、中心から左半分は確率0.5であり、上の図の赤の範囲の半分が0.34であることから、合計0.84であることがわかり、したがって、84%の確率でxが30%以下に収まるということが求められます。

これが「標準偏差がリスクの目安になる」という意味の根拠です。

ただし、標準偏差の基となる分散は偏差を2乗しているので、リスクそのものを表すのではなく、目安であるという点に注意です。また、2乗しているので外れ値の影響を大きく受けるなどの欠点も存在します。

そして、非正規分布の場合は標準偏差だけでは不十分なので別の指標を追加したり、より高度な分析が必要になります。

黒野
株式の世界では非正規分布になるのが一般的です。

株式における標準偏差

株式の標準偏差は、収益率を使用します。

株価だと、銘柄によって水準がバラバラなので比較が困難だからです。

株式の収益率\(R_{i,t}\)は、株価を\(P\)として以下のように求められます。

\[R_{i,t}=\frac{P_{i,t}-P_{i,t-1}}{P_{i,t-1}}\]

つまり、株価の変化量÷変化前の株価であり、これは「どれだけ増えたか/減ったか」を率で示しています。

標準偏差を求める

ここで、100万円を株式Aに投資した時の将来価値を考えます。この時の資産額は以下のように求められます。

\[\begin{aligned}
Asset_{t+1}
&= P_{A,t+1} \cdot (\overbrace{\frac{1M}{P_{A,t}}}^{\text{購入量}}) \\
\\
&= 1M \cdot (\overbrace{\frac{P_{A,t+1}}{P_{A,t}}}^{\text{収益の倍率}}) = 1M \cdot (1 +(\overbrace{ R_{A,t+1}}^{\text{収益率}}))
\end{aligned}\]

この数式からわかるように、収益の倍率は\(1+R\) として表され、資産の将来価値を求める際には、この倍率の形が便利になります。

このようにして、予想される収益率と、それぞれの発生確率から上述の手順を使って標準偏差を導出することになります。

参考文献

  • フランク・H・ナイト,2021『リスク、不確実性、利潤』(桂木隆夫,佐藤方宣,太子堂正称訳)筑摩書房.(原著:Risk, Uncertainty and Profit, 1921)
広告
最新情報をチェックしよう!