Hatena::ブログ(Diary)

柿の種中毒のStatistics入門 このページをアンテナに追加

 

2012-04-10

トップマネジメントの多様性は会社の業績を高める?

ビジネスの世界でも統計的な手法で色々な知見を見出すというのは良くあることだけれども、人事政策の分野でも使われている。ぼくが働いている会社でも、大規模な社員対象の意識調査をもとに色々なプランニングをしているそうな。さて、今週のMcKinsey Quarterlyには"Is there a payoff from top-team diversity?"というタイトルのちょっと面白い記事がある。

多様性が高いほど、異なるパースペクティブを取り込み、幅広い顧客ニーズに応えるより良い経営ができるというのは理論として納得がいくけれど、それを実証的に示そうとしたもの。彼らは2008-2010年の間でフランスアメリカドイツイギリスの企業を対象にしてトップマネジメント多様性と会社の業績に相関があるか調べた。定量的多様性をはかる指標としては、女性比率と外国人比率のふたつを用いている。外国人の比率を用いるのは経営陣の文化的バックグラウンド多様性をはかるためである。会社の財務指標としてはROEとEBIT(Earnings before interest and taxes) marginを用いている。

その結論はというと、『トップマネジメント多様性が高いほど、会社の業績は良い』。直感と整合するから何を今更という感もなくはないけれど、それをデータで示しているという意味では貴重だ。多様性の高い会社上位4分の1にはいる会社と下位4分の1の会社を比べると、多様性の高い会社のROEは53%ほど高く、EBIT marginは14%高い。できれば元データの二次元散布図をみたいところ、もしくはそれぞれのグループのROEとEBIT marginの分散の度合いを見て平均値の間に優位な差があるのかどうか細かく見てみたいけれども。

また回帰分析の結果、マネジメント多様性ROEの間のCoefficientは+9.89 *1とのこと。文字通り受け取ればマネジメント多様性が1単位あがるごとにROEは約10単位あがるということだけれども、マネジメント多様性の単位がはっきりとは書いてないのでその辺はいまいち良くわからない。まあそんな細かいことはともかく、多様性と業績に相関があるということそのものが示されているというのは面白い。


f:id:yocchi_gogo:20120415002907p:image
(引用: McKinsey Quarterly "Is there a payoff from top-team diversity?")


さて、では多様性と会社の業績の間に因果関係があるのかどうかというと、そこはまだ検証できていないとのこと。交絡要因としてはいろいろありうるだろうけれど、例えば「先進的な物事に取り組むinnovativeな企業ほど業績が良く、かつそういった会社は人事政策に関しても先進的である」なんてことはあるかもしれない。他にも企業の多国籍展開の度合いなんかをみてみると面白そうだ。また、トップマネジメントだけでなく、一般社員の多様性が業績に正の効果をもたらすのかどうなのかというところも興味深いね。

なお採用戦略やフレックス・ワーク制度、時短制度、育児サポートなどいろいろな制度的なサポートで働く女性を支援し、優秀な女性の維持に努めているいくつかの企業の事例も紹介されている。多様性というのは女性を増やす、外国人を増やすというだけに限らないけれども、まず隗より始めよという意味では取り組みやすいエリアだろう。多様性を戦略とするという会社も欧米ではたくさん出てきているようだけれども、日本の企業はどうなんだろうか。『多様性が戦略的な強みとなりうる』ということを認識して積極的にすすめている会社はそもそもどのくらいあるのだろう。こういう研究を日本企業を対象にやってみても面白そうである。
元記事はわずか3ページでさくっと読める。詳しくは下記より。
Explore our featured insights | McKinsey & Company

*1:1%有意水準

2012-03-12

最良の予言者は過去なり-1928年に80年先、2008年のアメリカのGDPを予測する

株の名言には『最良の予言者は過去なり』という言葉があるそうだ。予測の基本的なテクニックは過去のトレンドを読み(回帰分析)、その延長線上に未来予想図を描くことである。ただしこの作業は外挿なので、当然のごとく『過去になかった歴史的転換』によって過去のトレンドから外れていく可能性ももちろん否定できない。


過去にも『今までとは違う、全てを根本的に変えるイノベーション』という売り文句の新テクノロジーはたくさんあった。それらをマクロな視点から見ると本当に歴史を塗り替え、経済成長を桁違いに押し上げる事例は存在したのだろうか。大恐慌や戦争といった大きな出来事の前後で経済成長にはどのような影響があるのか。この疑問に対して、過去140年間のアメリカ合衆国GDPはどのように推移してきたのかを調べた面白い話を聞いた。INSEADのイリアン・ミホフ教授の研究である。結論から言うと、

  • 世界で最も先進的な国においては、経済は長期的にはコンスタントに年率1.85%のペースで成長する。
  • これはたゆみないイノベーションの成果ではある。ただし数多あるイノベーションも長期的に見ると成長率を1.85%以上には押し上げない。
  • 大恐慌によって一時的に経済成長がストップしたり、逆に戦争によって好景気に湧くことはあってもそれらは長期的なトレンドには影響しない。



その主張の根拠となるデータを見て行くと・・・1870年から1928年までのデータ*1をもとに直線回帰し、外挿によって2008年度の一人当たりGDPを求める。
f:id:yocchi_gogo:20120312232958p:image

これに対して実際の一人当たりGDPの推移。大恐慌とその後の世界大戦による大きな変動はあるものの、再び元の直線に戻っていき、なんと80年後の2008年の予測値と実績値の誤差は2%未満である。その他の年度に関してももとの直線の当てはめはかなり良いように見える。
f:id:yocchi_gogo:20120312235821p:image

オイルショック、コンピューターの発明、インターネットの発明などなど数多くの世紀の大発明や大事件がおこり、短期的にはGDPの成長率が1.85%を上回ったり下回ったりすることはあるものの、長期的には1.85%のトレンドラインに乗っているのだ。大恐慌や戦争による好景気でy軸切片が平行移動することさえなく、もとのトレンドラインに回帰していくというのはとても面白い。単純な回帰分析だけれども、すごくパワフルで面白い分析である。右肩上がり、というのは神話でも幻でもなく、現実なのだ。*2
f:id:yocchi_gogo:20120312235822p:image

一方日本の高度経済成長期やいまの中国のように年率二桁成長で経済が伸びている国だってある。教授によると、これは最先端の技術を開発するのではなく、応用*3したり同じものをより低コストで作ることが可能だからだそうだ。ひとつの傍証としてG7、中でも日本の経済が過去140年間どのような推移をしてきたのかをみる。最初は一人当たりGDPが低いためどんどんと成長していくものの、高い経済成長も次第に鈍化し最終的には年率1.85%のトレンドに収束していくのだそうな。この1.85%成長が『イノベーションフロンティア』であり、物真似ではなく自ら新しいイノベーションを生み出す段階に来た国々が成長できる最前線。
f:id:yocchi_gogo:20120312235823p:image

過去には日本が高度成長期の成長率を続ければアメリカをはるかに追い抜くという楽観的予測もあったらしいけれども、現実はそうではなかった。いま中国で暮らしていると日本の経済成長率の低さを『景気が悪いなあ』なんて思うけれども、それは日本の経済力が高くなったいま無理な望みというものだ。同時にイノベーションによって日本だって経済力をさらに高めて行くことができるというのはある意味希望でもある。
とはいえ過去数10年全く経済成長をしていない国だってある訳で、次なる疑問はじゃあなにがその要因なのかということだけれども、長くなったのでこの辺で。

なおデータの出所はすべて下記のリンクより。どちらもPDFファイルで一読の価値有り。
http://faculty.insead.edu/fatas/wall/wall.pdf
http://www.ceosummit-eede.gr/2010/files/eisigisi_mihov.pdf

また予測の基本的な話についてはこちらの大村先生の本がとてもわかりやすくて僕のような初学者にピッタリ。

予測のはなし―未来を読むテクニック

予測のはなし―未来を読むテクニック

*1:Y軸は一人当たりReal GDP対数である。経済成長は昨年比x%と指数関数的に増加するので、対数をとったほうが分かりやすい

*2リーマンショックはかなりの大きな事件だったけれども、これをこの先10年・20年のスパンで見るとどうなるのかも興味深い。

*3:もっとぶっちゃけて言うと真似る・パクる

2012-02-28

決定係数とはなにを決定しているのか

第三章の決定係数について。変数間の相関の強さを表す指標が相関係数r。その相関係数の二乗r^2は決定係数とも呼ばれる*1。さてこの決定係数r^2は一体何を『決定』しているのか。結論から言うと、決定係数r^2は二変数のデータ群(xi,yi)を直線で回帰した時に、説明変数xで従属変数yをどれくらい説明できるのか(=決定できるか)の指標である。回帰の当てはまり具合・回帰の効果を表すといってもよい。

一歩ステップバックして回帰直線を求めたやり方に戻る。(x1,y1), (x2,y2), ..., (xi,yi),....(xn,yn)というデータをy=ax+bという直線で回帰することを考えると、(ほとんどの場合)全てのデータが直線上にピッタリ乗ることはなく、直線と各データポイントとの間には差が残る(残差)。この残差の距離(の二乗和)を最小にするようなa, bを求めるのが最小二乗法による回帰だ。ここでmをyiの平均値とすると

残差平方和=(1-r^2)*Σ(yi-m)^2


が成り立つ。右辺のΣ(yi-m)^2というのは回帰する前の被説明変数yのバラツキを表していると考えてよい*2。一方左辺の残差平方和は回帰後の(回帰直線と元データの間の)バラツキを表している。つまり回帰後のバラツキは回帰前のバラツキの(1-r^2)倍になるということ。言い換えると、回帰によるバラツキの減少幅は回帰前のバラツキのr^2倍になるということに他ならない。
ここで-1<=r<=1だから0<=r^2<=1。つまりr=1の時に(1-r^2)=0となり、このとき残差平方和は0。つまり、全てのデータが回帰直線上に有り、yがxによって100%説明可能だということを意味する*3
f:id:yocchi_gogo:20120229002807p:image

一方r=0のときは(1-r^2)=1、(残差平方和)=(被説明変数の回帰前のバラツキ)となる。つまり求めた回帰直線では全くバラツキを減らせず、ax+bではyを説明できていないということ。例えば二次関数は左右対称な分布をしているために相関係数*4はゼロなのだけれども、エクセルで機械的に回帰直線を当てはめることはできてしまう。エクセルに計算させると傾き0、y切片がyの平均値の直線が最小二乗法で自動的に得られる*5。しかし、この回帰直線は全くもとのデータに当てはまらず、r^2=0である。なお回帰直線自体がyの平均値なのだから、残差(yi-m)の平方和が被説明変数の回帰前のバラツキと一致するのは当たり前である。回帰によってまったくバラツキを減らすことができないということはその回帰で得られた式が全く無意味ということ。
f:id:yocchi_gogo:20120228231525p:image

というわけで、r^2というのは回帰をした場合に回帰直線によってxがyの変動を何割説明しうるか(残りの部分はxでは説明しきれていない部分)を示す数字である。次の三つの場合をみると決定係数が高いものの方がyをxによって説明できていることは一目瞭然。
f:id:yocchi_gogo:20120229002806p:imagef:id:yocchi_gogo:20120228231526p:imagef:id:yocchi_gogo:20120228231527p:image


なお二次関数の例の場合、そもそも直線で回帰しようというのがおかしいわけで、多項式で回帰してみるとエクセルによれば決定係数=1となる。決定係数の概念を考えてみれば当たり前なのだけれども、ここでの決定係数は直線回帰の場合と違って相関係数の二乗の値ではありえない。このへんの数式の定義は要フォローアップ。
f:id:yocchi_gogo:20120229004225p:image

さて、そもそもなぜ角がこみの中の式が成り立つのかというのを理解しておきたいところ。とくに重要なのは『各yiとyの平均mの距離』をxiに対応する回帰直線上の点^yiで二分割しyi-m=(^y-m)+(yi-^y)として考えるところだ。はじめの項は回帰直線によって説明できる部分、次の項は回帰直線では説明できない残差となる。回帰直線の定義をもとに運算すると、右辺第一項と第二項の積和は0となることがわかる。そのためこの式を左辺を二乗して展開するとΣ(yi-m)^2=Σ(^y-m)^2+Σ(yi-^y)^2がなりたつ。左辺の『元のyのバラツキ』を右辺の『回帰直線で説明できるバラツキ』と、『回帰直線で説明できずに残ってしまうバラツキ』に分解できる。さらにこの式の第二項を回帰直線の定義を用いて運算すると角がこみの中の式にたどり着く。

さすがにTexを使わずmacで式を書き続けるのは辛いし、LaTexも大学以来この方全く触っていないのでそれも記憶の彼方である。他にとっても分かりやすいウェブサイトをいくつかみつけたので参考に。

決定係数の定義とその意味についてとても詳しい。図も豊富でわかりやすい。
決定係数とは,重相関係数,自由度調整済決定係数

エクセルを使って回帰分析をする手順。最小二乗法のイメージもつかみやすい。
回帰分析(1)

発展編。重回帰分析について。
(おまけ)重回帰分析

*1エクセルで散布図に回帰直線を当てはめた時にもグラフ中に表示することができる。

*2:データの個数で割っていないので正確には分散そのものではない。なので『バラツキ』としている

*3:なぜなら全てのyiはaxi+bで完全に説明できるので

*4:直線への当てはめを示す

*5:回帰直線の傾きaはr*Sy/Sxなので

2012-02-27

第4章 確率

第4章は統計から少し離れ、確率の基礎について概観。推測統計学においては、判断はそのデータが得られる確率に基づいて行われる。つまり、観察されたことがらが充分珍しい事象なのか、それとも偶然の範囲内なのかを確率論的に判断する。内容はかなり基本的だけれども、ラプラスの定理や頻度による確率の定義、ベイズの主観確率など少し哲学的なところにも触れている。
なお、コインの表が出る確率の相対頻度が0.5に収束していくシミュレーションの表が面白い。3回のシミュレーションの結果から10回程度の試行では表が出る確率は0.2~0.6程度まで散らばりがある。『次に』表が出る可能性が1/2であることは命題として立てられても、次に何が起こるかは確定的には予測できない。また少ない試行回数で表が半分でてくる、というのは根本的な誤解である。
以下12時から左回りにカバーされている内容の概略。


f:id:yocchi_gogo:20120227225852j:image

2012-02-26

第3章 2次元のデータ

二次元(以上)のデータ解析の特徴となるのはデータ間の関係。相関係数や回帰直線・回帰平面の考え方について。ピアソンの積率相関係数の分子の意味がすんなりと理解できる説明。また相関係数の二乗がなぜ決定係数と呼ばれるのか、その意味についても大変分かりやすく解説されている。
偏相関係数、決定係数、回帰による価格弾力性の推定については後日もう少し深入りする予定。

f:id:yocchi_gogo:20120227001735j:image

第2章 一次元のデータ

第二章は一次元のデータを対称に基礎的な概念と定義をカバー。数字(平均・最頻値・標準偏差)は厳密な計算結果ではあるが、ヒストグラムで視覚化することを怠ってはいけない。まったく異なる分布のパターンからも同じ代表値が出てきうる。たとえば(1,1,1,2,10)と(3,3,3,3,3)では平均値は同じだが分布の形状は全く異なる。Mean, Mode, Medianにはそれぞれ特徴があるのでその三つが大きく異なる場合分布を確認する。


f:id:yocchi_gogo:20120226222714j:image

 
プロフィール

yocchi_gogo

yocchi_gogo

理学部・理学系大学院を出た後、外資系企業に就職。コーポレート・ファイナンス/コーポレート・ストラテジーを飯の種とする。統計学再入門中。

カテゴリー
最近のコメント