22.統計のお話し
前回のブログでは“勇気”を持つことの素晴らしさについてお話しさせて頂きましたが、これは無鉄砲に事を進めることを推奨していたわけではありません。勇気を持った決断の裏には緻密な分析があるわけです。その緻密な分析において、我々を助けてくれるToolとして統計的手法があります。本日は、細かい数学的な話は専門家に譲り、統計的手法を活用する上での基本的なポイントに絞りお話しさせて頂きます。
統計の適用範囲は様々ですが、企業経営における主たる利用目的の一つとして、“市場の理解”が挙げられます。限られた顧客/見込み客から得たサンプルデータから母集団(市場)を予測して、次なる有効な手段の投入方針を決める訳です。最近はインターネットが広がっているおかげでA/B Test等で簡単にユーザーの行動データを取得する事ができるようになっています。また、簡単に使えるBI Toolも普及しているので様々なデータを集めることはできますが、基本的な統計の”いろは”を心得ていないと間違った判断をしてしまいます。間違った判断をしないための分析のステップは以下の通りとなります。
1.母集団の定義
2.母集団の再定義
3.相関関係のある要素の洗い出し
4.因果関係の解明
5.手段の適用
それでは1つずつ進めてまいります。
1.母集団の定義
母集団とは、前述の通り予想する対象です。もし皆さんの会社が日本の全女性を対象にした商売をしているのだとしたら母集団は日本の全女性(約6,000万人)ということになります。全員にアンケートを取って趣向を調査することはできないので、サンプルを絞って調査し、そこから全体を予想する事が統計的アプローチという事になります。
ここで知っておくべきことは、対象となる母集団のサイズによって、それを予想する為の適切なサンプルのサイズも統計的に決まっていることです。このサイズの計算の方法は統計の専門家に聞けばわかりますので、適切なサンプルサイズ以上のデータを取得しないと意味が無いという事を理解しておけば十分です。参考までに母集団サイズと必要となるサンプルサイズの一覧を載せておきます。
母集団サイズと適切なサンプルサイズの関係:
簡単に言いますと、皆さんのビジネスの対象となる市場のサイズが、前述の通り日本の全女性だとすると、これは1,000,000人以上の母集団です。この場合、上記の表に従えば384人の日本人女性をサンプルとして調査して得られる傾向と、日本人女性全員を調査して得られる傾向は95%の確立で一致するという事です。より正確な定義についてご興味のある方は専門書をご覧になってください。
まとめますと、ポイントは以下の通りです。
・知りたい母集団(市場)は何かを明確にする
・知りたい母集団(市場)の規模を明確にする
・その母集団(市場)を予測する為に必要なサンプル数を確認する
・調査の実施
2.母集団の再定義
調査を実施して次にやる事は、取得したデータをグラフ化して全体の傾向をつかみます。この時のポイントは、このグラフが正規分布しているか否かを確認する事です。
例えば皆様がカレー屋さんであり、1辛~9辛のメニューの内、最も売れる3つのメニューに絞りたいとしたとき、調査の結果が以下の通りだったとします。
このように平均値(5辛)を中心にほぼ左右対称に山なりのグラフが描ける状態を正規分布していると言います。前項目で触れたサンプル数が満たされていれば、メニューは4辛~6辛に絞ってもよさそうだ・・・と判断できるわけです。
ところが、グラフの形が以下のようであった場合はどうでしょうか?
このグラフは正規分布しているとは言えませんよね。この場合は、調査の対象の中に違う特性を持ったグループが混在していると疑うべきです。細かく調べたところ、通説では若い女性には辛めのカレーがダイエット効果があると言われていて、中年以上の女性には辛いカレーは健康を害するという分かりました。そこで改めて中年以上と若者に分けて再調査すると各々のグラフは正規分布しました。つまり、カレーの好みという観点では異なる特性を持つ2つのグループ(市場)が存在していたという事です。このように想定する母集団をカテゴライズする事をマーケティングではセグメンテーションと呼びます。
3.相関関係のある要素の洗い出し
相関とは、ある2つの要素AとBにおいて、Aが増えるとBも増える傾向にあるときこれをAとBは正の相関関係があると言います。またAが増えるとBは減る傾向にあるときはAとBは負の相関関係があると言います。例えば以下のような状態は、1日当たりの労働時間と1月当たりのカレーを食べる頻度は負の相関があると言えます。
正確には相関係数という値を計算し、統計的に相関があると言えるか否かを検証しますが、それは統計に詳しい人に任せればよい話です。
ポイントとしては、以下の通りです。
・強化したい要素(カレーの販売量)と関連しそうな要素の洗い出し
・各要素とカレーの摂取量の相関関係の有無の分析
・相関関係のある要素の絞り込み
4.因果関係の解明
ここでは、相関関係がある2つの要素が原因と結果の関係にあるか否かを解明します。相関関係だけを見て方針を決めてしまうと間違った判断を取ってしまいますので、因果関係の解明は統計的アプローチの上で非常に重要なポイントです。例えば上記の相関の例では、「労働時間が短い人に注目しよう」というのは短絡的すぎますよね。誤った判断をしないために重要なポイントは起こっている事象(結果)に対する原因の究明です。
先ほどのカレーの例では、労働時間が長い人は遅い時間に夕食を取りがちだが、そもそも遅い時間にカレー店が開いていない。その為相対的に労働時間が短い人のカレー摂取量が多いように見えた。。。ということが事実かもしれない訳です。因果関係の解明では、このようなことを検証していきます。
本当の因果関係がある要素を見出すためには、様々なパターンの分析が必要になります。例えば、ライフスタイルとカレーの摂取量には関係があるとの仮説の元、そのライフスタイルに合った様々なキャンペーンを打つべく分析を開始する際には、関係する要素として、給与水準、独身/既婚、通勤時間、etcを洗出し各々に対して相関の有無を見出し、相関がある要素に共通する項目等を見つけるなどの分析を通して因果関係を解明をしていきます。この際に分析のパターンを絞り込むための手法として実験計画法というものがあります。これについても詳しくは専門家に譲りますが、ここでは、効率よく正しい判断を導きだすために必要な事として、
・考えうる要素の洗い出し
・期待する結果が、想定される理由から論証できることの確認
・分析パターン数を節約する手法として実験計画法というものがある
があるという事を知っておけば良いと思います。
ここで、世に知られている通説と実際の因果関係が大きく異なっていた面白い例を紹介したいと思います。なお、この例はスティーヴン・D・レヴィットの著書「ヤバい経済学」からの引用です。
※出典:ヤバい経済学 東洋経済新報社/著者:スティーヴン・D・レヴィット スティーヴン・J・ダブナー
多くの読者の皆さんは、
“1990年代初頭にニューヨークの凶悪犯罪が急減し、これはジュリアーニ市長による壁への落書きなどを禁止する、徹底した軽犯罪防止による効果だった。”
という話を耳にしたことがあると思います。これは当時「割れ窓理論」という、軽微な犯罪も徹底的に取り締まることで、凶悪犯罪を含めた犯罪を抑止できるとする環境犯罪学上の理論を適用したものだとして、その効果はもてはやされました。
しかし、ヤバい経済学の著者は、これについての因果関係は証明されないとして、徹底的に調査し、驚くべき事実に達しました。
米国はキリスト教の国ですから、妊娠中絶に対しては長く認められていなかったのですが、1960年代後半に一部の州で、中絶を認める判決が出ました。これを凡例として、各州も中絶を認める判決が相次ぎ、ニューヨーク州も1970年代には合法化し、1980年代にはかなりの数の女性が中絶を受けたと報告されています。
一方で、著者は米国の凶悪犯罪の多くはティーンエィージャーによって実行されていることを突き止めました。
さらに詳細な統計的分析の結果、著者が導き出した結論はこうです。
ニューヨークにおける多くの凶悪犯罪(殺人・強盗)は、ティーンエイジャーによって実行されている。そして、それらのティーンエィジャーは親の愛情を受けておらず、当然適切な教育も受けていない。養ってくれる人もいない。つまり生きていく手段として凶悪犯罪に手を染める比率が高い。こういったティーンエィジャーの多くは、その親がティーンエィジャーのころに求められずして産み落とされた子供たちだった。
当時の親もティーンエィジャーであり、生活力もありませんから、自分が生きていくだけで精いっぱいなわけです。
ところが、中絶が広く認められるようになった1980年代に、こういった求められずして生まれる子供達が激減しました。この時にもし産み落とされた子供がいた場合、この子が凶悪犯罪に手を染めるティーンエィジャーになるのは1990年代です。
つまり、凶悪犯罪実行犯を構成する多くの、求められずして生まれ育ったティーンエィジャーそのものがいなくなり、結果として凶悪犯罪数が激減したという事です。軽犯罪は、たいして罪の意識もなく実行されるもので、その延長線上に凶悪犯罪があるわけではなく、凶悪犯罪は、それに手を染める以外の選択肢が無いという強烈な理由によって引き起こされていたという事でしょう。
興味深い分析ですよね!
因果関係を正しく解明しないと、全く違った判断をしてしまうかもしれないという例として挙げさせて頂きました。
まとめ:
いかがでしょうか?改めて統計的分析をする際のポイントをまとめさせて頂きますと、以下のようになります。
・知りたい母集団(市場)の定義を明確にする
・母集団のサイズによりサンプルのサイズを決める。
・調査の結果が正規分布しているかを確認し、複数の母集団が混在していないかを判断する。
・正規分布していなければ、対象を層別して再度調査し、正規分布する母集団を再定義する。
・影響を及ぼしたい要素(例:カレーの売上)に関係があると思われる要素を洗出し、相関関係の有無を分析する。(分析パタンの節約には実験計画法も利用する)
・因果関係を証明し、アクションを考える。
これら一連の作業は、皆さんが経営層の方の場合、ご自身で実施する必要はなく、アサインした担当者、外部の専門家からの報告を受けたときに上記のポイントが抑えられているかを確認する事ができれば、誤った経営判断をすることは避けられるでしょう。
しかし、いくつになっても勉強すべきことが山積みですね。ただ、責任ある立場に立つと不勉強であることが罪であると言われかねません。次回はこれについて考えていきたいと思います。