「サンプル調査の結果だからあてにならない」という人たち

統計学が最強の学問である
西内啓
ダイヤモンド社

ちょっと前にベストセラーになった本、今さらだけど読み中(まだ読み終わってない)。

ビッグデータ分析系サービスが流行っており、「統計学」というワードがバズっている昨今、この書名は、平積みになっていたらおおっ!と思わず手にとってしまうような、営業的にいい名前だ。

中世ヨーロッパのペスト対策において、様々な条件別に羅患率を調べた結果、水道会社が異なると羅患率が大幅に異なることが分かった。投薬したり患者を調べたりといった医学的なアプローチではなく、公衆衛生分野における統計学的なアプローチから、数万単位の人命を救うことが出来た。

大恐慌において、街に失業者が溢れつつも、当時は失業率を正確に把握する調査手法がなかった。そこで、サンプル調査を史上初めて実施して、正確な失業率を把握し、有意な政策立案に活用することが出来た。当時の経済学のオーソリティたちは、全数調査じゃないと意味が無いと言ってサンプル調査に対して否定的だったらしい。

というような史実を引いた上で、著者は、統計リテラシ(統計学をうまく扱うセンス)がいかに重要かということを説いている。反面、未だにサンプル調査に対して感覚的に「ランダムに抽出したサンプル調査なんて信用出来ない。全数調査しか信用するに値しない」という人が多過ぎるという現状を嘆いている。

(今のところ、読んだのはこの辺りまで)

 

私は永年、ネット業界でマーケティング、リサーチ領域の仕事をやってきたのだが、 世の中の平均的ビジネスマンの統計リテラシの低さにイラつかされることが多々あったので、大いに頷きながら読み進めている。

 

行政、政治分野においても、様々なアンケートやらの調査をやっている。そもそも選挙そのものが統計的にマスの意思を集約していく作業だし。

 

蕨市では、毎年、市民意識調査というのをやっている。
蕨市:市民意識調査(平成25年度調査結果を公表しました)

調査のやり方は、以下の様なもの。

・調査期間:平成25年8月
・調査対象:市内在住の満20歳以上の男女
・対象者数:1,000人
・抽出方法:住民基本台帳から各地区の年齢層別の人口比率に基づき、男女別に無作為抽出
・調査方法:行政連絡員による送付、郵便による回答
・回収率:35.5%(配布数1,000票のうち355票回収)

この手法は、よくあるもので、コストもそれなりにかかっている。
毎年同じ内容を調べて、トレンドを比較することに意味がある。

この「対象者:1,000人、回収率:35.5%」を取って、「こんなに回収率が低い調査結果は信用出来ない!」とか、「市民7.2万のうち、0.1万人を対象に行った調査はいいかげんだ!」とか「有効回答数355票のうち、蕨市に愛着を感じているという回答が256人ということは、72,000人-256人が蕨市に愛着を感じていない可能性がある」とか、無茶苦茶な暴論を耳にしたことがあり、その時はかなりうんざりした。

マーケティングとリサーチの領域は、長い学術的な研究に裏打ちされたサイエンスの世界である。感覚的に理解できないからといってこれを否定するのは間違っている愚かな態度だ。

私はネット業界でマーケティングとリサーチ領域の仕事をしていた(といっても、体系的に学んだ訳でもないし、言うならば膨大な研究成果のうちの上澄みをうまく利用させてもらってただけみたいなもんだけど)ので、統計的な成果物を感覚的に理解できないからといって否定するような発言を聞くと、自分の仕事が否定されているようにも感じて、残念で悲しい感じがします。