科学隊

ささやかな科学と哲学のバトンを渡すための情報交換の場所です。

<a href="http://secret.ameba.jp/frederic-chopin/amemberentry-11853408221.html">『統計でウソをつく法 / ダレル・ハフ』を読了</a>

-----------------------------------------------------

第1章 かたよりはサンプルにつき物

――1924年度のエール大学卒業生の年間平均所得は、2万5111ドルである――

ここで、次のことがよくわかる。つまり、このサンプルには平均所得を最も低くしそうなこの二つのグループがはいっていなかったのである。

この数字が真実であるのは、1924年度卒業生のうちでも住所がわかっていて、しかも所得がいくらかをよろこんで教えてくれた特別な人たちについてだけなのだ。もっとも、それも、紳士はウソはいわないと仮定した上での話なのだが。

――平均的アメリカ人は、一日に1.02回歯を磨いている――

という記事を読んだら、こう自問するがよい。どうしてこんなことがわかったのか?と。

「歯を磨いた回数」は容易にアンケートによる調査だとわかる。

サンプリング調査の結果が、もとになるサンプルより正しくないことも事実なのであるが、データが何回も統計的操作で濾過され、小数点のついた平均値に姿を変える頃には、その結果はもとのデータとは似ても似つかないような確信の香気を身につけ始めるのである。

サンプルの基礎には"ランダム"という性質がなければならない。つまり、サンプルは"母集団"からまったく偶然に選ばなければならない。

ある女性面接者が、世論調査をするのに、「駅にはあらゆる人たちがいる」から、自分は駅で質問をしようといっていた。しかし、たとえば、小さい子供をつれた母親などは、駅ではつかまえられないことを彼女には教えてやるべきである。

ランダム・サンプルであるかどうかの判定は次のようになされる。「母集団の中のすべての人あるいは物は、等しくサンプルに選ばれるチャンスがあるか?」

世論調査というのは、結局は、かたよりの原因に対する不断の戦いということになってくる。

こういった調査結果を読む場合におぼえておかなければならないことは、この戦いには絶対勝てないということである。

何かあることに「67%のアメリカ人が反対」しているといった結論も、その67%というのは、どういったアメリカ人か、といった疑問をたえず抱きながら読むべきである。

どういう人で面接調査団を構成するかによっても、調査結果が変わってくるというのは興味のある事実だ。戦争中のことであるが、米世論研究センターが南部の都市に二つの調査団をだして、500人の黒人に三つの質問をさせたことがある。調査団の一方は白人で、もう一方は黒人で構成された。

質問の一つは「もし日本がアメリカを占領したら、黒人に対する差別は今より少なくなると思うかどうか?」というものであった。黒人の調査団は、質問したうちの9%の人たちが「少なくなる」と答えたと報告しているが、白人の調査団によると、そういう答えはたった2%であった。

最もかんがられそうな要因というのは、相手をよろこばせるような答えをしたいという欲求であって、この傾向は、世論調査の結果を読むとき、常に考えておかなければならないことである。

-----------------------------------------------------

第2章 "平均"でだます法

この辺に住む人たちの年間平均所得は?1万5000ドルである。3500ドルである。

この場合、どちらの数字がウソかを指摘することはできないのであって、これが統計を使ってウソをつく極意なのだ。これらの数字は両方とも間違いのない平均値なのであり、ちゃんとした計算方法によってえられたものである。両方とも同じ人数と同じ所得のデータを代表しているのである。

とはいっても、このうちどちらか一方が真っ赤なウソと同じように人を誤解させるに違いないということもまた、明らかなのである。

この場合のトリックは、"平均"という言葉の意味が、非常にルーズなのを利用して、種類の異なった平均を使いわけたことである。

ある数字が平均値であると聞いても、それがどういった種類の平均値――いわゆる平均値(算術平均)、中央値(中位数)、最頻値(並み数)のうちのどれ――であるかがわからなければ、あまり意味がないのだ。

さて、大きい平均値が必要であったときに使った1万5000ドルという数字は、いわゆる平均値であって、その近所の全世帯の所得の算術平均である。それは、全世帯の所得を足して、その和を世帯数で割ればえられる。

もう一方の小さい方の数字は中央値であって、全世帯の半分が3500ドル以上の所得で、あとはんぶんの世帯が3500ドル以下の所得であることを示している。もっとも、このばには最頻値を使ってもよかったのである。最頻値とはデータの中に一番よくでてくる数字のことである。

もし、この近所で、年収5000ドルの家庭が一番多ければ、年収5000ドルという数字が最頻値である。

人間の体位に関するデータの場合は、それぞれの平均値が一カ所に寄ってくることがわかる。そして、正規分布とよばれる美しい曲線に近くなる。その曲線をかくと、つりがねのような形になり、算術平均も中央値も最頻値も同じ点になる。

平均で目かくし

会社の重役や事業主が、自分の会社の従業員の平均給与はこんなに高いと発表しても、その数字は意味があるかもしれないが、ないかもしれないのである。

しかし、その平均が中央値なら、重要なことがわかる。つまり、従業員の半数の給料はその平均より高いが、あとの半数はそれより低い給料である。しかし、平均値なら、事業主一人の給料とたくさんの従業員の安い給料を平均したものというより以上のことは何もわからないのであろう。これでは「年間平均給料5万7000ドル」という数字が、2000ドルの給料と、ずば抜けて高い事業主の給料との両方を目につかないように隠していることになる。

$45,000 1人 / $15,000 1人 /$10,000 2人 / 算術平均 $5,700 / $5,000 3人 / $3,700 4人 / $3,000 1人 = 中央値(全体のちょうど真ん中に位置する。彼より低い給料が12人、高い給料が12人) / $2,000 12人 = 最頻値(この額の給料が最も多い)

算術平均と中央値と最頻値とはこんなに違っている。

平均賃金の数字を見たら、まず、質問することであるーー平均の種類は? その数字に含まれている人は? と。

-----------------------------------------------------

「今すぐわかります。お子さんの身長はどれだけ高くなるでしょう」

この記事には、二枚の図表が派手にあしらわれていて、一枚は男子用、もう一枚は女子用で、それには、年齢毎にどれだけ高くなるかが示されている。図の説明には「お子さんが成長した時の身長を求めるには、図表で現在の身長のところをみなさい」とある。

子供がすべて同じように成長するわけはないのである。初めのうちはおそくても、急に早く成長する子もいれば、しばらくの間急に伸びたかと思うと、ゆっくりになる子もいるし、成長ぶりが比較的一本調子である子もいるのである。

この図表は多数の子の測定値からはじきだされた平均をもとにしているのである。だから、たくさんの子供の平均身長としては十分に正確であることは疑いないのだが、親には一度に一人の身長だけしか測れないのであるから、そのためには、このような図表は事実上価値がないのである。

-----------------------------------------------------

確率誤差

今、畑の大きさを歩いた歩数で測るものとしよう。その時、まず最初にすべきことは、100メートルの長さのところを何回も何回も歩いて、歩測の正確さを調べることである。平均すると、プラス・マイナス3メートルはずれることがわかるとする。ということはすなわち、試みた回数の半分は3メートル以内の誤差でおさまり、あとの半分は3メートル以上違ったということである。

この時の確率誤差は100メートルのうち3メートルで3%になる。このことから、歩測で100メートルあった長さは、実際には100±3メートルとも書けるのである。

IQやサンプリングでえられた数字はデータの分布幅(範囲)の中で考えなければならないということである。"標準"というのは100ではなく、たとえば90から110までの範囲であり、そうすれば、この範囲内の子供をこれより下あるいは上にいる子供と比較することも意味があるだろう。しかし、わずかな差しかない数時同士を比較しても意味はない。このプラス・マイナスの誤差ということは、いつも心にとめておかなければならないことで、誤差が書いていないときでも、あるいは書いていなければなおさらのこと、注意しなければならない。

一団の研究者たちに銘柄の違う数種類のたばこの煙を分析させることになった。その雑誌で明らかにされ、かつ、くわしい数字によって裏づけられた結論というのは、どんな銘柄でも結局は同じものであり、どの銘柄のたばこをすっても違いはないということであった。

さて、この結果が、たばこ会社や新しいねらいで宣伝文を考えだそうとしていた宣伝マンにとって、打撃となったことは想像にかたくない。のどにやわらかで気管支を傷めないといった広告などは、すべて信用を失うかにみえた。

ところがである。あることに目をつけた者がいた。すなわち、結果の表で毒物含有量がほとんど同じであるといっても、その量が最も少ないたばこがあるはずだ、ということである。そして、そのたばこが「オールド・ゴールド」だったのだ。

――全国的なこの大雑誌でテストされたすべてのたばこのうち、煙に含まれる有毒物が最も少なかったのは「オールド・ゴールド」でした――

その差が無視しうるものであることを示す数字やヒントなどには、これっぽっちもふれられなかったのである。

-----------------------------------------------------

第5章 びっくりグラフ

せっかくだまし方をおぼえ始めたのだから、グラフの端をカットするだけでやめる手はない。これとはくらべものにならないくらい効果のあるトリックがあるのだから。そして、それを使えば、10%という控え目な上昇でも100%に匹敵するくらいの迫力を持たせることができるのである。

これは、ただ、タテ軸とヨコ軸との比率を変えればよいのである。これに対する制約など何もないし、これを使えばグラフはずっとすっきりする。

これは、「国民所得の10%の増加」というのを「……10%の飛躍的伸び」とする編集方法と同じようなものである。しかし、それより断然効果的である。なぜならグラフには形容詞や副詞がないので、客観性という幻影がこわされることがないからである。

-----------------------------------------------------

第7章は特に面白かった。

第7章 こじつけた数字

もし、証明したいと思うことが証明できなくても、何かほかのことを論証して、両方とも同じことなのだと見せかければよいのである。

諸君のこしらえた妙薬がカゼにきくという証明ができなくても、その薬の半オンスで、11秒間に、試験管の中の細菌を3万1108個殺すことができたという、しっかりした研究報告を大きな活字で印刷して発表することはできるのである。

試験管の中では具合よく働いてくれた防腐剤も、人間ののどには、それも処方箋に従って、のどを焼かないように薄めた後ではなおさらのこと、効かないかもしれないなどということを、どうして進んでいう必要があろう?また、殺した細菌の種類が何々であるなどといって、問題を混乱させてもいけないのである。だいたい、カゼをひきおこす細菌がどんな種類のものかを知っている人などいるだろうか?ことによったら、原因は細菌などではないかもしれないのだから、なおさらである。

そこで明らかになったことは、黒人を、ものすごく毛嫌いしている白人ほど、黒人の就職の機会は白人と同じようにあると答える傾向が強かったのだ。

最近一年間の汽車による死者は、4712人であるという記事があった。これは、汽車に見切りをつけさせて、そのかわりに自動車に固執させるには都合のよい口実となるだろう。しかし、この数字が表していることを調べると、まったく違った意味であることがわかる。

この場合、犠牲者のほぼ半数は、踏切で汽車と衝突した自動車に乗っていた人たちであったし、残りの半分は大方は線路上にいた人たちであった。汽車に乗っていて死んだのは4712人中たった132人にすぎなかったのである。

しかし、この数字でさえ、他の乗り物の死亡者数と比較するのにほとんど価値がない。そのためには、総人・マイル数についてのデータが必要なのである。

米西戦争の間、米海軍の死亡率は1000人につき9人であった。一方、同期間のニューヨーク市における死亡率は、1000人につき16人であった。さて、米海軍の徴募官たちは、最近、この数字を使って、海軍に入隊した方が安全だと宣伝していた。

この二つの死亡率はそもそも、比較できるようなものではないのである。というのは、海軍は大部分が太鼓判つきの健康な青年たちから成っているのに、ニューヨーク市民の中には赤ん坊もいれば、年寄りや病人もいるのであって、どこにいようと当然死亡率は高いのであるから。

ポリオが大流行した1952年という年は、医学史上でも最悪の年であったという暗い話を聞かれたことがあるかもしれない。

ところがである。専門家たちが患者の数字を追求していってみると、実際はそれほどでもなかったという事実が二、三明らかになった。

その一つは、1952年には、この病気にかかりやすい年齢の子供たちが非常に多かったために、罹病率は例年並みであったにもかかわらず、患者数は記録的な数字にならざるをえなかったということである。もう一つは、ポリオに対する一般の認識が高まったために、医者に診断してもらう回数がふえ、したがって、軽症患者も記録されるようになったということである。最後にポリオ保険が増額されたり、小児マヒ全国基金からの援助額がふえるなど、財政的な刺激要因があったことである。

-----------------------------------------------------

最も油断のならないのは、非常によくある例で、変量のどちらもお互いに影響がないにもかかわらず、相関関係は実際にあるという場合である。多くのペテンがこういうのを利用しているのである。

以前に、ある医学関係の記事が、大変おどろいた様子で牛乳を飲む人たちの間にガンがふえていると指摘していたことがあった。ガンが、ニューイングランドミネソタウィスコンシンの各州とスイスといった、牛乳をたくさん生産し、消費している所では頻繁に現れているのに、牛乳の少ないセイロンでは、以前としてまれにしか発見されないということらしい。

その証拠として指摘されたのは、南部の諸州のように牛乳消費量の少ないところでは、ガンはそれほど多くないということである。同じく、牛乳を飲む英国婦人は、めったに飲まない日本の婦人より、18倍も多くガンにかかっていると書いてあったのである。

ガンというのは中年以後になると断然かかりやすい病気なのである。そして、始めにあげたスイスやアメリカの諸州の人たちは、いずれも比較的寿命が長いのだ。また、調査時における英国婦人の年齢は、日本の婦人よりも平均12歳高かったのである。

二つの事柄がともに変化する時に、そこにはかならず原因と結果があるに違いないと考えるのが、いかに愚かなことであるか。

もし誰かが、相関関係で大騒ぎをしていたら、何よりもまず、事件の経過、時代の傾向によって起こった、このタイプの相関ではないかと調べてみることだ。今日では、次のような事柄のどの二つをとってみても、その間にプラスの相関関係を認めることは容易にできるのである。

それらはすなわち、大学生の数、精神病院の収容者数、タバコの消費量、心臓病患者数、X線装置の使用台数、義歯の生産量、カリフォルニア州の学校教師の給料、ネバダの賭博場の儲け

-----------------------------------------------------

――現在、当地では不況がますます深刻になってきている。インディアナポリスの建設労働組合に加入している鉛管工、左官、大工、塗装工などの賃金は5%増額になったが、それは昨年冬の20%の賃金カット分の4分の1が復活したにすぎない。――

ちょっとみると、いかにももっともらしい。が、しかし、この引き下げ率は以前の賃金ベースーーつまり、労働者が最初にもらっていた賃金のベースーーにもとづいて計算されたものであり、賃上げ率はもっと低いベース、すなわち、引き下げ後の賃金ベースを基礎に計算したものなのだ。

話を簡単にするために、もとの賃金は一時間一ドルと仮定して、このおかしな統計的誤りを検討してみよう。一ドルの賃金を、20%切り下げると、80セントになる。その5%の賃上げは4セントであり、こらはカット分20せんとの四分の一ではやぬ、五分の一である。

50%の賃金引下げを相殺するためには、100%の賃上げを獲得しなければならないのである。

パーセンテージというものが、まるでリンゴでも数えるように、自由に合計できるとする誰でもよくやる間違った考え方が、著作者たちを不利にするようにも使われている。「ニューヨーク・タイムズ・ブックレビュー」からとった次の一文が、いかに本当らしく聞こえるかをみてみよう。

――書籍の価格は値上がりしているのに著者の儲けは少しもふえない理由は、本質的には、本の制作費と原材料が上昇しているためであるらしい。それを細目についていうと、設備と生産費だけで過去十年間に10から12%上昇し、原料は6~9%、販売、広告費は10%上がっている。これら上がったものの合計は(ある出版社の場合)最低33%に達しており、それより小規模の出版社では40%近くも上昇しているところがある。――

実際は、もしこの本を出版する費用の各項目がどれも、それぞれ10%前後上昇しているとしたら、その総費用もまた、同じ率だけ上がっているのでなければおかしい。

もう一つだまされやすいのは、パーセンテージとパーセンテージ・ポイントとが混同されてしまう場合である。もし、ある年に投資額の3%の利潤があったのが、次の年にはそれが6%になったという場合には、利潤が3%ポイント増加したといえば、非常に控えめな印象を与えることができる。しかし、それを100%の増加といっても一向に差しつかえないのである。

-----------------------------------------------------

第10章 統計のウソを見破る五つのカギ

1 誰がそういっているのか? (統計の出所に注意)

賃金を問題にしているのは、労働者側か経営者側か。

2 どういう方法でわかったのか? (調査方法に注意)

この新聞がはじめに1200の大会社に質問紙を送ったことがわかっている。ところが回答があったのは、たった14%にすぎなかった。

回答のあった全体の14%の会社だけがサンプルなのでは、ゆがみがあるのではないかと疑われても仕方がないというものだ。

3 足りないデータはないか? (隠されている資料に注意)

どこまで信頼できるかという数字(確率誤差、標準語差)がない相関関係も、あまり信頼できない。

算術平均と中央値が実際には異なっていると考えられる場合には、そのどちらなのかを明記していない平均値には注意しなければいけない。

他の数字との比較がなければ、意味のない数字というのはたくさんある。

ときには、パーセンテージはでているが、そのもとになった数字のないことがある。これもペテンである。

4 いっていることが違ってやしないか? (問題のすりかえに注意)

ある病気の患者がたくさん報告されるからといって、かならずしもその病気の患者がふえたことにはならない。

ネットでよく目にする「ある国では性犯罪が日本の○○倍!」などという数字も眉唾ものだ。

-----------------------------------------------------

サンプル・計算式などの過程が示されていない、結果だけの統計がいかに信用できないか、ということがよくわかる。