ごちゃまぜ統計入門

第1章:視聴率?何それ食べられるの?

5.100%断言することは不可能

まず興味の対象とする人や物の集団(たとえば関東エリアの世帯)を母集団と呼ぶとして、その母集団と関係する数値を母集団特性値とする。この数値は母集団全てを調べる全数調査をすればどうにかわかるけれども、そんなことしているのは国勢調査ぐらいで、通常じゃあ、手間暇や、何よりコストがかかりすぎて現実的じゃなくて無理。

でも、母集団についての情報がないのに、母集団特性を語っちゃうのは、ただのヤマ勘でしかない。そこで、母集団を代表すると考えられる一部分を抽出して、調査実験を行う事を考えるのだ。なお、この取り出された一部分を標本と呼び、母集団から標本を抽出することを、標本抽出または、サンプリングという。ハマータイム。

標本は、ただの人や物の集まりなのでそれ自体はどうということはない。そこで、標本に対して行った調査・実験の結果を数値(例えば、)にまとめあげることで、標本からの情報抽出を行うのだ。ここで得られた数値を標本特性値という。

ここで、知りたい母集団特性値に応じて、その推測に役立つ標本特性値にまとめあげる必要がある。例えば、真の視聴率pが知りたい場合に、ある世帯のトイレの紙はシングルロールかダブルロールかを知ってもpに対する情報は得られない。この場合には注目している番組を見ていたか否かを調査して、標本の中でその番組を見ていた世帯の割合を求めることが必要である。

次のステップは、標本特性値(例えば、)を用いて母集団特性値(p)に対する知見を得ることである。このためには統計学の理論を活用する必要があるけれども、これは、余裕があればいつか説明する。っていうか、多分やらないから、本を買え。

ここで重要なことは「オイラは母集団全てを調べたわけじゃない。その一部のみを調べた結果に基づいて、母集団全てに関わる数値に対して推測を行っている。だから、100%断言することは不可能。だから、相当程度に確からしいことが保証できるような主張を行うことで満足しないとダメなのよ」という点である。

例えば、視聴率の場合には、100回中95回はpを含むような範囲を求めることで満足しなければならなかったことを、たまには思い出してあげてください。

(2009年8月2日更新 ver1.0)


解説


  • 前の章へ
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 次の章へ

広告や補足のエリア

  • やさしい統計入門 (ブルーバックス)
  • ザ・ヒッツ