|
|
|
|
|
|
|
基礎の徹底 統計学
西山 茂 著
A5判 288頁
\3,360
|
|
|
本書の概要
本書は統計学の初学者を対象にしたテキストである。高校卒業程度の数学の知識があれば、本書の内容は楽に理解できるものと思われる。新しく目にする式があると思うが、これも大学初年次の授業で習うはずである。その種の式は飛ばしても差し支えはない。
また、本書では以下の点に配慮している。まず、基本的なことがらを確実に習得できるように説明を工夫している。次に、証明するべき結論を示すところでは、できるだけ証明を示している。最後に、統計学を勉強し始めてから、少なくとも学部の専門レベルないし統計分析を常用しない大学院初年次レベルまでは、参考書としての利用に耐えられるように努めている。特に、統計的なものの見方を身につける上で、「分布」という考え方が大変重要になる。専門家には当然のことであっても、統計学を初めて学ぶ人たちには「なぜこんな用語を覚えるのか」、「なぜこんな面倒なことを勉強するのか」という数多くの疑問を抱く箇所が統計学には多い。そのため手法を覚えるよりも、統計的な考え方を身に付ける、ということに重きをおいている。
構成
第1章 データの分布
統計学の特徴的な考え方は「全体として何がわかるか」という発想を常にとることである。実際に統計的手法を応用するのは、データが手元にあり、そのデータからいくつかの結論を引き出そうとする場合である。そんな時、統計学は1つ1つのデータの値に着目することはせず、データを全体として眺める時に、どんな特徴がデータ全体に認められるかという問題のとり上げ方をする。一口にいえば、統計的な結論とはデータ全体から引き出される結論のことであり、言い換えればデータ全体に当てはまっている平均的な傾向のことである。ある意味で『統計学は平均の科学である』と言っても過言ではない。本章では相当多数のデータが既に与えられている場合に、どのようにデータの特徴を要約すればよいか、引き出す価値のあるデータの特徴とは何かについて考察する。
第2章 確率分布
本章では、データの分布とは別の意味をもつ「確率分布」について述べる。データの分布とは度数分布である。この度数分布と確率分布の違いを正確に理解しておくことが統計学では大切である。本章では確率変数や確率分布など表面的には観察データと直接の関わりがないように感じられる概念が数多く導入される。しかし、統計学である以上は「分布」という視点から常に問題を見ていることに変わりはない。分布の特徴を「分布の中心」と「分布の広がり」、つまり平均と標準偏差という2つの特性値を通じて大まかに把握していく考え方は一貫しているのである。まずこの点を念頭においてほしい。本章から読み取ってほしいのは、「確率変数」や「確率分布」という考え方が統計学において果たしている役割である。
なお、本章でとりあげる確率分布は一変量の分布に限定している。複数の変数間の相互関係を考慮した確率分布については、第5章で他の関連する話題とともにとりあげている。
第3章 標本分布
本章では、特定の分布をもっている母集団から、ある変量について何個かのデータを無作為に抽出するとき、データの分布、特にデータから計算される標本平均や標本分散がどのような性質を有することになるかという問題をとりあげて考察する。本章の狙いは「データの分布」とも「確率分布」とも意味の異なる「標本分布」とはどのような分布なのかを理解してもらうことにある。標本分布論は統計学の基礎理論にあたるので、読者は次章に進む前に本章をよく理解しておくことが不可欠である。
第4章 統計的推測
統計学でとりあげられる具体的な問題としては、推定と検定があげられる。双方とも母集団分布の特徴を問うものである。母集団分布とは、「真の分布」つまり「確率分布」を指す。推定でも検定でも考える対象は母集団の分布である。したがって、本章全体を通して議論の主題となるのは、一貫して確率モデルの妥当性だと言える。要約すれば、実際にデータを集めて観察している母集団を「一定の分布型」が支配していると考えてもよいか、という問題である。「分布」という観点から物事を考察する統計学の中で、本章でとりあげる事柄は「実践編」の位置づけにある。
母集団の一部を観察して、母集団全体について知ろうという試みが本章のテーマである統計的推測である。したがって、推定でも検定でも得られる結論には誤りがつきものである。その誤りを最小にしようという目的が、双方の問題領域に共通する基本的立場となる。
第5章 変量間の関係
実際には複数の種類のデータが利用できる状況が普通であり、データ分析の目的も変量間の相互関係や因果関係の検出におかれることが多い。登場する確率変数が2つ以上になると「真の分布」は同時確率分布となる。本章では、まず同時確率分布について基本的なことがらを述べたあと、変量間の関係を分析する手法として回帰分析と分散分析をとりあげる。
回帰分析は複数の量的変量の相互関係を分析する場合には最も頻繁に利用される方法だが、変量に影響を与える因子として質的変量をとりあげることも多い。質的要因によって母集団を幾つかの層に区分して特定の変量の増減を分析する場合は分散分析の枠組みによったほうが見通しがよい。回帰分析のあと、分散分析への導入をはかることにしよう。 |
|
|
|