SSブログ

統計学が最強の学問である [C5.統計学]

統計学が最強の学問である

統計学が最強の学問である

  • 作者: 西内 啓
  • 出版社/メーカー: ダイヤモンド社
  • 発売日: 2013/01/25
  • メディア: 単行本(ソフトカバー)

.

一般化線形モデル(Generalized linear model)

toukeigaku02201.jpg

  The sexy job in the next ten years will be statisticians.と言われています。筆者は「ナイチンゲール的限界」を説いています。19世紀、ナイチンゲールの最も大きな業績の一つは、戦争中の死因の原因は、兵士の傷によるものよりも、その後の感染症によるものが圧倒的に多いことを明らかにし、清潔な病院を戦場に配備するように要求したことだそうです。そして、現代もこれくらいのデータ集計くらいしかしていないと統計リタラシーの低さを嘆いています。

統計学って、ちゃんと勉強してなかったですね。ちょっと、まとめておきましょう。

【標準偏差 Standard Deviation】

標準偏差 分散の正の平方根である。統計値や確率変数の散らばり具合(ばらつき)を表す数値のひとつであり、σ や s で表す。例えば、ある試験でクラス全員が同じ点数であった場合(すなわち全員が平均値であった場合)、データにはばらつきがないので、標準偏差と分散は0になる。

【正規分布】

確率論や統計学で用いられる正規分布(せいきぶんぷ、英語: normal distribution)またはガウス分布Gaussian distribution)とは、平均値の付近に集積するようなデータの分布を表した連続的な変数に関する確率分布である。中心極限定理により、独立な多数の因子の和として表される確率変数は正規分布に従う。このことにより正規分布は統計学や自然科学、社会科学の様々な場面で複雑な現象を簡単に表すモデルとして用いられている。たとえば実験における測定の誤差は正規分布に従って分布すると仮定され、不確かさの評価が計算されている。

【回帰分析 regression analysis

従属変数目的変数)と連続尺度の独立変数説明変数)の間に式を当てはめ、従属変数が説明変数によってどれくらい説明できるのかを定量的に分析することである。従属変数目的変数)とは、説明したい変数(注目している変数)を指す。独立変数説明変数)とは、これを説明するために用いられる変数のことである。経済学の例を挙げてみよう。経済全体の消費(C)を国民所得(Y)で説明する消費関数がC=a+cYという形で表されるとする。この例では、消費が従属変数、国民所得が説明変数に対応する。以下で述べる計算方法によってa,cといった係数の大きさを推計する。aを切片という。

【重回帰分析】

重回帰分析(じゅうかいきぶんせき)は、多変量解析の一つ。回帰分析の独立変数が複数になったもの。適切な変数を複数選択することで、計算しやすく誤差の少ない予測式を作ることができる。たとえば3つの独立変数がある場合、重回帰式はy = a + b1x1 + b2x2 + b3x3

【カイ二乗検定】

χ2検定とはある理論値を想定した時,実際の観測値がその理論値とほぼ一致しているかどうかを調べるための統計解析法のこと。

有意確率(p値);意味がある(意図的である)、すなわち、偶然とは考えにくい確率。検定において帰無仮説(無に帰したい仮説、すなわち、無しであるとしたい仮説)のもとで得られた統計量が実現する確率です。

【ロジスティック回帰分析 Logistic regression

ロジスティック回帰分析は発生確率を予測する手法です。基本的な考え方は線形回帰分析と同じなのですが、予測結果が 0 から 1 の間を取るように、数式やその前提に改良が加えられています。0 から 1 の間ということは、例えば 0.4 のような確率で予測を行うということになります。

2値ロジスティック回帰はダイレクトマーケティングでよく使われ、ある提案に反応する人々を特定するのに使われる(従属変数は「反応する=1」と「反応しない=0」である)。ダイレクトマーケティングの2値ロジスティック回帰モデルは「リフトチャート」を使って評価される。これは、過去のメールへの反応のデータとモデルによる予測結果を比較する。

【多変量解析 multivariate statistics】
 

多変量解析とは、複数の結果変数からなる多変量データを統計的に扱う手法。主成分分析、因子分析、クラスター分析などがある。

 

内容紹介

あえて断言しよう。あらゆる学問のなかで統計学が最強の学問であると。どんな権威やロジックも吹き飛ばして正解を導き出す統計学の影響は、現代社会で強まる一方である。「ビッグデータ」などの言葉が流行ることもそうした状況の現れだが、はたしてどれだけの人が、その本当の魅力とパワフルさを知っているだろうか。

本書では最新の事例と研究結果をもとに、基礎知識を押さえたうえで統計学の主要6分野
◎社会調査法
◎疫学・生物統計学
◎心理統計学
◎データマイニング
◎テキストマイニング
◎計量経済学
を横断的に解説するという、今までにない切り口で統計学の世界を案内する。

統計学によって得られる最善の道を使えば、お金を儲けることも、自分の知性を磨くことも、健康になることもずいぶんと楽になるだろう。だがそれはあくまで副産物である。統計リテラシーによって手に入る最も大きな価値は、自分の人生を自分がいつでも最善にコントロールできるという幸福な実感なのだ。
.
80 books in 2013

スポンサードリンク


nice!(1)  コメント(0)  トラックバック(0) 
共通テーマ:

nice! 1

コメント 0

コメントを書く

お名前:
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

Facebook コメント

トラックバック 0

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。