けいしゅけって誰?プロフィール公開!!

区間推定ってなんだろう?信頼区間、信頼度、有意水準って何ですか?AHEADMAP関東支部#7

AHEADMAP関東支部ツイキャス

まいど!けいしゅけ(@keisyukeblog)です☆

ツイキャスのテーマで扱った論文の結果はもちろん、参加した感想をレビューします!

今回使われたスライドはYouTubeにアップされています。


けいしゅけ

このスライド最高やね☆

では、ツイキャスの内容をレビュー&これをキッカケに勉強した内容をまとめていくでっ!!

タコちゅけ

よろしくお願いしましゅ!!

*ちなみに、以下の動画もとってもわかりやすく、今回のツイキャスの内容を理解するのに役に立つと思われるので貼っておきます☆


AHEADMAP村のリンゴ収穫量から統計学を学的に出してみる!!

例えば、100個の地区から成るAHEADMAP村で収穫できるリンゴの数予測したいと思ったとき、どうすればいいでしょうか。

母集団と抽出と標本って何ですか?

タコちゅけ

過去のAHEADMAP村のリンゴ収穫量を調べることができるならば、予測しやすそうでしゅね。

けいしゅけ

せやね。

AHEADMAP村のリンゴ収穫量はどれくらいか予測するならば、例年の数量を調べることが手っ取り早いし間違いなさそうや。

統計学の用語に変えると、100個の地区から成るAHEADMAP村におけるリンゴ収穫量=母集団(Xと言うねん。

母集団(X)は地区(1)のリンゴ収穫量をX、地区(2)のリンゴ収穫量をX、⋯地区(100)のリンゴ収穫量をX100をすべて足したものやね。つまり、 X=X+X+⋯+X100  や。

1地区あたりどれくらい収穫できるかを計算するなら、母集団を100で割ればいい。数式に置き換えれば、X ÷ 100 や。

これが、統計学の用語では「平均」って言うねん。

ちなみに、それぞれの地区における収穫量(=データ)を標本って言うねんで。

MEMO
統計学における平均とは、母集団における全ての標本(=データの値)を足して、標本の数(n)で割ったもの

けいしゅけ

しかしタコちゅけよ、もしもAHEADMAP村全土の収穫量データが無かったらどうする?

100地区みんなが毎年の収穫量を記録してなかったとしたら平均は出されへんで??

タコちゅけ

えっ!?そんなぁ。

そしたら、データがある地区の収穫量の平均から母集団を推定していくしかないでちゅ。

けいしゅけ

ナイス!!!

それこそがAHEADMAP関東支部のツイキャスで伝えたかった内容や!

データがある地区の収穫量から、地区(1)・地区(26)・地区(52)・地区(79)・地区(97)5つを選ぶとしよう。

統計学の用語に置き換えよう。母集団から5つの標本抽出するんや。

抽出した標本の平均を出すことで、母集団の値をなんとなぁく予測することは可能っぽくないか?

例えば、5地区のリンゴ収穫量が例年平均15万個だったとする。抽出された5地区の平均で、1地区あたり15万個収穫できるんやから、100地区あるAHEADMAP村の収穫量(母集団)は1500万個になるだろうってね。

期待値って何ですか?

タコちゅけ

確かにそうでちゅね。

 

しかし先生、この計算って正確な収穫量を出せないでちゅよね。

だって、5つの地区で平均15万個収穫できるのは例年データから予測した数値でちゅ。どのくらいの確率(p)で15万個のりんごが収穫できるか?って確率を加味して考える必要が出てくるんじゃ・・・。

けいしゅけ

(こやつ天才か?言おうとしてたことを先取りされちゃったぞ)

お、おう。

タコちゅけさん、ええと・・・。そうやね。(うろたえたぁっ!「さん」とか付けてもうたぁぁぁ!!)

その通りだよ。(何故に標準語!?落ち着け、けいしゅけ。)

それが、期待値ってヤツや!

補足やで☆
けいしゅけが唐突に発した統計用語「期待値」ってなんでしょう?

これまでの説明によれば、AHEADMAP村のリンゴ収穫量を予測するにあたって、5つの地区の例年の収穫量をデータとして使おうとしています。しかし、例年のデータ通りに今年も収穫できるとは限らないですよね。つまり、例年通りの数量を収穫できる確率を加味する必要性が生じます。この確率を加味したデータを期待値と言います。

・・・さすがにざっくりすぎるので、期待値の定義を記しましょう。

〘数〙 確率変数 が値 1 、 2 … n を確率 1 、 2 … n でとる時、1122+…+n n をいう。例えば、くじが全部で一〇〇本あって、当たりくじは一万円が五本、五万円が二本だけならば、くじを一本ひく時の期待値は一五〇〇円である。

出典 三省堂/大辞林 第三版

けいしゅけ

よってタコちゅけ、さっきの説明をもう一度言い直すわ。

 

5地区のリンゴ収穫量が例年平均15万個だったとする。

すると今年の収穫量の期待値は、1地区あたり15万個や。せやから100地区あるAHEADMAP村の収穫量(母集団)の期待値は1500万個っちゅうこっちゃな。

区間推定と信頼区間、信頼度、有意水準って何ですか??

タコちゅけ

リンゴの収穫量だけでもたっくさんの統計用語がわかっちゃいましゅね!

すごいスゴーーーーーい!!

タコちゅけ

ところで先生、リンゴの収穫量って「〇万個」ってピンポイントの数値が出せるものなんでちゅか?

けいしゅけ

(この子、統計学めっちゃ知ってるんじゃないの?)

鋭いな、タコちゅけ。

まさに、チミが言うてるのは「区間推定」の事やねん。

あー!待て待て、区間推定って何ですか?とか聞きだすやろ?そうやろ?そうに決まっている!

だから答えるわ。

区間推定というのは・・・

タコちゅけ

ふむふむ。

区間推定は、母集団の従う分布が正規分布であると仮定できるときに、標本から得られた値を使ってある区間でもって母平均などの母数を推定する方法です。

このときの区間のことを「信頼区間」といいます。論文などでは略語表記として「CI」が用いられます。

統計WEBより引用(強調は筆者による)

先生が以前に記事にしてはった臨床試験の結果に出てくるハザード比や95%信頼区間の意味って何?信頼区間ってこの区間推定から来ているんでちゅねぇ。

けいしゅけ

食い気味にきたね、タコちゅけ・・・。

しかし正解や!

そして、区間推定というのはある程度の区間を設定して母集団の数値や平均値などを推定するわけやけど、統計学では「ある程度」を95%で設定しているねん。(なんで95%なの?というと「なんとなく」なんよ。)

母平均の区間推定では「95%信頼区間(95%CI)」を求めることが多いですが、これは母集団から標本を取ってきて、その標本平均から母平均の95%信頼区間を求める、という作業を100回やったときに、95回はその区間の中に母平均が含まれるということを意味します。

また、95%信頼区間以外に「99%信頼区間」や「90%信頼区間」といった区間を求めることもあります。

この95%や99%、90%のような、ある区間に母数が含まれる確率のことを「信頼係数」あるいは「信頼度」といいます。

統計WEBより引用(強調は筆者による)

[memo title="MEMO"]ちなみに天気予防の台風の進路予測円、これが70%信頼区間です。[/memo]

ちなみに、この信頼度からはずれる境界線に名前がつけられているで。

それが「有意水準」ってヤツや。1-信頼度=有意水準(α)で表すことができる。

タコちゅけ

なるほどぉ!!!

けいしゅけ

(よっしゃ!タコちゅけを満足させることに成功!!)

タコちゅけ

で、正規分布ってなんでちゅか?

けいしゅけ

この子なんやねーーーーーーーーーん!!!!

正規分布とは

これについては、総務省統計局の記事を引用することで代用しようと思います。

正規分布

正規分布グラフ

テストの成績は通常、平均点の近くの人数が一番多く、0点や100点に近づくほど人数が少なくなり、得点の分布は左右対称の釣鐘型になることが多いと言われます。このような分布の型を「正規分布」と言います。全国の高校生の身長や体重の分布など、多くの分布の型は正規分布であることが知られていますが、正規分布のグラフは中央が一番高く、両側に向かってだんだん低くなっていき、左右対称の釣鐘型をしていますが、正規分布の場合、この中央の一番高い位置に平均値がきます。

下図は2つの正規分布曲線を表わしています。2つのグラフはどちらも平均値が0の正規分布曲線ですが、左の正規分布曲線の分散は、右の図の分散に比べて小さい値になっています。正規分布は、平均値と分散が決まると式やグラフも1つに決まります。

いろいろな正規分布曲線

また、分散や平均値がどんな値でも、正規分布は次の性質をもっています。

正規分布の性質

この性質をグラフ上に表したのが次の図です

図 正規分布の性質

図 正規分布の性質

統計データが正規分布となっている場合、平均値と標準偏差が分かれば、値が全体の中でどこに位置するのかがほぼ正確に分かります。

なるほど統計学園高等部より引用

けいしゅけ

この引用分の中にある正規分布のグラフで-3σや3σで仕切られた両端部分の面積が2.5%となるとき、両端の面積の合計が5%となり、中央部の面積が95%になるね。

この95%の面積中に、100回の試行中95回真の値が含まれる。これが95%信頼区間の考え方でした。

帰無仮説とαエラー、有意水準とp値について

次に帰無仮説とαエラー、有意水準とp値についてツイキャスから学んだことを書き記していきます。

帰無仮説って何ですか?

例えば、薬剤Aがプラセボに対して効果に差が有ることを証明したいとします。この場合に、直接的に「差が有る」ことを示すことは厳しい場合に、数学では背理法と言って「差がない」という仮説を立ててそれが証明できなければ、「差が有る」となるよねという方法を使って証明します。

タコちゅけ

「薬剤Aとプラセボに出た差は偶然で、結局のところ差なんてない」っていう差なし仮説帰無仮説という感じと捉えればOK。

差無し仮説(帰無仮説)が否定されちゃった ⇒ 差はある(対立仮説)が繰り上げ合格となる。

帰無仮説が否定できない=有意差なし≠効果なし

ツイキャスのコメント欄をメモしました!

けいしゅけ

うんうん、すごく大事なところやったよね。

有意差がない ≠ 薬の効果がない

これはホンマに大事や。けれど有意差は、検定において症例数が多ければ検出力が強まるため出やすくなるし、症例数が少なければ有意差は付きにくくなるから。

だからこそ、有意差がないからといって、薬の効果がないと考えるのはあまりにも早計なんや。

p値は「帰無仮説が正しいという前提において、それ以上、偏った検定統計量が得られる確率」を示している。

帰無仮説が「母集団Aと母集団Bの平均は等しい」とすると、p値は「2つの母集団AとBから、サンプリング可能なすべての組み合わせの総数を1として、その中で、今回の平均値の差以上に、平均値の差が生じるサンプルの組み合わせが占める比率」ということになる。

帰無仮説が正しいのに棄却してしまう誤りを「第1種の過誤(Type I error)」と呼び、統計的検定を行うときには、前もって棄却するときの基準(有意水準)を決めておく。有意水準をp値が下回ったときに、はじめて「統計的有意差があった」と言うことができる。

統計WEBより引用

第一種の過誤(αエラー)って何ですか?

帰無仮説と対立仮説、αエラーの表

帰無仮説と対立仮説、αエラーの表

 

αエラーとは、本当は差がないのに、差があるとしてしまう誤りのこと。

βエラーとは、本当は差が有るのに、差がないとしてしまう誤りのこと。

ちなみにこの「α」は先ほど説明したものです。

αとは、有意水準の事で「検定において、第一種のエラーを許容できるボーダーライン」を指します。信頼区間を95%とすれば、正規分布でいう両端の2.5%の部分が有意水準となります。

有意水準とp値

タコちゅけ

 え?それってp値のことじゃないんでちゅか?? 

けいしゅけ

ココややこしいよね。

僕も最初はp値と有意水準αの違いが不明瞭やってん。そやから違いをまずハッキリ示してみようか。

  • 有意水準は信頼区間を定めるためのボーダーラインであり、定数である。
  • p値は帰無仮説(差がない説)が正しい確率の大きさを示す数値で、変数である。よって、p値が小さいほど帰無仮説が正しい確率は低くなる。
  • すなわち、有意水準αで定めた数値よりもp値が小さい数値になった時に有意差があるという。
  • ☆検定に使うデータの数(n数)が多ければp値の数値は小さくなりやすい。つまり、有意差が付きやすくなる。だからこそ、有意差なし≠効果なしと先ほど強調して記述したのでした。(逆に、有意差ありと出たからといって絶対に効果あり!!とも言い切れないともいえる。)

タコちゅけ

なるほどぉ。

つまり、信頼区間を使った検定で有意差があるかどうかの結果は、効果があるかないかの判断指標にはなる。

だけど、効果があるかないかを決定することはできないんでちゅね!

有意差なし≠効果なし(逆に、有意差ありと出たからといって絶対に効果あり!!とも言い切れない。)

これはしっかりと意識しておきたいと思いましゅ!

まとめと感想

今回のツイキャスは学ぶことが非常に多かったです。以下に今回のツイキャスから学ぶことができたことをまとめましょう。

  • 母集団とは、対象とする統計データの全体を指す
  • 標本とは、統計データの事
  • 抽出とは、母集団の中から、一部を取り出すこと
  • 平均とは、母集団におけるデータの総量をデータ数n個で割った数値を指す
  • 期待値とは、確率変数 が値 1 、 2 … n を確率 1 、 2 … n で起こる時、1122+…+n n をいう。
  • 区間推定は、母集団の従う分布が正規分布であると仮定できるときに、標本から得られた値を使ってある区間でもって母平均などの母数を推定する方法
  • このときの区間のことを「信頼区間」という
  • 例えば、テストの成績は通常、平均点の近くの人数が一番多く、0点や100点に近づくほど人数が少なくなり、得点の分布は左右対称の釣鐘型になることが多い。このような分布の型を「正規分布」という。
  • 帰無仮説とは、「薬剤Aとプラセボに出た差は偶然で、結局のところ差なんてない」っていう差なし仮説のこと
  • αエラーとは、本当は差がないのに、差があるとしてしまう誤りのこと
  • 有意水準とは、この「α」を指し、信頼区間を定めるためのボーダーラインであり、定数である
  • p値は帰無仮説(差がない説)が正しい確率の大きさを示す数値で、変数である。よって、p値が小さいほど帰無仮説が正しい確率は低くなる
  • 有意水準αで定めた数値よりもp値が小さい数値になった時に有意差があるという
  • 検定に使うデータの数(n数)が多ければp値の数値は小さくなりやすい。つまり、有意差が付きやすくなる。だからこそ、有意差なし≠効果なしと先ほど強調して記述したのでした。(逆に、有意差ありと出たからといって絶対に効果あり!!とも言い切れないともいえる

タコちゅけ

メッチャ多いじゃないでちゅか!!

けいしゅけ

せやろ?AHEADMAP関東支部のツイキャス、最高やな!

これからも一緒に勉強しようよ、タコちゅけ!!

タコちゅけ

はいっ!!

よろしくお願いいたしまちゅ!!

けいしゅけ

今回の記事はいかがでしたか? アナタのお役に立てていれば幸いです!

もし良ければコメント欄から記事を読んだ感想や、ご意見、ご質問など寄せて下さい☆

待ってます!!

けいしゅけはアナタのコメントを待ってます!書いてもらうと喜びます☆質問も大歓迎!真摯にお答えいたします!