[3/25, 2011 更新9/2]

多要因分散分析 の検定力分析について


葛西 俊治

(元・札幌学院大学心理学部臨床心理学科教授)


■3要因分散分析の事後の検定力分析について


  • 事後の検定力分析では「効果量 f 」の数値が必要となります。G*Powerソフトでは、[Determine]というボタンをクリックすると、効果量 f を求めるための計算パネルが右側に表示されます。入力数値としては2種類の入力方法が選べます。     
     
    • From variances
      Variance explained by special effect [  ]
      σ2m (要因の標準偏差の二乗)

                Error variance [  ]
      σ2 (全体の標準偏差の二乗)


    • Direct
      Partial η2 [ 0.3282203]
      偏相関係数の二乗

      [Calculate]     Effect size f [ 0.6989873]
      計算させると効果量 f が表示される
    G*Powerの計算パネル

       
 
  上の右側にある「効果量の計算パネル」では、平方和の二つの数値を入れるか、偏相関係数の二乗 η2を入れるかして効果量を計算します。実際的なやり方は、分散分析表に載っている自由度とF値を用いるものですが、それに先だって、3要因分散分析の一次の主効果(A,B,C)、二次の交互作用(AxB,AxC,BxC)、三次の交互作用(AxBxC)について詳しくみていくことにします。
※一元配置分散分析と二元配置の分散分析の説明で示したように、分散分析の効果量そのものは、先に示した「効果量電卓」などで簡単に計算できます。3要因分散分析についても、要因や交互作用の効果量は同じ数式なので特に問題なく得られます。得られた効果量を用いてG*Powerに計算させると検定力が求められるはずです。
 しかし、このようにしてG*Powerで求めた場合、その結果は豊田(2009)に例示されている3要因分散分析の検定力分析の例とはかなりのズレがあります。単なる計算上の誤差とは言い難い大きさです。
 また、以下のように実データからσ2m や全体分散σ2を用いて検定力を導く方法が、G*Powerにて紹介されていたのでその通りに行ってみました。しかし、その結果は、一般線型モデルから得られた分散分析表 (表2:被験者間検定) を用いて効果量・検定力を求めた場合と明らかにずれていました。
 という状況ですが、時間的に余裕がなくまだズレの原因を突き止めるに至っていません。したがって、1要因および2要因についての分散分析の検定力分析は問題ないのですが、3要因配置の分散分析の検定力については個人的にはまだ決着がついていませんので、そうした現状について記しておきます。(9/2, 2011)


●3要因分散分析については、G*Powerのサイトには詳細な説明があったので、どのような内容か実際に確認してみましたが「効果量の計算パネル」に入れる分散の数値について理解するのに役立ちました。
 
 以下は要因A(3水準)、要因B(3水準)、要因C(4水準)の分散分析(各セル内の度数は 3 )において、36個のセルにおける平均値(m)・標準偏差(s)・セル内データ数(n)のリストです。
 
     
表1
 
 
 この仮想データについて3要因の分散分析をSPSSソフトのGLM (一般線形モデル)で分析した際の分散分析表が掲載されおり、その内容をG*Powerソフトであらためて確認することで、どのような数値を用いるかなど、使い方の説明となっています。
 (G*Powerでは母数をパラメータとして用いるので、標本統計量を用いているSPSSとは、η2 の数値が異なりますが、その変換式も説明されています。なお、結果として得られる検定力そのものの数値はどちらも同一となっています。)
 
 
 表 2 : 被験者間検定
 


  • 表1をデータとする3要因分散分析の検定力分析の内容を以下にまとめておきます。
     
    ●元の英文の内容は → G*Powerの解説(英文+図表) をご覧ください)

    ●参考のため、数値と計算について数表を作成しました [Excel数表]
    (「読み取り専用」をクリックしてください)

  •  


     要因A、B、Cの主効果 

    • 36個の平均値の平均を求めることで「全体平均値」を算出します。
      全体の平均値  (grand mean) = 3.1382
    • 共通の分散 σ2 は36個の各セルの標準偏差 s をそれぞれ二乗して合計したものの平均値です。
      共通の分散 σ2 = 1.71296 ( σ2= 1/36 Σi Si2)

    • 次に要因A、B、C、それぞれの主効果を求めます。

    • 要因Aの三つの平均値、μ1 * * μ2 * * μ3 * * は次の数値です。
      なお、三つの平均値からそれぞれ全体平均( mg )を差し引いた数値にしてあります(合計が0)。
      μi * * = { -0.722231, 1.30556, -0.583331 }
      それぞれを二乗してその平均値 σA2を求めます。
      σA2 = ( (-0.722231)2 + (1.30556)2 + (-0.583331)2 ) / 3
      σA2= 0.85546

      要因Aの効果量は  fA = √ ( σA2 / σ ) なので…
      fA = √ ( 0.85546 / 1.71296 ) = 0.7066856

    • 同様にして
      要因Bの三つの平均値 μ* j * = { -0.0555556, 0.19444444, -0.1388889 }  から
      σB2= 0.02006173
      したがって要因Bの効果量は fB = √ ( 0.02006173 / 1.71296 ) = 0.10822379

      また
      要因Cの四つの平均値 μ* * k = { 0.52776944, -0.027775, -0.2499972, -0.2499972 }  から
      σC2= 0.10107731
      したがって要因Cの効果量は fC = √ ( 0.10107731 / 1.71296 ) = 0.2429212

    • ねんのため、それぞれの偏相関係数 η2を計算してみます。η2 = f2 / ( 1 + f2) の式を用います。

      ηA2 = fA2 / ( 1 + fA2) = 0.33308116
      ηB2 = fB2 / ( 1 + fB2) = 0.0115768
      ηC2 = fC2 / ( 1 + fC2) = 0.05572249

      G*Powerの効果量計算パネルには、ここで示した数値を入力することで効果量を計算してくれるわけです。「 From variances」の「variance explained by special eefect」の欄には σAやσB、あるいは σCを入れて、その下の欄の「Error variance」には σ を入れる―。
      または、「 Direct」の偏相関係数 「Partial η2」にそれぞれの偏相関係数 ηA2 、ηB2 、 ηC2 を入れることができます。
      (ここではすでに効果量 f は計算済みなので、効果量計算用のパネルを用いる必要はありませんが、使い方の解説をしています。)

    • 以下は要因Aについて検定力を求めた場合のG*Powerの画面、および「効果量計算パネル」です。




      このように要因Aは、 検定力 (1-β)は 0.9999994 と極めて高いことが分かりました。
      なお、要因Bについては (1-β)= 0.1519503、また要因Cについては (1-β)= 0.5208786 となります。G*Powerで確認してみてください。
      要因Bの検定力はかなり低く、36個のセルに各3名(回)のデータを用いてこの研究では要因Bの効果を把握できていないことが分かります(分散分析でも有意になっていませんし)。また、要因Cの検定力も0.52...と低く、こちらも不十分なことが分かります (ダミーのデータですが…)。ただし、36個のセルに各3名(回)と少ないデータ数にも関わらず、要因Aの効果は、検定力の高さもあいまって十分に確認されたことになります。したがって、この研究がもっぱら要因Aの効果に注目して計画された研究だったならば、とりあえず当初の目的は達成したことになるでしょう。
     


     2要因交互作用 AxB、AxC、 BxC

    •  2要因の交互作用についても検定力分析に必要なのは σAxB 、 σAxC 、 σBxC という標準偏差の数値です。この数値は「2要因交互作用における残差 residual」と呼ばれ次の式で表されます。ここでは、AxBの交互作用 δi j *について説明を進めます。i で要因Aの水準を表し、 j で要因Bの水準を表し、 k で要因C の水準を表しています。アスタリスク * は、それぞれの要因の部分の水準をすべて含む (水準の違いを問わない) ことを意味しています。
       
      要因AとBの交互作用を表す残差の式 δi j * = μi j * - μi * * - μ* j *
       
       μi j *は、要因Aと要因Bの3行3列、9個あるそれぞれの平均値。
       μi * *は、要因Aの3個あるそれぞれの平均値。
       μ* j *は、要因Bの3個あるそれぞれの平均値、をそれぞれ指しています。
       
       
       要因Aは3水準( i =1,2,3 )、要因Bも3水準( j=1,2,3 ) なので、残差は次の9個となります。
       
       {  δ11*   δ12*  δ13*       δ21*  δ22*  δ23*       δ31*  δ32*  δ33* }
       { 0.555564, -0.351111, -0.194453, -0.388903, 0.444447, -0.055444, -0.166661, -.0.0833361, 0.249997 }
       
       
       求める σ2AxB は、この9個の値をそれぞれ二乗して合計した数値の平均値です。したがって
       
       σ2AxB = ( (0.555564>2 + (-0.351111)2 + (-0.194453)2 + (-0.388903)2 + (0.444447)2 + (-0.055444)2 + (-0.166661)2 + (-.0.0833361)2 + (0.249997)2 ) / 9

       σ2AxB = 0.102881 となりました。これを分子にして効果量 f を計算します。
       
      (なお、分母となる σ2= 1.71296 は上で計算済みです。)


      この二つをG*Powerの効果量計算パネルに入れると、以下のように偏相関係数 η2と効果量が計算されます。
      [variance explained by special effect (特殊効果によって説明された分散)] には σ2AxB = 0.102881 を入力し、
      [Error variance (誤差分散)] には σ2 = 1.71296 を入れて[Calculate]をクリックすると計算されます。


      なお、
       要因AxBの2要因交互作用の効果量
       
      fAxB = √ ( 0.102881 / 1.71296 ) = 0.2450722

      もちろん、すでに効果量 f は計算済みなので、G*Powerのメイン画面の入力欄に直接入力してもokです。
      要因AとBの交互作用の偏相関係数についても
      η2AxB = f 2AxB / ( 1 + f 2AxB ) の式に基づいて、
       η2AxB = 0.24507222 / (1 + 0.24507222 ) = 0.05665749 となることも確認できます。

       次の図は、G*Powerのメイン画面の設定内容です。



      要因AxBの相互作用の自由度は Numerator df = 4 です。これは (要因Aの水準数 - 1 ) x (要因Bの水準数 - 1) = 2 x 2 =4 です。
      事後の検定力分析の結果、AxBの交互作用の検定力は Power = 0.4756346 と、あまり高くないことが確認されました。

      同様な計算によって、 AxC の交互作用の検定力 Power = 0.7402635 とある程度の高さがあることが分かります。またBxC の交互作用の検定力 Power = 0.5166079 となり、あまり検定力が高くないことが分かります。詳しい内容は計算用の数表をご覧ください。

     



     3要因A、B、C の 交互作用 

    •  さて、いよいよ3要因A、B、C の交互作用について、その検定力を計算することになります。計算の基本的な考え方は前と同じで、交互作用の残差δi j k を計算して、それから 効果量を計算するための σ i j k2 を求めます。
       3要因の残差 δi j k は次の式で表されます。
         
      δi j k = μi j k - μi * * - μ* j * - μ* * k - δi j * - δi * k - δ* j k

      μi j k はセル(i,j,k)の平均値
      μi * * は、要因A(水準 i = 1,2,3) の三つの平均値
      μ* j * は、要因B(水準 j = 1,2,3) の三つの平均値
      μ* * k は、要因C (水準 k = 1,2,3,4) の四つの平均値

      δi j * は、要因AxBの9個の残差 (i = 1,2,3 と j = 1,2,3 の組み合わせによる)
      δi * k は、要因AxC の12個の残差 (i = 1,2,3 と k = 1,2,3,4 の組み合わせによる)
      δ* j k は、要因BxC の12個の残差 (j = 1,2,3 と k = 1,2,3,4 の組み合わせによる)

      要因AxBxC の水準 3x3x4 = 36個のセルがあるので、3要因の交互作用を示す残差 δi j k は36個の要素からなります。

      A=1A=2A=3
       B  C δ(1jk)δ(2jk)δ(3jk)
      110.333336110.16666944-0.5000056
      120.77779167-0.9444750.16668333
      13-0.55556390.388902780.16666111
      14-0.55556390.388902780.16666111
      21-0.41665560.66665278-0.2499972
      22-0.30556670.222241670.083325
      230.36111111-0.44444720.08333611
      240.36111111-0.44444720.08333611
      310.08331944-0.83332220.75000278
      32-0.4722250.72223333-0.2500083
      330.194452780.05554444-0.2499972
      340.194452780.05554444-0.2499972
      この36個の残差を二乗して合計します。
      その平均値がσ2AxBxC となります。

      σ2AxBxC = 0.185189

      なお、数式は以下の通りです。
      σ2AxBxC = 1 / 36 Σ i,j,k δ2i j k


      計算したσ2AxBxCを分子にして、分母はσ2 = 1.71296 にして
      効果量 f を計算パネルで計算させます。
      効果量 f = 0.3288016 となり、 偏相関係数 η2AxBxC = 0.09756294
      と計算されました。
      この効果量をメインパネルに転送(transfer)して
      検定力 Power (1-β)がどの程度がを計算します。



      検定力 Power =0.5134.. とそれほど高くはないけれども、ひどく低い数値ではないことが分かりました。3要因の交互作用の検定力を高めるためには、とりあえず、36個のセルの各データ数が[3]と低いことから、データ数をそれぞれ 4〜以上として、測定の回数・度数を増やしたら検定力がより高くなることが考えられるわけです。

      以上が、3要因分散分析における検定力分析の実際でした。要因A,B,C の三つの要因の主効果、要因AxB, BxC, AxC の2要因交互作用、そして、要因AxBxC の3要因の交互作用 を計算することで必要な数値を算出しました。
      なお、SPSSのGLM (一般線型モデル)で分散分析した場合の検定力の数値は、ここで示した結果と同じです。したがって、実際にはSPSSの結果をそのまま用いれば良いことになります。注意点としては、SPSSでは標本統計量を用いていることから、G*Powerとは偏相関比の数値が異なることです (変換式が示されています)



    ■3要因分散分析表から検定力を求める

    (準備中…)




    また、「対応のあるデータについての分散分析」(被験者モデル)といえる「反復測定の分散分析」(ANOVA: repeated measures) については次に説明していくことにします。
    ( G*Power の論文に記載されています → [G*Power 2007] )


    * 無断転載をお断りいたします。
    * このコーナーの説明はご自身の責任でご利用ください。
     
     (C)All Rights Reserved by Toshiharu Kasai 2011