多要因分散分析の検定力分析 by 葛西俊治2011

[3/25, 2011 更新9/2]

多要因分散分析の検定力分析について

葛西俊治

(元・札幌学院大学心理学部臨床心理学科教授)

■３要因分散分析の事後の検定力分析について

事後の検定力分析では｢効果量 f 」の数値が必要となります。G^*Powerソフトでは、[Determine]というボタンをクリックすると、効果量 f を求めるための計算パネルが右側に表示されます。入力数値としては２種類の入力方法が選べます。　　　

From variances
Variance explained by special effect [　　]

σ²_m (要因の標準偏差の二乗)↑

　　　　　　　　　　Error variance [　　]

σ² (全体の標準偏差の二乗)↑
Direct
Partial η² [ 0.3282203]

偏相関係数の二乗 ↑

[Calculate]　　　　 Effect size f [　0.6989873]

計算させると効果量 f が表示される↑

G^*Powerの計算パネル

　上の右側にある「効果量の計算パネル」では、平方和の二つの数値を入れるか、偏相関係数の二乗 η²を入れるかして効果量を計算します。実際的なやり方は、分散分析表に載っている自由度とＦ値を用いるものですが、それに先だって、３要因分散分析の一次の主効果(A,B,C)、二次の交互作用(AxB,AxC,BxC)、三次の交互作用(AxBxC)について詳しくみていくことにします。

※一元配置分散分析と二元配置の分散分析の説明で示したように、分散分析の効果量そのものは、先に示した「効果量電卓」などで簡単に計算できます。３要因分散分析についても、要因や交互作用の効果量は同じ数式なので特に問題なく得られます。得られた効果量を用いてG^*Powerに計算させると検定力が求められるはずです。
　しかし、このようにしてG^*Powerで求めた場合、その結果は豊田(2009)に例示されている３要因分散分析の検定力分析の例とはかなりのズレがあります。単なる計算上の誤差とは言い難い大きさです。
　また、以下のように実データからσ²_m や全体分散σ²を用いて検定力を導く方法が、G^*Powerにて紹介されていたのでその通りに行ってみました。しかし、その結果は、一般線型モデルから得られた分散分析表 (表２:被験者間検定) を用いて効果量･検定力を求めた場合と明らかにずれていました。
　という状況ですが、時間的に余裕がなくまだズレの原因を突き止めるに至っていません。したがって、１要因および２要因についての分散分析の検定力分析は問題ないのですが、３要因配置の分散分析の検定力については個人的にはまだ決着がついていませんので、そうした現状について記しておきます。(9/2, 2011)

●３要因分散分析については、G^*Powerのサイトには詳細な説明があったので、どのような内容か実際に確認してみましたが「効果量の計算パネル」に入れる分散の数値について理解するのに役立ちました。
　
　以下は要因Ａ(3水準)、要因Ｂ(3水準)、要因Ｃ(4水準)の分散分析(各セル内の度数は 3 )において、36個のセルにおける平均値(m)・標準偏差(s)・セル内データ数(n)のリストです。
　

表１
　

　この仮想データについて３要因の分散分析をSPSSソフトのGLM (一般線形モデル)で分析した際の分散分析表が掲載されおり、その内容をG^*Powerソフトであらためて確認することで、どのような数値を用いるかなど、使い方の説明となっています。
　(G^*Powerでは母数をパラメータとして用いるので、標本統計量を用いているSPSSとは、η² の数値が異なりますが、その変換式も説明されています。なお、結果として得られる検定力そのものの数値はどちらも同一となっています。)

　表２ : 被験者間検定
　

表１をデータとする３要因分散分析の検定力分析の内容を以下にまとめておきます。
　
●元の英文の内容は　→ G^*Powerの解説(英文+図表) をご覧ください)

●参考のため、数値と計算について数表を作成しました → [Excel数表]

(｢読み取り専用」をクリックしてください)

　要因Ａ、Ｂ、Ｃの主効果　

36個の平均値の平均を求めることで｢全体平均値」を算出します。
全体の平均値　ｍ_ｇ (grand mean) = 3.1382
共通の分散 σ² は36個の各セルの標準偏差 s をそれぞれ二乗して合計したものの平均値です。
共通の分散 σ² = 1.71296 ( σ²= 1/36 Σ_i S_i²)

要因Ａの三つの平均値、μ_{1 * *} μ_{2 * *} μ_{3 * *} は次の数値です。
なお、三つの平均値からそれぞれ全体平均( m_g )を差し引いた数値にしてあります(合計が０)。
μ_{i * *} = { -0.722231, 1.30556, -0.583331 }
それぞれを二乗してその平均値 σ_A²を求めます。
σ_A² = ( (-0.722231)² + (1.30556)² + (-0.583331)² ) / 3
σ_A²= 0.85546

要因Ａの効果量は　 f_A = √　( σ_A² / σ ) なので…
f_A = √ ( 0.85546 / 1.71296 ) = 0.7066856

同様にして
要因Ｂの三つの平均値　μ_{* j *} = { -0.0555556, 0.19444444, -0.1388889 } 　から
σ_B²= 0.02006173
したがって要因Ｂの効果量は　f_B = √ ( 0.02006173 / 1.71296 ) = 0.10822379

また
要因Ｃの四つの平均値　μ_{* * k} = { 0.52776944, -0.027775, -0.2499972, -0.2499972 } 　から
σ_C²= 0.10107731
したがって要因Ｃの効果量は　f_C = √ ( 0.10107731 / 1.71296 ) = 0.2429212
ねんのため、それぞれの偏相関係数 η²を計算してみます。η² = f² / ( 1 + f²) の式を用います。

η_A² = f_A² / ( 1 + f_A²) = 0.33308116

η_B² = f_B² / ( 1 + f_B²) = 0.0115768

η_C² = f_C² / ( 1 + f_C²) = 0.05572249

G^*Powerの効果量計算パネルには、ここで示した数値を入力することで効果量を計算してくれるわけです。「 From variances」の「variance explained by special eefect」の欄には σ_Aやσ_B、あるいは σ_Cを入れて、その下の欄の「Error variance」には σ を入れる―。
または、「 Direct」の偏相関係数「Partial η²」にそれぞれの偏相関係数 η_A²　、η_B²　、 η_C² を入れることができます。
(ここではすでに効果量 f は計算済みなので、効果量計算用のパネルを用いる必要はありませんが、使い方の解説をしています。)

　２要因交互作用ＡxＢ、ＡxＣ、ＢxＣ

　２要因の交互作用についても検定力分析に必要なのは σ_AxB　、 σ_AxC　、 σ_BxC という標準偏差の数値です。この数値は「２要因交互作用における残差 residual」と呼ばれ次の式で表されます。ここでは、AxBの交互作用 δ_{i j *}について説明を進めます。i で要因Ａの水準を表し、　j で要因Ｂの水準を表し、 k で要因Ｃの水準を表しています。アスタリスク * は、それぞれの要因の部分の水準をすべて含む (水準の違いを問わない) ことを意味しています。
　

要因ＡとＢの交互作用を表す残差の式　δ_{i j *} = μ_{i j *} - μ_{i * *} - μ_{* j *}

　
　μ_{i j *}は、要因Ａと要因Ｂの3行3列、９個あるそれぞれの平均値。
　μ_{i * *}は、要因Ａの３個あるそれぞれの平均値。
　μ_{* j *}は、要因Ｂの３個あるそれぞれの平均値、をそれぞれ指しています。
　
　
　要因Ａは３水準( i =1,2,3 )、要因Ｂも３水準( j=1,2,3 ) なので、残差は次の９個となります。
　
　{ 　δ_11* 　　δ_12*　　δ_13*　　　　　　　δ_21*　　δ_22*　　δ_23*　　　　　　　δ_31*　　δ_32*　　δ_33*　}
　{ 0.555564, -0.351111, -0.194453, -0.388903, 0.444447, -0.055444, -0.166661, -.0.0833361, 0.249997 }
　
　
　求める σ²_AxB は、この９個の値をそれぞれ二乗して合計した数値の平均値です。したがって
　
　σ²_AxB = ( (0.555564>² + (-0.351111)² + (-0.194453)² + (-0.388903)² + (0.444447)² + (-0.055444)² + (-0.166661)² + (-.0.0833361)² + (0.249997)² ) / 9

　σ²_AxB = 0.102881 となりました。これを分子にして効果量 f を計算します。
　

(なお、分母となる σ²= 1.71296 は上で計算済みです。)

この二つをG^*Powerの効果量計算パネルに入れると、以下のように偏相関係数 η²と効果量が計算されます。
[variance explained by special effect (特殊効果によって説明された分散)]　には　σ²_AxB = 0.102881 を入力し、
[Error variance (誤差分散)] には σ² = 1.71296 を入れて[Calculate]をクリックすると計算されます。

なお、
　要因AxBの２要因交互作用の効果量
　
f_AxB = √ ( 0.102881 / 1.71296 ) = 0.2450722

もちろん、すでに効果量 f は計算済みなので、G^*Powerのメイン画面の入力欄に直接入力してもokです。
要因ＡとＢの交互作用の偏相関係数についても
η²_AxB = f ²_AxB ／ ( 1 + f ²_AxB ) の式に基づいて、
　η²_AxB =　0.2450722² / (1 + 0.2450722² ) = 0.05665749 となることも確認できます。

　次の図は、G^*Powerのメイン画面の設定内容です。

要因ＡxＢの相互作用の自由度は Numerator df = 4 です。これは (要因Ａの水準数 - 1 ) x (要因Ｂの水準数 - 1) = 2 x 2 =4 です。
事後の検定力分析の結果、ＡxＢの交互作用の検定力は Power = 0.4756346 と、あまり高くないことが確認されました。

同様な計算によって、ＡxＣの交互作用の検定力 Power = 0.7402635 とある程度の高さがあることが分かります。またＢxＣの交互作用の検定力 Power = 0.5166079 となり、あまり検定力が高くないことが分かります。詳しい内容は計算用の数表をご覧ください。

　３要因Ａ、Ｂ、Ｃの交互作用　

　さて、いよいよ３要因Ａ、Ｂ、Ｃの交互作用について、その検定力を計算することになります。計算の基本的な考え方は前と同じで、交互作用の残差δ_{i j k}を計算して、それから効果量を計算するための σ _{i j k}² を求めます。
　３要因の残差 δ_{i j k}は次の式で表されます。
　　

δ_{i j k} = μ_{i j k} - μ_{i * *} - μ_{* j *} - μ_{* * k} - δ_{i j *} - δ_{i * k} - δ_{* j k}

μ_{i j k}　はセル(i,j,k)の平均値
μ_{i * *}　は、要因Ａ(水準 i = 1,2,3) の三つの平均値
μ_{* j *}　は、要因Ｂ(水準 j = 1,2,3) の三つの平均値
μ_{* * k}　は、要因Ｃ (水準 k = 1,2,3,4) の四つの平均値

δ_{i j *}　は、要因ＡxＢの９個の残差 (i = 1,2,3 と j = 1,2,3 の組み合わせによる)
δ_{i * k}　は、要因ＡxＣの12個の残差 (i = 1,2,3 と k = 1,2,3,4 の組み合わせによる)
δ_{* j k}　は、要因ＢxＣの12個の残差 (j = 1,2,3 と k = 1,2,3,4 の組み合わせによる)

要因AxBxC の水準 3x3x4 = 36個のセルがあるので、３要因の交互作用を示す残差 δ_{i j k} は36個の要素からなります。

		A=1	A=2	A=3
B	C	δ(1jk)	δ(2jk)	δ(3jk)
1	1	0.33333611	0.16666944	-0.5000056
1	2	0.77779167	-0.944475	0.16668333
1	3	-0.5555639	0.38890278	0.16666111
1	4	-0.5555639	0.38890278	0.16666111
2	1	-0.4166556	0.66665278	-0.2499972
2	2	-0.3055667	0.22224167	0.083325
2	3	0.36111111	-0.4444472	0.08333611
2	4	0.36111111	-0.4444472	0.08333611
3	1	0.08331944	-0.8333222	0.75000278
3	2	-0.472225	0.72223333	-0.2500083
3	3	0.19445278	0.05554444	-0.2499972
3	4	0.19445278	0.05554444	-0.2499972

この36個の残差を二乗して合計します。
その平均値がσ²_AxBxC となります。

σ²_AxBxC = 0.185189

なお、数式は以下の通りです。
σ²_AxBxC = 1 / 36 Σ _i,j,k δ²_{i j k}

計算したσ²_AxBxCを分子にして、分母はσ² = 1.71296 にして
効果量 f を計算パネルで計算させます。
効果量 f = 0.3288016 となり、偏相関係数 η²_AxBxC = 0.09756294
と計算されました。
この効果量をメインパネルに転送(transfer)して
検定力 Power (1-β)がどの程度がを計算します。

検定力 Power =0.5134.. とそれほど高くはないけれども、ひどく低い数値ではないことが分かりました。３要因の交互作用の検定力を高めるためには、とりあえず、36個のセルの各データ数が[3]と低いことから、データ数をそれぞれ　4～以上として、測定の回数･度数を増やしたら検定力がより高くなることが考えられるわけです。

以上が、３要因分散分析における検定力分析の実際でした。要因A,B,C　の三つの要因の主効果、要因AxB, BxC, AxC の２要因交互作用、そして、要因AxBxC　の３要因の交互作用　を計算することで必要な数値を算出しました。
なお、SPSSのGLM (一般線型モデル)で分散分析した場合の検定力の数値は、ここで示した結果と同じです。したがって、実際にはSPSSの結果をそのまま用いれば良いことになります。注意点としては、SPSSでは標本統計量を用いていることから、G^*Powerとは偏相関比の数値が異なることです (変換式が示されています)

■３要因分散分析表から検定力を求める

(準備中…)

また、「対応のあるデータについての分散分析」(被験者内モデル)といえる「反復測定の分散分析」(ANOVA: repeated measures) については次に説明していくことにします。
( G^*Power の論文に記載されています → [G^*Power 2007] )

多要因分散分析 の検定力分析について

■３要因分散分析の事後の検定力分析について

多要因分散分析の検定力分析について