-  更新6/20, 2008-




― 注 意 ―
数量化理論V類による本文中の図についての補足

 葛西 俊治
(元・札幌学院大学心理学部臨床心理学科教授)





★以下の内容は「SPSSでの数量化理論ソフトの利用」を前提とした説明です。
(Excel版の数量化理論ソフトでは該当しない部分があります。)

 本文中に示した以下の図Aでは、{ L11 L21 C4 L12 L22 L31 }の六個のラベルが記載されています。しかし、その下に示してある「カテゴリー・スコア」のリストでは、たとえば、L11,L21,…というラベルに対し て「値0 値 1」というように二つの数値が示されています。
ここで「値 0」とは「L11というラベルに含まれていないカードからなるカテゴリー」を指し示 しています。
また、「値 1 」とは「L11というラベルに含まれているカードからなるカテゴリー」を指し示しています。

 図A

 つまり、カテゴリー・スコアのリストに記載されているように、算出された座標値は12個のラベルについてのものなのです。
ここで、12個のラベルに対して下のように名前をつけておきます。例えば、L11xとは「値が0」すなわち「L11というラベルに含 まれていないカードからなるカテゴリー」なので、x というしるしをつけて「L11x」と表示します。
つまり、上に示した図Aでは、{ L11x L11 L21x L21 C4x C4 L12x L12 L22x L22 L31x L31 } という12個が表示されるはずなのに、見づらくなるので { L11x L21x C4x L12x L22x L31x } というように「 x 」がついたラベルは図Aには載せないでいるのです。
*→[数量化理論V類による出力結果の例]
*→[ Excelを使って二次元の散布図を作成する}

●カテゴリースコア
                                      1         2         3         4   (軸)
     変数          値    カウント
    
     L11x         0.       6     0.55243  -0.56364   0.45723   -1.06
     L11           1.       2    -1.65730   1.69091  -1.37170    3.19
    
     L21x         0.       5     0.86609  -0.70913   0.19411    0.83
     L21           1.       3    -1.44349   1.18189  -0.32353  -1.38
    
     C4x           0.       7     0.07385   0.70634   0.39422   -0.18
     C4             1.       1    -0.51693  -4.94439  -2.75957   1.26
    
     L12x           0.       6    -0.57269  -0.32461   1.00786   0.41
     L12            1.       2     1.71808   0.97383  -3.02359  -1.23
    
     L22x           0.       5    -0.89786  -0.40841   0.42788  -0.32
     L22            1.       3     1.49643   0.68068  -0.71314    0.53
    
     L31x           0.       4    -1.21185  -0.34968  -0.93254  -0.72
     L31            1.       4     1.21184   0.34968   0.93257    0.72

     有効ケース数        -        8
     欠損ケース数        -        0


実際は、図Bのように12個のラベルに対しての座標値が算出されているわけです。下図の黒丸が{ L11 L21 C4 L12 L22 L31} なので、上に示した本文中の図と同じ位置にあることが見てとれます。(繰り返しになりますが、上の図Aでは { L11x L21x C4x L12x L22x L31x }が省略されている訳です。)
 図B 


 ● 数量化理論V類による分析方 法に関連して 

 12個あるラベルを計算に用いたのに、「ラベルリスト」にある六個のラベルだけを取り出して図示している理由の一つは「12個全部を載せる と見づらいから」ですが、実はそれだけはありませんので以下に説明を加えておきます。

 本来は、{ L11 L21 C4 L12 L22 L31}の六個のラベルだけを数量化理論V類による分析の対象にすれば良いのですが、このサイトで示している例では、対象としているカードの枚数があまり にも少ないために計算上の問題が生じてしまうので、{ L11 L21 C4 L12 L22 L31}の六個のラベルだげではなく、{ L11x L21x C4x L12x L22x L31x}という六個のラベルまでも含めて計算をさせているためなのです。混乱させてすみません。
しかし、それと同時に次のような状況があるために、積極的にそのように計算を行っているという側面があります。すなわち…


★{ L11 L21 C4 L12 L22 L31}の六個のラベルだけではなく、{L11x L21x C4x L12x L22x L31x}という六個のラベルまでも含めて計算を行うことについて

  • KH法の「カード布置」の作業によって、カードとラベルの構造は実はある程度まで、整理されてきています。
  • カードとラベルの対応表を見てみると、対角線に沿うような形で{1}が並んでいる状態になっています。
  • そうした「整った形」のために、数量化理論V類が計算処理の中で行う「固有値」の計算」支障を来すことがあります。もちろん、計算ができないと分析できないことはいうまでもありません。
    *ラベル数が少なすぎたりデータ内容によっては固有値計算が不能となる場合があります。
  • このような問題を回避するための簡便で実際的な方法として、「{L11x L21x C4x L12x L22x L31x}という六個のラベルまでも含めて計算を行う」という方法を積極的に取り入れる方向で考えてみます。
  • ここで{L11x L21x C4x L12x L22x L31x}において、たとえば、「L11xとは、L11というグループに含まれていない全てのカードからなるグループ」を意味します。すると、L11xというグループはL11以外の全てのカードを含むために、様々な内容が混交すると考えられます。実際、数量化V類で分析して表示してみると分かりますが、L11xや L12xなど、xがつくラベルは、(いろいろな内容のカードを含んでいるために)、どのような場合でも、軸の原点に近いところに位置します。
  • したがって、「ラベルの布置に基づいて軸の意味を解釈する」という過程では、L11xやL21xなどのようなxがついたラベルは、軸の意味の解釈には大きく影響しないことになります。
  • つまり、「軸の意味を解釈することによってカード布置の理解を進めたい」という目的で数量化理論V類を用いる場合には、L11xやL21xなどのようなxがついたラベルを含めることには大きな問題はないと考えることができます。
  • 以上のような考え方に基づいて、以下ではL11xやL21xといったラベルを含めて数量化理論V類の計算を実行させています。それと同時に、得られた軸におけるラベルの配置については、L11xやL21xといったラベルは表示させないでいるわけです。

  • このような方針で数量化V類による分析を進める場合、SPSSでの数量化理論V類プログラムでは、 以下に示すように各ラベルの最小値・最大値の指定を「最小値=0、最大値=1」とします。
    (「最小値=1,最大値=1」とすると、{ L11 L21 C4 L12 L22 L31}の六個のラベルだけを分析対象とすることになります。)
    (追記、12/14,2007)

繰り返しておくと、「計算は12個のラベルまで含めて計算して、カテゴリースコアもそのよう に12個算出されている」のに対して、「本文中の図では6個のラベルだけを示している」ということです。
 なお、SPSS上の数量化理論の実際の使用方法は以下の通りです。


1) SPSSデータエディター 画面

  SPSS上で動作する「数量化理論」の使い方の説明をかねて、こうした事情を説明しておきます。SPSSのデータエディターでは、 「ラベルリスト」の構造は次 のような1,0のデータになっています。




2) 数量化理論開始 画面

  SPSSのデータエディタ上にデータが表示されている状態で、分析方法と し て「数量化理論」を選ぶと次のような選択画面が出てきます。「数量化理論V類」をクリックして選択します。




3) 変数選択 画面

  左にある六個の変数 { L11 L21 C4 L12 L22 L31 } を分析対象して選択して、右側にある「変数リスト」画面に入れます。 そして、「最小値・最大値」ボタンをクリックして、それぞれの変数の「最小値・最大値」を入力していきます。


*なお、この変数選択画面に出ている「次元数」の指定は、数量化理論による(固有値)計算そのものとは関係ありません。カテゴリー間の距離を計算させると きのオプションで、次のように解説されているように、カテゴリー間距離を算出しないときは設定は不要です。
*次元数の指定
数量化理論3 類では,カテゴリースコアからカテゴリー間の距離を求めることができます.カテゴリースコアは第1から第5軸まで求められており,そのうちどの軸までを距 離の計算に使用するかを指定します.

4a) 最小値・最大値 選択画面  「最小値 0 」「最大値 1 」と指定する場合

  六個の変数全てについて「最小値 0 」「最大値 1 」として設定すると下のような表示になります。
ここで{ 1 } という数値を指定することによって、L11,L21…といったラベルに該当している対象カードがどれなのかの指定が行われています。(「最大値」という ネーミングですが、意味が少し違いますね。)
それと同時に「最小値 0」と指定することによって、実は {L11x L21x C4x L12x L22x L31x }という六個の新しいラベルを自動的に作成するように指示しているのです。これによって、合計12個のラベルを自動的に分析の対象として指定したことにな ります。

本文中で図示している例はすべて「最小値 0 」「最大値 1 」として指定した場合の分析結果を例示しています。



4b) 最小値・最大値選択画面  「最小値 1 」「最大値 1 」と指定する場合

  六個の変数全てについて「最小値 1」「最大値 1 」として設定すると下のような表示になります。
ここで最小値・最大値ともに{ 1 } という数値を指定することによって、そのラベルに含まれているカード、すなわち「対応表において{1}という数値になっているカード」を対象として、それぞれのカードが属している六個のラベル { L11 L21 C4 L12 L22 L31 }を分析することになります。

 ↓



 *なお、SPSS-Xの解説書に「最小値・最大値」をともに{ 1 } とすることについての
 解説があります。(『新版 SPSS-x U解析編1』東洋経済新報社,p274-283, 1990)
 



★数量化V類における軸と軸の意味について (追記 6/20,2008)

数量化V類は、行と列の二つの事柄について、対応のある個所に{1}が入るという対応表を分析する手法です。イメージとしては、行同士を入れ替え、また、列同士を入れ替えて、対角線上に{1}が並ぶようにすると、行および列においてそれぞれに対応するものが隣り合うようになる…という発想に基づいています。そうした発想を数理的に実現したのがV類です。そのため、V類による分析結果に基づいて、行または列内の要素をクラスター化していくことができます。
*分析結果に表示される「相関」とは、対応表の「各行に割り当てられる数値」と「各列に割り当てられる数値」との間の相関係数のことです。(第一軸から第四〜五軸までそれぞれにおける、行と列に割り当てられた数値間の相関が表示されます)。相関係数の高さは、対応表上の{1}が左上から右下へ連なる対角線上にきれいに並んでいる度合いを示しています。なお、相関係数の二乗がその固有値と一致します。
しかし、KH法では「カード布置」過程において、研究者自身によってすでにそうしたクラスター化が行われています。したがって、KH法ではもっぱら「ラベルの、軸上の位置」に関心を向けて、「軸の意味の解釈」に関心があるわけです。

ところで、相関行列に基づいて軸を算出する主成分分析や因子分析(以下、因子分析と略記)とは異なり、数量化V類では「1,0のデータで示された対応表」を分析することから、「次元」「軸」の意味や位置づけは、因子分析におけるものとは質的に異なることになります。そうした詳細は今後の研究を待つ必要があると思われますが、0から1までの実数値である相関行列を入力データとする因子分析と比べると、0か1しかとらない対応表を入力データとするV類では、そうした制約に関わる差違があるはずなので、因子分析と同列に扱うのには慎重であるべきです。

*因子分析の入力データとして、カテゴリカルデータ、たとえば三件法{1,2,3}や五件法{1,2,3,4,5}などの順序尺度が頻繁に用いられてきています。因子分析はピアソン相関係数を用いる関係上、そうした順序尺度上の離散値データではなく比例尺度上の実数値を入力データとすべきなので、こうした使い方には原理的な問題があるわけです。しかし、心理学などでは伝統的にそうした使用方法を許容してきているので、因子分析をいわば「比喩的・たとえ話的」に用いていると考えられるます。なお、専門的研究によれば、三件法以下では因子分析の使用には問題があるが、四件法以上であれば許容できるとされています。
また、行内および列内の要素がそれぞれに近いものがそばに来るようにするというV類の発想から考えると明らかなように、互いに近くに来ない要素が結果的に「軸の両極端に位置する」という事情があるために、分析結果として得られる「軸」には、必ずしも「一次元性」が保証されるわけではない、と考えられます。(「一次元性」とは、たとえば「つらい・安楽」といったような2項対比的な事柄が軸の両極端に位置することによって、「つらさ度」と「安楽度」についてみると、一方が増えると他方が減少するという対比的関係になっていることを指すものとします。)
つまり、V類によって得られる軸とは、「一次元性」というよりも、ある軸上におけるラベルの「対比性」という意味合いが強いと考える必要があるわけです。実際にV類を用いてきた経験から述べると、軸の一次元的解釈が可能な場合もあるけれども、どちらかというと一次元的な軸解釈が容易でないことが多いという感想をもっています。そのため、どのような内容のラベルが軸の両極端に位置していて「対比」されているか…ということに目を向けることによって、次のように進めることになります。
  1. 一次元性が見いだされるときは、そうした一次元的な軸の解釈を試みる。
  2. 一次元性があまり見いだせないときは、対比的な意味合いで軸の解釈を試みる。
一次元性あるいは対比性のいずれにしても、V類による分析結果は、第T軸・第U軸・第V軸…という複数の軸構造を与えてくれるので、第T軸ではどのような次元や対比が見られ、次の第U軸ではどのような次元や対比が見られ…ということを通じて、ラベルとカード布置についての理解と解釈に寄与するヒントを得ることができること、そうした点に数量化V類を用いる主要な意味があるといえるでしょう。



「関連性評定に基づく質的分析」の実際について」
―数量化理論V類による図に関する補足―

葛西俊治, 2008

[サイトのトップに戻る]