- 更新 7/7,2008-



「関連性評定に基づく質的分析」における
内的および外的妥当性について


 葛西 俊治
(元・札幌学院大学心理学部臨床心理学科教授)


 前項では、関連性評定質的分析について、そのうち『A.逐語録の「要約モデル」の生成』の実際について概略的に示 しました。本稿では、特に「関連性評定質的分析」に関して、そこで生成される「要約モデル」や「解釈モデル」について、「モデルの妥当性」をどのように考 えていくべきかを吟味していくことにします。


探索的研究における「モデルの妥当性」について

 現時点では、モデルの妥当性については以下のような観点からとらえています。

  1. 自己妥当性

     どのようなモデルであっても、そのようなモデルに該当するような事例や場合が原理的に考えられるのであれば「そのモデルには自己妥当性がある」と言うこ とにします。
     「風が吹くと桶屋が儲かる」というお話や、「天地が崩れ落ちる」と憂えたという杞の国の人の逸話(杞憂)は、常識的にも確率的にも「あり得ない」と判断 されるだろうお話ですが、少なくとも「モデルとしての自己妥当性を 備えている」と考えられます。専門領域における研究者がその程度の戯言を述べ立てるはずもありませんから、研究過程において得られたモデルはそれがどのよ うなモデルであったとしても「モデルとし て一定の価値を備えたモデル」という意味での妥当性(自己妥当性)は備えていると判断することにします。そのモデルが示す事柄がどれだけの頻度で確認され るか、事柄や現象や人々の振る舞いをどの程度把握しているか…は、その後に追求していくことになります。
     このような自己妥当性を明確に位置づけておくのには理由があります。それは、「まさか」とか「そのようなことはあり得ない」という反感に満ちた反応に陥 ることなく冷静な判断を維持したいことと、質的研究は必ずしも多数回や多人数を対象とした研究ではなく、ある特定の「その人」や「その状況」という限定的 な場面での研究を意図するものだからです。すなわち、質的研究の必要性は、「一般に」「頻繁に」「平均的に」起きるわけではない現象を明らかにし、的確に 把握したいというところに発生しています。そうした基本的立場を維持するためにも、「自己妥当性」という把握は重要と考えます。
     なお、近年の統計科学での主要テーマは「多次元小標本」だといいます。数多くの要因があるにもかかわらず少数の標本しか採れない事態に、統計学としては どのように対処できるか、という問題意識といえます。質的研究が扱う領域も、統計科学ではありませんが、いわば「多次元小標本」事態とも考えられるところ です。


  2. 内部整合妥当性

     どのようなモデルでも、その中に盛り込まれている事柄が全体として一貫性や整合性を備えていることが要求されます。もちろん、ありとあらゆる場合に備え たようなモデルは時間的にも状況的にも、実際には生成不可能ですから何らかの問題点やそうした意味での瑕疵(かし)は予想されるところです。しかし、その モデルが描き出そうとして いる中心テーマに関しては、当然ながら、全体として一貫性があり整合的であることは必須のこととなります。そのように全体として一貫性や整合性が認められ るモデルには「内部整合妥当性がある」と言うことにします。研究過程において提起されるモデルが、そうした意味での一貫性や整合性をもたなければ提起され るこ とはありませんので、常に「一定程度の内部整合妥当性を備えている」ものと考えられます。

  3. 状況限定的妥当性

     モデルは極めて限定された特定の状況だったり、あるいはもう少し一般的な状況において、事柄や物事のあり方・関わり方についての「模式図」です。した がって、ど のようなモデルであっても、「そのモデルが前提としている状況における模式図」なのであって、ありとあらゆる場面や状況を網羅しているわけではありませ ん。
     したがって、モデルはその設定時において、そのモデルが対象としている状況や物事がどういうことであるのかを述べて、そのモデルが適用される状況の範囲 を明示する 必要があります。そうした意味 で、どのようなモデルも状況限定的な意味での妥当性を主張するのに留まります。
     統計的アプローチにおいても、学生をサンプルとして調べた結果をその まま高齢者や幼児を含む「一般」へ適応することが誤りであるように、どのような分析結果もどのようなモデルも、限定された状況においてのみその妥当性を主 張するに留まります。したがって、モデルの妥当性は常に、限定された状況においてのみ、その妥当性の検討が行われることになります。
     統計的有意性検定によって「有意」となった結果についても、そうした結果をどのように限定的な(母)集団へ適用することができるのかを明確に認識するこ と、ということでもあります。


  4. 専門領域内妥当性

     研究とは何らかの専門研究者集団(disciplinary matrix)によって社会的に担われるものです。ただし、天動説から地動説へという不連続で断絶的な理論移行が起きたという歴史的事 実 (T.S.クーン 『科学的革命の構造』,1962) から明らかなように、どのような研究であってもその妥当性の判断を、現行の専門研究者集団という現実の研究者群のみを前提として行うわけにはいきません。 旧来の理論と新理論との間に連続性がない場合には、 旧陣営は旧理論の立場に留まっていて、当然ながら新理論を拒否することになるからです。

    *従来の天動説による惑星運動の予測は相当に複雑な計算を必 要としていたようですが、それでも、新理論である地動説による予測値と大差なかったと言われています。そのため、惑星の運動予測という点においては、天動 説をあわてて否定して地動説を採用するといった必然性もなかった訳です。

     ここでいう「専門領域内妥当性」とは、したがって、専門家集団という外的な社会的グループのみを対象とするのではなく、そこから派生するところの「研究 者の内面にのみ存在する、内在 化された専門家集団」という視 点を含まざるを得ません。そのため、「実際の専門家集団」と同時に「理念的専門家集団」という、二つの観点から判断されるモデルの妥当性を「専門領域内妥 当 性」と呼ぶことにします。研究者は、大学や大学院、研究所といったような社会的施設などの物的環境と人的環境において研鑽を積む中で、外在化する専門家集 団とは別に、自らのうちに「理念的専門家集団」を内在化 していくという過程をたどるものと考えます。

    *異端審問所に告発され、宗教裁判において「それでも地球は 回っている…」と自らの内的理念を貫いたガリレオ・ガリレイ(1564―1642)は、その後の一生を幽閉され、両眼を失明するも自説の著作に没頭し、後 に病没。葬儀も墓標も許可されなかったといわれています。

  5. 外的妥当性

     外的な妥当性とは、モデルそのものの妥当性ではなく、そのモデルが描き出している人々や物事や現象について、そのモデルによって指し示されている外的事 実との対応において判断され る、モデルの的確性を指しています。
     統計的アプローチでいう外的妥当性と、質的研究における「外的妥当性」には次のような相違があるので注意する必要があります。

    • 「頻度上の外的妥当性」―  統計的アプローチの場合

       統計的アプローチでは、平均値などの代表値を用いることで、現象がどの程度頻繁に起こったか、それは統計的に有意なほどであったか等々という「頻度上の 外的妥当性」を確認していきます。これはすなわち、簡略的に述べるならば、「数の多さ」を外的妥当性の基準にしていることになります。すなわち、統計的ア プローチでは、数の多い 事柄や現象について、頻回に妥当するモデルに対してのみ「外的妥当性」の検討を行うことになります。

       そのため、特定の個別事例や少数例しか起きない出来事や現象やそうした特定的な人々のあり方については、「統計的アプローチではそうした少数例に関して 外的妥当性の確認を行う能力を備えていない」ことになります。つまり、少数例についての研究に対して「統計的判定を示せないのは科学的研究ではない…」と いったような言い方は根本的に誤っていて、論理的に破綻しているのです。というのは、少数事例を研究する研究者サイドに問題があるのではなく「統計学にそ うし た機 能が欠落していることによる、統計学の原理的限界」のために、小数事例の外的妥当性の検討が不能となっているだけだからです。

       *ちなみに、頻度に対するχ2 検定は少なくとも10数例以上のデータがないと、基本的に有意な結果が得られないことが多いものです。事例数が一桁など、それよりも少ない事例の場合に は、Fisherによる正確確率検定を用いますが、データから一目瞭然なほど偏っている場合でもなければ、やはりほとんど有意にはなりません。
       そのため、有意水準を5%や1%などのように「厳しい数値」にするのではなく、10%〜30%くらいまでを想定することによって、(帰無仮説を早めに棄 却してしまうというリスクを前提として)、対立仮説の採択の可能性を上げておくという「研究設計」も視野に入れておくべきと考えます。こうした観点を導入 するならば、少数事例についての統計的検討もある程度は可能となってきます。

       *「心理学的研究における統計的有意性検定の適用限界」 葛西俊治 (札幌学院大学人文学会紀要 第79号, pp.45-78,2006)において、無作為標本抽出の非現実性、標本母集団の限定性、統計的検定における有意水準の不定性といった問題のため、結果の「一般化」には大き な制約があることが指摘されています。すなわち、統計的アプローチにおける外的妥当性にしても、盤石の判断が下されるのではなく、類比的な意味で妥当性が 主張されているのに過ぎないといえます。


    • 「関連性評定質的分析にお ける外的妥当性」― 質的アプローチの場合

       質的アプローチには様々なものがあるので、それらの全てに該当するかどうかは不明なので、ここでは「関連性評定に基づく質的分析」について、それによっ て得られたモデルの外的妥当性についてのみ述べることにします。
       これまでに示した分析手順によって得られその内容を吟味してきた「要約モデル」については、外的な資料である「逐語録」の内容と構造を可能な限り漏らす ことなくモデルを構築してきている以上、「逐語録という外的資料との対比過程に関して言えば、要約モデルにはその意味での外 的妥当性の検討を行うに足る資格が備わっている」と判断します。(特に、GTAやIPAのようにコード化といった抽象化によってデータから早急に乖離する ことなく、あらゆる記述内容を評価対象としてモデルを構築していることも重要な点です。)
       「外的妥当性」とは、モデル自体の内的な妥当性ではなく、基準となる外的資料との対応性の有無と高低によって判断されるものです。したがって、「要約モ デル」は、その導出過程において少なくとも一つの逐語録を外的素材として用いている以上、「外的妥当性の高低の検討を行うに対象となる資格」をもってお り、「一定の外的妥当性が確認されることが期待される」わけです。

       実際には、「カード化された逐語録」と「要約モデル」とが、どの程度の対応性があるのかを、専門研究者集団によって検討してもらうのが良い訳ですが、す でに述べたように「専門研究者集団」の視線は「{理念的}専門研究者集団」として、現行の研究者に内在化されてもいます。(その視線の鋭さ、確からしさに は個人差が想定されるにしても、です。) こうした事情を考慮に入れることによって、次のように結論づけておくことにします。すなわち…

        「関連性評定質的分析によって示される要約モ デルは、外的資料である逐語録を素材とした検討によって得られてくることから、その分析過程において外的妥当性の確認作業そのものが含まれていると考 えられる。 したがって、得られた要約モデルにはそれなりの外的妥当性が備わっていると判断されるべきである。」

       なお、ここで注意しなければいけないのは、こうした判断を拡大解釈しないようにすることです。たとえば、「外的妥当性があるのだから、この要約モデルに は一般性があって…」といった主張をしているのではなく、「外的事実との対比を丁寧に行っている以上、外的資料との対応性がそれなりに認められるものとし て生成されているはずである」という判断を下しているのです。
       つまり、ここで述べている「外的妥当性」とは、「頻度上の外的妥当性」のことではないので、「得られた要約モデルが数 量的に代表的であり頻回に確認される」と主張しているのではないのです。それと同時に、「関連性評定質的分析」を用いて研究を行えば、「高い外的妥当性が 確認できる」とも主張していません。研究者個々人によって、「関連性評定」がどの程度適確に行われるのか、「ラベル付与」がどの程度適確に行われるかに相 違があるだろうからです。

       そういう点を明確にするためには、「外的妥当性」という言葉を手放しで用いるので はなく、モデル生成に関する「初期段階での外的妥当性」と限定する必要があるといえます。

    • トライアンギュレーション (triangulation)に関わる外的妥当性

       GTAやIPAなどでは、研究者本人だけではなく、他の研究者などによる複数者による判断を重視しています。また、単一のデータだけではなく、複数 (人)のデータを用いることも重視しています。こうした姿勢を、トライアンギュレーション、すなわち「三角測量」と呼んで方法上の要諦としています。常識 的には、なるほどと思える観点ですが、質的アプローチの極限的な研究型式である「単独者からの単一資料に基づく、単独研究者による研究」は、GTAや IPAにおいてトライアンギュレーションが必須とされるならば、方法論的には排除されることにもなりかねません。
       ところで、心理臨床の領域や精神医学の領域では「病跡学pathography」と呼ばれるアプローチが行われてきています。文芸や美術などにおいて秀 でた 作家や芸術家などを対象として、作者の心理臨床学的・精神医学的な位置づけと作品の解析とを試みる学問領域です。病跡学の基本的な研究形態は、おおむね、 「一人の研究者が、一人の作家や芸術家について、複数の作品群を対象として」行われています。もちろん、複数の研究者が共同して研究を行う場合もあります し、複数の作家や芸術家を対象にしたり、あるいは、たった一つの作品を対象とする場合もあるわけです。研究におけるこうした「複数性」と「単数性」のメ リットとデメリットについて以下で考察していくことにします。その後で、あらためてトライアンギュレーションの位置づけを示すことにします。
     
研究の「単数性」と「複数性」について

 研究の単数性あるいは単数的研究とは、「単独の研究者」「単独の資料」「単独の対象者」といったように、「一人」「一つ」「一人」という単数によって研 究が行われることを指すことにします。その極限的な研究が「一人の研究者が、ある一人を対象として、たった一つの資料に基づいて行う」ものです。記述を簡 潔にするために、こうした研究形態を「第一型式」と呼ぶことにします。次に、「一人の研究者が、ある一人を対象として、複数の資料に基づいて行う研究」を 「第二形式」と呼ぶことにします。続いて「複数の研究者が、ある一人を対象として、一つの資料に基づいて行う研究」を「第三形式」と呼ぶことにします。こ れによって、まずは、1)複数の資料を扱う ことの意味、2)複数の研究者が関わることの意味、について考えていくことにします。

 第一型式 「一人の 研究者が、ある一人を対象として、一つの資料に基づいて行う」研究形態
 第二型式 「一人の研究者が、ある一人を対象として、複数の資料に基づいて行う」研究形態
 第三型式 「複数の研究者が、ある一人を対象として、一つの資料に基づいて行う」研究形態
 第四型式 「一人の研究者が、複数者を対象として、複数の資料に基づいて行う」研究形態
  *第四形式は2008年紀要で追記された形式です。詳細については「「第二形式・第四形式質的研究の例」をご覧下さい。(7/7,2008)

 心理面接における一回の面談において逐語録やメモなどが得られたとき、時間的・状況的・内容的な意味での一回性とそうした限定性に基づいて、「一つの資 料」とみなすことになります。心理面接が複数回行われると、それに伴って「複数の資料」が得られてくることになります。つまり、初回面接後の状況は「第一 形式」の研究事態であり、複数回後の状況は「第二形式」の研究事態となります。その後、ケースカンファランス、すなわち、事例研究会と呼ばれる集まりで は、「ある一人を対象として」、面談者がその事例について複数の資料を元にして、複数の専門家や同僚と共に対象となった人の理解を進めていくので、そうし た事態は第三型式に始まり、次に第四型式と呼ぶべき状況へと進展します。

  質的研究は、多数回とか多人数といったような頻数を前提とする研究方法ではありません。むしろ、頻度を前提とはできない領域だからこそ、そ うした領域にふさわしい研究形態として新たに展開してきたといえます。ここでは、「関連性評定に基づく質的分析」では、どのようにして「第一型 式」研究、「第二型式」研究、そして「第三型式」研究を進めるのかを以下に示しておきます。

 「第一型式」研究形態
  • カード化された言語資料の関連性評定
  • カードとラベルの対応表を入力データとする、林の数量化理論V類による分析
  • 同じく、長田の形式概念解析(FCA: Formal Concept Analysis)による分析
 
 「第二型式」研究形態
  • カード化された複数の言語資料について、単独者による関連性評定
  • 個々の評定結果についての数量化V類による分析
  • 個々の評定結果についての形式概念解析
  • 複数資料からのすべての「上位ラベル」を対象とする第二次関連性評定
  • 第二次関連性評定に関する数量化V類による分析
  • 第二次関連性評定に関する形式概念解析

 「第三型式」研究形態
  • 単一言語資料のカード化
  • カード化された資料に対する複数者による関連性評定
  • 個々の評定者による評定結果について、数量化V類による分析
  • 個々の評定者による評定結果について、形式概念解析
  • 個々の評定者による評定結果に基づく、対象カード間「距離行列」の作成
  • 複数者による「距離行列」から「平均距離行列」の作成
  • 「平均距離行列」に関する多次元尺度法による次元構造の分析
  • 複数の評定者によるすべてのラベルリストを用いた形式概念解析
 


 これまでの質的研究は、おおむね、一切の数量的処理を 含んでいないアプローチであるため、ここに示した研究の実際的方法が「林の数量化理論V類」と「多次元尺度法」という数量的アプローチを含んでいるのは 「質的研究」という術語に反しているかのように見えるかもしれません。しかし、「数量的アプローチ」の本質的で実際的な意義は、頻度的なデータに基づいて 「統計的有意性検定」が実行できることにあります。それに対して、関連性評定による「ラベルリスト」という質的結果について、質的データについての数量的 解析である「数 量化理論V類」を用いることや、対象間の関係に類似度や相互距離を発想して空間配置を行う「多次元尺度法」を用いることは、本来、質的データに対する分析 法として展開されてきた経緯から、自然な適用といえます。また、最近、研究が展開されてきた「形式概念解析」が長田氏のプログラムによって実際に使用でき るようになったので、「対象である記述 カードとそれらに対して付与されたラベルとの関係」の論理的構造把握を行うことは、純粋に質的分析方法として注目されるところです。なお、関連性評定によ る空間配 置という 「質的結果」は、形式概念の領域で言う「概念束concept lattice」という構造をとるので、形式概念解析にふさわしいデータ形態となっています。

 *数量化理論V類や多次元尺度法による分析とは、ラベルの空間上の 座標を算出するものです。それに対して、関連性評定では、カードの空間配置を行 うことによって、結果的に空間上の位置が与えられていきます。そうした空間配置を入力データとして、数量化理論V類や多次元尺度法による分析によって、 「再度、空間配置を行っているのではないだろうか?」という指摘がなされたことがありました。確かに、関連性評定によって「空間配置」(以下、結果として 得られた「空間配置」を「布置 constellation」と呼ぶことにします)が得られているように見えますが、実際に得られているのは、「カード間の部分的距離関係」あるいは 「カード間の部分的類似性関係」だけであって、カード全体の布置が得られているわけではありません。正確に言うならば「ラベルに基づく、カードの包含関 係」あるいは「概念束と呼ばれる構造」が与えられているだけです。したがって、数量化理論や多次元尺度法によって得られた多次元の座標値に基づい てカードとラベルをあらためて眺めてみることには積極的な意味があるわけです。

 このように「数量化理論V類」「多次元尺度法」という質的数量解析法と、「形式概念解析」という論理的関係構造の解析法を分析手法として導入することに よって、「関連性評定質的研究」は、逐語録などの言語資料についてのより適切な「要約モデル」を生成するアプローチとして位置づけられるのです。

 そして、より適切な「要約モデル」を生成することを通じて、次の段階では、そこに事柄の因果関係や推移関係、対比関係を導入することによる「解釈モデ ル」を生成 することへと進み出ること、さらに、生成した「解釈モデル」の外的妥当性の確認のために、数量的あるいは質的アプローチによって、事実との対比を行ってい くと いう研究プロセスが可能となっています。また、「解釈モデル」に基づいて、「それでは実際に現場でどのように対応していったらよいのか」といったような実 際的対 応についての「現状評価モデル」を生成するという、一連の研究プロセスが視野に入ってくるのです。




「関連性評定に基づく質的分析」における内的および外的妥当性につい て

葛西俊治, 2007

[サイトのトップに戻る]