next up previous
: ノンパラメトリックな信号検出理論 : 信号検出理論の指標をめぐって 1 : オリジナルの信号検出理論による指標


ROC曲線による指標

ROC曲線とは

ROC(receiver operating characteristic)曲線は,受信者動作特性曲線・等感受性曲線などと訳されるものである. ある$d'$に対して,フォールスアラームの比率を横軸に,ヒットの比率を縦軸にそれぞれとり,$¥beta $$-¥infty$から$¥infty$まで操作すると,曲線が描かれる.これがROC曲線である.その例を図2に示す.それぞれの$d'$について,ROC曲線が描かれている.これら線上の,被験者の反応にかかっているバイアスに対応した位置に成績がプロットされる.

図 2: ROC曲線の例
¥resizebox {¥figwid}{!}{¥includegraphics{TSDF2.EPS}}

このROC曲線からは先述の等分散性の仮定を検証することができる 3. さらにそれが満たされていない場合でも,得られたROC曲線のパラメータを元にそれを補正した指標を得ることができる. 以下ではこのROC曲線を書く方法を2種類紹介し,その後にそこから算出される指標を解説する.

ROC曲線の描き方

バイアスを操作する

1つは何種類かのバイアスがかかる状況でデータを取り,それをプロットしてROC曲線を描く方法である.バイアスのかかる状況とは,具体的には刺激+ノイズの試行での正答の報酬とノイズのみの試行の正答での報酬とに差をつけたり,それぞれの出現確率を変えた状況である.前者においては報酬の高い方を多く答えるというバイアスがかかるであろうし,後者では出現確率が高い方を多く答えるというバイアスが期待される. 複数の異なるバイアス下で得られた成績をプロットすれば,ROC曲線が得られる.

評定させる

もう1つの方法は,被験者の反応を評定によってとる方法である(Pollack & Decker, 1958; 御領,1973,68-69).被験者の反応カテゴリーを刺激あり/なしの2段階にはせず,例えば「確実に(刺激が)ある」「あるようだ」「分からない」「ないようだ」「全くない」の5段階の評定をさせる.「確実にある」を5とし,「全くない」を1とすると,この評定値は被験者内の心理量を反映したものだと考えることができる. これをさらに上で説明した方法のように,2段階のあり/なしの答えに分割し直すとしよう.つまり,評定値5をありとみなし4以下をなしとみなす,評定値4・5をありとみなし3以下をなしとみなす,というようにである.この時の分割の基準は,先に説明した被験者の反応を決定する基準値と同じものとみなせる.つまり,評定を二分する基準を操作することは,被験者のバイアスを擬似的に操作することになる. 一般に評定が$n$段階であれば,$n-1$個の点が打てることになる.
このような評定させる方法で書かれたROC曲線を,タイプ2のROC曲線(type II ROC curve)と呼ぶ(Lockhart & Murdock, 1970).一方上述のバイアスを操作する方法で求めたROC曲線はタイプ1のROC曲線(type I ROC curve)と呼ぶ. ROC曲線はその名の通り曲線であり様々な判断がしにくい.そこでヒットの比率とフォールスアラームの比率とを$Z$得点化する.それをプロットすると直線にのるので,直線回帰など様々な手法を適用できる. この直線化されたROC曲線の傾きは,刺激+ノイズ分布の分散とノイズ分布の分散との比と等しい.したがって等分散性が満たされていれば1を示す.これによって等分散性の仮定を検証できる.

ROC曲線から導かれる指標

上記の方法を用いて求められたROC曲線から導き出される指標が,幾つか提案されている. これらは等分散性の仮定が満たされていないという状況において,それを補正することができる.

$d^{¥prime }$との比較が可能な指標

まずあげられるのは,$¥Delta_{m}$という指標である(御領,1973,67; 田中・上村,1969,122).この指標は,ヒットが0.5であるとき($Z$得点であらわすならば0であるとき)のフォールスアラームの値の$Z$得点である.大抵は回帰分析によって求めた傾きを併用して記述する.ROC曲線の傾きを$S$であらわすと, $D(¥Delta_{m},S)$と記述する. この指標を書き直すと $¥Delta_{m}=Z_N-Z_{SN}/S$とあらわされる.式(1)と比較すれば,この指標はノイズ分布の分散を基準として 4 補正された$d'$とみなせることがわかる(Gescheider, 1985, 100-106). ROC曲線と負の対角線との交点から得たヒットの比率とフォールスアラームの比率から算出された$d'$を指標に使うこともある.$d_{e}'$であらわすと,先述の$¥Delta_{m}$とは式(3)であらわせる関係を持つ.
¥begin{displaymath}
d_e^{¥prime }=2¥Delta _{m} ¥frac {S} {¥left( 1+S ¥right)}
¥end{displaymath} (3)

また,$Z$得点化したROC曲線と原点との距離に$¥sqrt{2}$を乗じた指標 $d^{¥prime}_{a}$もある.このROC曲線と原点との距離は,後述の$A^{¥prime}$$Z$得点化した値とみなすことができる(Simpson & Fitter, 1973).

ROC曲線より下側の領域の面積

このROC曲線を2択の強制選択課題によって得られたものと仮定すると,単位正方形の中でのROC曲線よりも下側の領域の面積は,その課題での正答率とみなせることが証明されている(Green, 1964; 田中・上村,1969, 112-116).したがって求められたROC曲線からその面積を求めて,それを正答率とみなすことができる. この面積は陽に評価することはできないので,なんらかの方法で近似的に求めることになる.その方法は様々考えられる.このような場合良く用いられるのは台形法などの数値積分の手法である.後述する$A^{¥prime}$は,正規性の仮定を用いないで幾何学的にこの面積を近似する方法である.またDorfman and Alf(1969)は最尤推定法を用いる方法を提案している. この面積を算出するコンピュータプログラムが幾つか作成されている.無料で手に入るものとしてはMetz(1993)やAlf and Grossberg(1987)などがある.

実例

タイプ2の方法については上記の説明だけでは把握しにくいので,具体例をあげて説明する. 例えば表1(a)のような結果を得たとする.横軸は被験者の評定値で,縦軸は刺激を提示したかしないかであり,表内の数値は,ノイズ+刺激とノイズのみのそれぞれにおける全「刺激あり」反応中の,それぞれの評定値毎の割合である. まず縦軸の各カテゴリ内でそれらの累計比率を求める.これが表1(b)である.そうするとこれは,刺激あり/なしに分割し直す基準をそれぞれの評定値の間に置いた場合の,ヒットとフォールスアラームの値となる.つまり,被験者の基準値が5と4の間,4と3の間,3と2の間,2と1の間であるとみなした場合のそれぞれの成績である.これらからそれぞれの成績を再構成すると表1(c)-(f)のようになる.これらがそれぞれROC曲線上の4つの点となるので,ROC曲線を描ける.この例をグラフ化したものを図3に,それを$Z$得点化して直線にしたものを図4(比率のそれと対応を取りやすいように両軸の正負の方向を逆にしてある)に示す.
表 1:評定からROC曲線を求める例 [評定値データ]
  刺激+ノイズ ノイズのみ
0.40 0.18
0.32 0.24
0.18 0.24
0.09 0.22
0.01 0.11
[評定値データの累計]
  刺激+ノイズ ノイズのみ
0.40 0.18
0.72 0.42
0.90 0.66
0.99 0.89
1.00 1.00
[基準値を評定値5と4の間として得られた成績(カッコ内はその比率に対応した$Z$得点)]
  刺激+ノイズ ノイズのみ
刺激あり反応とみなす 0.40
(0.25)
0.18
(0.91)
刺激なし反応とみなす 0.60 0.82
[基準値を評定値4と3の間として得られた成績(カッコ内はその比率に対応した$Z$得点)]
  刺激+ノイズ ノイズのみ
刺激あり反応とみなす 0.72
(-0.58)
0.42
(0.21)
刺激なし反応とみなす 0.28 0.58
[基準値を評定値3と2の間として得られた成績(カッコ内はその比率に対応した$Z$得点)]
  刺激+ノイズ ノイズのみ
刺激あり反応とみなす 0.90
(-1.28)
0.66
(0.45)
刺激なし反応とみなす 0.10 0.34
[基準値を評定値2と1の間として得られた成績(カッコ内はその比率に対応した$Z$得点)]
  刺激+ノイズ ノイズのみ
刺激あり反応とみなす 0.99
(-2.21)
0.89
(-1.23)
刺激なし反応とみなす 0.01 0.11

図 3: 評定データ例によるROC曲線(比率).
¥resizebox {¥figwid}{!}{¥includegraphics{TSDF6.EPS}}

図 4: 評定データ例によるROC曲線($Z$得点).$x,y$軸の正負を反転してある(本文参照).
¥resizebox {¥figwid}{!}{¥includegraphics{TSDF5.EPS}}

またこのROC曲線を$Z$得点化したものを回帰分析したパラメータから,上で説明した指標を算出できる. まずこの例に当てはまる回帰直線を算出すると, $y=1.1462x-0.8031$の式を得る(図4中に点線で示してある). これよりまず$¥Delta_{m}$を求めるためこの式に$y=0$を代入すると, $¥Delta_{m}=0.7007$が得られる.この指標は一般には傾きも併記する.その時は $D(¥Delta_{m},S)=0.7007, 1.1462$とあらわす. $d'_{e}$$¥Delta_{m}$と傾きから求められる.それぞれを式(3)に代入し, $d'_{e}=2¥times0.7007¥times(1.1462/(1+1.1462))=0.7484$が得られる. $d^{¥prime}_{a}$は求めた直線と原点との距離から求める.点と直線の距離の公式を用い $d^{¥prime}_{a}=¥sqrt2 ¥times ¥left¥vert 1.1462 ¥times 0 - 1 ¥times 0 - 0.8031 ¥right¥vert / ¥sqrt{1.1462^2 + 1^2}= 0.7467$と求められる. またROC曲線よりも下の領域の面積を求めるには様々な方法があるが,ここでは台形法で近似する.計算過程は省略するが,この例からは$0.6992$が得られる.
next up previous
: ノンパラメトリックな信号検出理論 : 信号検出理論の指標をめぐって 1 : オリジナルの信号検出理論による指標
tbs-i@mtg.biglobe.ne.jp