井出草平の研究ノート RSSフィード

2017-04-17

[]コーエンのκ係数

最も有名な一致係数である。扱うことができるのは名義尺度・順序尺度である。評価者が2名のものが基本だが、κ係数は3名以上に拡張されたバージョンも存在する。Cohenのκ係数というと評価者が2名の場合を指す。


κ係数の目安としてよく使われるのはLandis and Koch (1977)によって示されたものだろうか。

0.0〜0.2: わずかに一致(slight agreement)

0.21〜0.40 まずまずの一致(fair agreement)

0.41〜0.60 中等度の一致(moderate agreement)

0.61〜0.80 かなりの一致(substantial agreement)

0.81〜1.0 ほぼ完全、完全一致(almost perfect or perfect agreement)

Krippendorff (1980)にも基準が掲載されている。

0.67未満 評価しない(discounted)

0.67〜0.80 不確かな結果(conclusions tentatively)

0.80以上 明確な結果(definite conclusions)

Landis and Koch (1977) に比べて厳しい内容である。ともあれ、一致度は0.8以上が目安になるという内容である。

もちろん、この基準には根拠が明確にあるわけではないが、0.8という基準はよく使われている。また、論文などに記載するときには、一般的に認められている水準というような「これが私たちの常識だよ」的な記載がよく見られるが、これらの文献を引用した方が恰好がつくように思う。


CohenのκはSPSSで計算可能である。

評価者を列、ケースを行のデータセットを作る。

f:id:iDES:20170417145042j:image


[分析]→[クロス集計表]で、図のように行列を設定し、統計量の中の「カッパ」をチェックすると出力される。

f:id:iDES:20170417145055j:image


なお、SPSSで計算できるのはノーマルなCohenのκで、重みづけκは出せない。

CohenのκはRのirrパッケージで計算ができる。irrパーッケージは重みづけκも計算ができるので必要がある場合は、Rを使うことになるだろう。


irrパッケージ

https://cran.r-project.org/web/packages/irr/index.html

https://cran.r-project.org/web/packages/irr/irr.pdf (pdf)

library(irr) # irrの読み込み

rater01<-c(1,2,1,2,1,1,2,2,1,2,1,1,1,2,1,2)

rater02<-c(2,2,2,1,1,1,2,1,1,1,2,1,2,2,2,2)

d1<-cbind(rater01, rater02)

kappa2(d1)

重みづけのオプションは"equal", "squared"の2つ。"unweighted"がデフォルト値で重みづけなしを意味している。

kappa2(d1, "squared")

equalはすべてのレベルで評価者間の不一致が均等に重み付けされ、squaredは不一致は完全合意からの自乗距離に応じて重み付けされる。

重みづけκの使用を検討するのは、評価が多段階である場合だ。

日本語で以下に解説がある。

http://www.med.osaka-u.ac.jp/pub/kid/clinicaljournalclub12.html


以下、数式を記載する。

κは次のように定義される。

¥kappa ¥equiv ¥frac{p_o - p_e}{1 - p_e} = 1- ¥frac{1 - p_o}{1 - p_e}, ¥!

ここでのp_oは観察者の間で相対的に観察された一致度であり(正確度と同一)、p_eは観察されたデータを用いて各カテゴリーをランダムに観察者の確率を計算する仮説の確率一致である。

P_eは、カテゴリーをk, 項目の数をNn_{ki}、評価者の数をi、予想されるカテゴリーをkとすると下記の数式となる。

 p_e = ¥frac{1}{N^2} ¥sum_k n_{k1}n_{k2}

文献

2017-04-14

[]クリッペンドルフのα係数

一致率を計測する際に使ったクリッペンドルフのα係数(Krippendorff's alpha coefficient)のメモ。

一致率というとCohenのκ係数が有名だが、κ係数は評価者が2名という限定がある。

クリッペンドルフのα係数は1)評価者が3名以上に対応し、2)比例・間隔・順序・名義尺度それぞれのオプションが用意されているという点で優れている。

Krippendorff's alpha

https://en.wikipedia.org/wiki/Krippendorff’s_alpha

日本語の解説はないが英語は割と充実している。

他の一致率の統計量と同じで、-1〜1の間の値をとり、1が完全一致で、-1が完全不一致である。


Krippendorffのαを出すにはいくつかの方法が用意されている。


SPSS, SAS, Mplus

http://afhayes.com/spss-sas-and-mplus-macros-and-code.html

Andrew F. Hayesによってマクロが作成され無料で公開されている。

Download KALPHA: kalpha.zipダウンロードする。zipファイルの中に3つの統計パッケージのマクロが入っている。


・R

パッケージirrで計算ができる。

https://cran.r-project.org/web/packages/irr/index.html

https://cran.r-project.org/web/packages/irr/irr.pdf (pdf)

基本形は以下のようなコマンドラインだ。

kripp.alpha(x, method=c("nominal","ordinal","interval","ratio"))

分析例

# irrの読み込み

library(irr)

# データの作成

d1<-c(1,1,1,1,2,1,1)

d2<-c(5,4,5,5,4,4,5)

d3<-c(4,5,4,4,4,4,5)

d4<-c(1,2,1,1,1,1,1)

d5<-c(1,1,1,1,1,1,1)

d6<-c(4,3,3,4,2,4,1)

d7<-c(4,4,4,4,4,4,4)

d8<-c(1,1,2,1,1,1,1)

d9<-c(1,1,1,1,1,1,1)

d10<-c(3,2,3,3,3,3,3)

d11<-c(4,3,4,2,4,4,1)

d12<-c(1,1,1,1,1,1,1)

d<-cbind(d1,d2,d3,d4,d5,d6,d7,d8,d8,d9,d10,d11,d12)

# Krippendorffのα係数の算出(順序尺度として計算)

kripp.alpha(d,"ordinal")

Krippendorff's alpha

Subjects = 13

Raters = 7

alpha = 0.838

評価者は行にして、ケース列としてデータを入力する。分析例だと7人の評価者でケースは12例ということになる。

α係数は0.838とそこそこ高い値が出ている。

そこそこ高いと書いたものの、どの数字以上が高い数字なのかは、特に基準があるわけではない。研究分野によってだいたいの相場感があるので、それを目安にすることになるだろう。

分析例は順序尺度として計算をしたがオプションを"nominal"にすると名義尺度の計算ができる。比例尺度、間隔尺度の場合も同様にオプションを変えれば計算が可能である。

2017-03-19

[][]日本人の精神力が弱まった

野村総一郎
メディア用語としての"新型うつ病"のその後 (特集 臨床現場から見た精神疾患の変貌)
臨床精神医学 45(1), 37-42, 2016-01 

 中島は日本人に備わっていた「徳」(善や正義をつらぬく人格的能力)と「仁」(おもいやり, いつくしみ)が失われたことを指摘する。幼少児期には誰でも自己愛的なものだが,大人に成長してそれを克服し,徳や仁,忍耐を身に付ける。しかし,そのプロセスが現代人に欠如し自己愛が肥大したこと,自分の外からストレスがやってくる,という外在化の考え方が強くなり,自助能力が低くなったこと,などを指摘し,総体として日本人の精神力が弱まったことを原因の1つ(後の2つは精神病理学の衰退と,SSRIを中心とした薬物療法中心主義)としている。これは非常にストレートな言い方であるが,「よく言ってくれた!」と膝を打つ人も多いのではなかろうか?

中島の「日本人の精神力が弱まった」に野村総一郎は「よく言ってくれた!」と膝を打ったようだが、これでは、100時間働いて身体の調子が悪くなった人を「心が弱い」と言っているのと同じである。あまりにもひどい言いようである。

そもそも日本人の精神力が弱まったエビデンスでもあるのだろうか。

昔の日本人には徳や仁があったというのは、近年の右翼的な言動である。徳が「善や正義をつらぬく人格的能力」であり、その能力が日本人にあったならば、昔の日本人は東アジアの国々を相手に戦争をして、人殺しなどしなかったと思うのだが。それとも東アジア人はおもいやり、いつくしむ対象ではなかったのであろか。


「新型うつ病」のデタラメ (新潮新書)

「新型うつ病」のデタラメ (新潮新書)

2017-03-17

[]パス図を描くソフト−Pencil

パス図を描くソフトを探していると、いろいろな手段があることがわかった。

その一つ、Pencilを紹介。Nightly buildだが、Windows以外にも対応しているようだ。

PENCIL PROJECT
http://pencil.evolus.vn/

試しにパス図を書いてみた。



f:id:iDES:20170317145331p:image



わりと簡単に作成できる。パーツを移動すると、矢印も一緒についてくるなど操作性もいい。

出力形式はpngsvgの2種類だ。通常はpngで十分だと思う。svgはベクター画像なので、曲線がカクカクになりにくいなど有利な場合もあるが、Wordなどで使うには少し厄介だ。svgを使う場合には、Inkscapeで一度svgファイルを開いて、オブジェクトとしてコピーしてWordに貼り付けるという手順を踏むできるらしい(参照)。

LaTexの場合もInkscapeが必要だそうだ。もちろんpngで保存していればLatexでそのまま使えるので特に悩む必要はない。

svgの場合は、Inkscapeで開いてから、epspdfに形式を変換して使用するそうだ(参照)。であれば、最初からpngでやった方が効率的だろう。

2016-08-09

[]シーハン障害尺度

シーハン障害尺度は仕事/学校、社会、家族という3つの相互に関連のある領域における機能障害の評価をするツールである。自記式(Self-Report)である。

Sheehan Disability Scale (SDS) - Overview

http://www.cqaimh.org/pdf/tool_lof_sds.pdf

http://www.medical-outcomes.com/index/sds

この概要の2ページ目にあるのがシーハン障害尺度の本体。

日本語は下記の論文信頼性・妥当性が確認されている模様。

Sheehan Disability Scale(SDISS)日本語版の作成と信頼性および妥当性の検討

著者:吉田卓史・大坪天平土田英人

資料名:臨床精神薬理 巻:7 号:10 ページ:1645-1653

発行年:2004年10月10日

http://jglobal.jst.go.jp/public/20090422/200902218806750007

非常に簡便である。自記式である点はWHODASなどのQOL尺度と同様であり、一部質問項目も似たものも含まれる。

シーハン自身が1966から2007年までのシーハン障害尺度のレビューをしている。

Sheehan KH, Sheehan DV. Assessing treatment effects in clinical trials with the discan metric of the Sheehan Disability Scale. Int Clin Psychopharmacol. 2008;23:70–83.

http://www.ncbi.nlm.nih.gov/pubmed/18301121

    
この日記のはてなブックマーク数
はてなRSSに追加