修正箇所

  • P.13(修正予定)
  • 6行目、11行目、3項目--->2項目
    最後の行、「天気屋...は...AB型が多い。また」を削除。
  • P.14表(修正予定)
  • 「天気屋である」行を削除。(この項目は有意差はないため)
    P.15 10行目、3項目--->2項目

    [理由] これは木地さんの卒論の計算ミスをそのまま書き写していたため。「最新コンピュータ診断性格テスト」では有意差がないと計算結果を示して正しく記述していた。これは言い訳。

  • P.15(修正予定)
  • 「ここではカイ自乗検定を60個の仮説に繰り返した。1回の検定は5%以下の危険率(いわば外れ率だが)60回もやれば5% + .. = 300%以下の危険率になってしまう。これでは60項目のうち3項目くらい、有意になってもちっとも不思議ではない。」

    --->ここでは5%水準のカイ自乗検定を60回も繰り返した。1個の帰無仮説が誤って否定される確率は5%以下だが、60個の帰無仮説となると事情が異なってくる。少なくとも1個以上の帰無仮説が誤って否定される確率は、ずっと大きい(その確率は不明だが、5%の60倍以下である。それで、このような場合には、危険率を5÷60%に調整して検定する方法がある)。つまり、単純な検定を60回も繰り返せば、2項目くらい有意になっても、ちっとも不思議ではない。

    [理由] 心理学の基礎メーリングリスト(fpr)でさまざまな有益な意見をいただいた。特に間違った記述ではないので、修正しなかったが、6刷から以上のように修正することにした。意見を採録しておく。

    豊田さんの意見  「独立な確率事象で例をつくりその場合「少なくとも一回,第1種の誤りを犯す確率は 1-(1-0.05)**24 であり5%よりずーっと大きい」と説明するか,正面きって(オールマイティな)ボンフェローニの方法の解説をするかのどちらかのほうが良いように思いました」一時、修正案を考えたが、南風原朝和さんからの「同じ被験者について項目を変えただけの検定の結果は互いに独立にはならないと思います。そのため,独立性を前提とした計算は成り立たないように思います。」という意見があった。その通りなので、修正は取りやめた。

    南風原さんの修正案  「ここではカイ自乗検定を60回も繰り返した。1回の検定は5%の危険率(いわば外れ率)であり,単なる偶然によっても20回に1回は,有意な結果が得られるという仕組みになっている。この研究では60項目のうち3項目が有意になったということだから,血液型人間学が成り立たないときに,単なる偶然によって有意な結果が出る割合とちょうど一致している。つまり,この結果は,「血液型人間学は正しくない」という仮説とぴったり合った結果と言える。」しかし、一般書としては言い回しが難しくなってしまうし、結論は変わらないため修正しなかった。

    岡本さんの意見  「このような場合はシミュレーションが便利です。個人内での項目間は独立ではないとしても、その関連をモデル化することができるのであれば、そのモデルに基づいてシミュレーションができます。個人内での項目間の関連をモデル化するだけの情報がない場合は、帰無仮説が「血液型間で差がない」ということであれば、個人を血液型間でランダムに入れ替えてシミュレーション(randomization test)を行うことができます。」多重比較の推論を一般向きに表現するより、一番わかりやすい案かもしれない。しかし、既に元のデータは失われているし、統計学の演習なら興味深いと思うが、ソフト作成の手間がかかるので現実的ではない。

    なお、ボンフェローニの定理とは、k個の仮説の多重比較をする場合、有意水準をα/kに調整して行えばよいというもので、やや保守的である。「60回もやれば5% + .. = 」という表現は、統計家には不評だが、本質的には同じであると考えた。なお、帰無仮説の集合やそれらの論理構造を考慮すると、もう少し有意水準を大きめに調整できるが、統計的推論は難しくなる。専門書は永田・吉田「統計的多重比較法の基礎」(サイエンティスト社、1997年)がある。6刷での修正案はこの定理に沿って一般向きに表現したものである。

  • P.24 「先に述べた検定の多重性」--->「検定の多重性」
  • [理由] 本書では多重検定の考え方を特に説明していないため。

  • P.174 「日本語でも5因子であることを初めて実証した。」--->「日本語でも5因子であることを実証した。」
  • [理由] 柏木さんからのクレーム。辞書研究に基づいて探索的因子分析法で5因子であること確認したのが初めてという意味で、最初に5因子研究をしたという意味ではない。日本語での5因子研究は、確認的因子分析法による柏木・和田・青木(1993)にさかのぼる。詳しくは「性格は五次元だった」を見ていただきたい。

  • P.212 Pf値の説明の差し替え
  • 「これを憂えた柏木は、曲線の変動量を客観的に計算しようとした。ところが、一万人データの平均作業曲線は安心して使える代物ではない。ある個人の全体作業量は30行の加算作業の結果である。全体作業量は安定した値であるが、各行の作業量は不安定である。そこで、全体作業量を利用して各行の作業量を数学的に推定すれば、サンプルの違いに左右されないはずである。そこで、信頼できる基準データを用いて平均作業母曲線を算出した。

    まず、ある個人の一回目の作業量と一回目の期待作業量の差を考える。差はプラスでもマイナスでも良いので、これを2乗する。これが一回目の変動量である。変動量は作業水準で割り増したり割り引いて解釈しないといけない。それで、この値を一回目の期待作業量で割っておく。内田クレペリン検査では一桁の足し算を30回する。それで30回分を足し合わせれば良い。これがPf値である。」

    脚注14文献変更 柏木繁男 「内田クレペリンにおける解析的評価法」金子書房、1975.

    脚注15「基準集団を用いて作業母曲線を決定し、」を削除。

    [理由] 柏木さんから説明が不正確であるという指摘を受けた。一万人データは当てにならないので、作業量という安定した指標に基づいて各行の作業量を線形回帰方程式を解いて求める。いくつかの基準集団からパラメータ値を算出すると、安定した結果が得られる。一般書なので専門用語を使わないで表現した。詳しくは引用文献を見ていただきたい。

  • P.216- 性格表現用語との関係の説明の差し替え
  • 「前章でも触れたように、最近では、基本的な性格の次元は、外向性、協調性、勤 勉性(良識性)、情緒安定性、知性の五つであるというビッグ・ファイブ仮説が広 く認められるようになった。このビッグ・ファイブモデルから内田クレペリン検査 を評価したのが、柏木と山田の研究である。

     被験者は370名。まず、80語の形容詞を因子分析して、ビッグ・ファイブの 性格特性を測定するための形容詞を各10語選んだ。これが性格特性側の指標であ る。一方、内田クレペリン検査の方の指標は、平均作業量、変動量Pf値、作業量 と期待作業量との相関など、計九つの指標である。

     その上で、性格特性の指標と内田クレペリン検査の指標の相関をとってみた。そ の結果は、作業量と勤勉性が−0.15、作業量と外向性が−0.12、変動量と 勤勉性が0.16、変動量と情緒不安定性が0.14など、統計的には5%水準で 有意であるが、相関係数の値が小さく、対応付けに成功したとはいえない。

     ビッグ・ファイブの五つの性格特性を一つの因子にし、内田・クレペリン検査の 指標九つを一つの因子にして相関(正準相関係数)を求めると0.38となった。 関係性は認められたが、因子そのものの意味はわかりにくい。

     柏木らは、ビッグ・ファイブ関係の形容詞と内田クレペリン検査の指標の単純相 関も分析した。5%水準で有意な相関係数は0.10以上であるが、相関が0.2 0以上の形容詞を挙げてみよう。

      ●作業量では、「頭の回転の早い」(0.21)、「気まぐれな」(−0.2 4)であった。相関が0.10以上の形容詞を数えると、外向性1、協調性0、勤 勉性6、情緒安定性2、知性4である。

      ●変動量Pf値では、「話し好きな」(0.21)、「勤勉な」(−0.2 0)、「気まぐれな」(0.20)だった。相関が0.10以上の形容詞の数で は、外向性3、協調性2、勤勉性9、情緒安定性4、知性3である。

     作業量では「頭の回転の早い」と自己評価する人は作業量が多く、「気まぐれ な」と自己評価する人は作業量が少ないのは納得できる。形容詞の数からは、勤勉 性と知性に関係がありそうである。

     変動量の方は勤勉性と関係がありそうだ。「勤勉な」人は変動が少なく、「気ま ぐれな」人は変動が多いというのも一応は納得できる。ただし、それ以外の性格表 現用語とも関係するので、はっきりとはわからない。

     0.21の相関を持つ言葉に「話し好きな」がある。これは外向性性格を記述す る言葉である。もしかすると、アイゼンク理論が当てはまる証拠かもしれないが、 やはり相関係数の値は小さ過ぎる。

     情緒安定性の言葉では「不安になりやすい」(0.15)、「情緒的に安定し た」(−0.15)があるが、同様にあまりにも相関が小さい。

     結局、柏木らは内田クレペリン検査の指標とビッグ・ファイブの性格特性との関 係を調べ、無相関でないことは証明したが、その相関は非常に小さかった。マクロ 的には内田クレペリン検査の指標は性格と関係があることを証明したが、それが何 を意味するかは、はっきりしない。内田・クレペリン検査の指標と個別の形容詞と の相関係数の値も0.20前後にとどまっていて、ここから各指標の意味を確定す るのも困難である。

     この研究の大きな欠点は5因子モデルとの関係を調べると言いながら、個別の形 容詞との関係を調べてしまったことだ。性格特性とはさまざまな行動特徴を集めた ものである。個別の言葉ではなく、外向性なら外向性に関する言葉の集合を取り上 げないといけない。それで、性格特性5因子との関係を求めたが、もちろん、ほと んど相関はなかった。だから、個別の言葉との関係を取り上げたという訳だ。しか し、その値も0.20前後にとどまっている。

    [理由] 柏木さんから「相関が0.10以上の・・・統計的な有意水準にも達していない」は間違いで、5%水準で有意である、「日本・精神技術研究所とは袂を分かっていない」、「FFM研究所とは無関係である」という指摘を受けた。また、研究の紹介が一面的であるとの指摘を受けた。それで、因子分析結果と正準相関分析結果を追加し、全体を書き直した。ここでも一般書であるので、正準相関分析という手法の説明は避けた。興味のある読者は多変量解析の専門書を見ていただきたい。

  • P.219 総括 第二項の修正
  •   ●変動量は勤勉性や情緒安定性とは関係するが、その関係性は非常に小さい。また、信頼性係数は0.3から0.5程度で、心理テストとしては使える水準ではない。

    [理由] 変動量と外向性の関係を確認した研究はないし、変動量と情緒安定性は柏木さんの研究では出ている。しかし、相関の値が小さいので、変動量を情緒安定性としては解釈できない。妥当性が確認されたGHQ(一般健康調査票)などとの相関を求めるべきである。そして、その場合、ほとんど無相関という結果がでるだろう。結局、変動量はいったい何を意味するのか、わからない。

  • P.224
  • 「・・・そんなもの、公表できないよな。」 ------> 「そんなもの、宣伝には使えないよな。」

    [理由] 柏木さんからリクルートのMessageという文献をいただいた。妥当性の研究紹介があったので「公表していない」は事実誤認になるので訂正した。