データの科学

データの科学 (シリーズ データの科学)」複雑な現象を科学的に取り扱おうとしたときの一番の限界は、やはり測定手段の限界だということを再認識。

データの科学 (シリーズ データの科学)

データの科学 (シリーズ データの科学)

質的データを統計的に処理可能にした数量化理論を築いた林知己夫氏が、いままでの研究を総括した本です。どちらかといえば、統計学、特に社会調査分野を科学哲学的に見つめ直した本なので、ある程度前提知識がないと、著者の意図が理解し難いかもしれません。具体的にデータの科学とは何かについては、続巻の「調査の実際―不完全なデータから何を読みとるか (シリーズ データの科学)」の方が取っつきやすいと思います。
調査の実際―不完全なデータから何を読みとるか (シリーズ データの科学)

調査の実際―不完全なデータから何を読みとるか (シリーズ データの科学)

社会現象を科学的に取り扱おうとすると、金融市場やWebサービスのように比較的データの入手しやすい分野もあれば、「日本「地下経済」白書(ノーカット版)―闇に蠢く23兆円の実態 (祥伝社黄金文庫)」や「ヤバい経済学 [増補改訂版]」のように、調べるだけでも命がけみたいな分野もあります。科学者、特に理論家の気質を考えると、検証がとても困難な現象に対しても、精緻化したくなるのは仕方のないことかもしれませんが。統計学では、頑強さ(robustness)という概念や、質に問題のあるデータに精緻な手法を適用する人に対して、「GIGO (wikipedia:en:Garbage In, Garbage Out)」という言葉が投げかけられたりしますが。結局入手可能なデータの質と量を考慮しない仮説(理論)は、結局のところ反証主義的な意味での信頼性に問題を抱えてしまいます。社会現象を科学的に理解することを突き詰めて考えた結果が「データの科学 (シリーズ データの科学)」の「おわりに−因果関係論」になるかと思います。前に引用した一節を再掲します:

因果関係追求はマクロ的なものを分離し、次第に単純なものへと一方向的に分化させていく。人間の生体理解のためにミクロの世界に入り込み、さらに物理・化学にまで分解される。そこまでいって、仮に因果関係がわかったとしても(因果関係らしきものがわかったとしても)、複雑な諸要因の絡み合い、ダイナミックスで人間は生きているので、もとの人間生体の有機的現象に戻して役立てることは不可能であるように思える。しかしこれが科学の進んでいる大道である。如何ともし難いのであるが、マクロはマクロなりに考えて有用な情報を取り出す−必ずしも因果関係にとらわれない−ことも考えてよいのではないか。

結局のところ、マクロな現象を科学的に捉えることを突き詰めて考えると因果関係はいえないというのが、社会調査法を研究し続けた林知己夫氏の行き着いた結論ですね。科学でいえるのは相関関係で、因果関係が見えるのはそれを観察する人間の持つ規範であるということでしょうか。でも、信仰の成り立ちを考えると、理解できない現象に関しても因果を求める本性が人の中にあるとしか考えられませんから、そのようなスタンスはなかなか理解を得られないでしょうね。