edtechと文理融合教育(5)ーSociety5.0を見据えた社会学者の奮闘記ー


統計的検定については、フィッシャーから学んだネイマン・ピアソンがアメリカに渡り、用語法などをいろいろ整理して今日に至っているが、私にはフィッシャーの用語法がしっくりくる。検定によって棄却されることが期待される仮説について、どうして「帰無仮説」とから「検定仮設」と言い換える必要があるのか、全くわからない。どのような分野でも、時代を経るにつれ、手法が確立した経緯を示す呼称が廃れて、あか抜けた用語が使われるようになるものかもしれないが、そのことの意味について吟味することなく、「アメリカで使われている教科書にそう書いてあるから」という理由だけで、教育内容を変えてしまうのはおかしいと思うのだが、どうだろう。それと同じ類の問題になるのだろうか。近年における統計的帰謬法の使い方について、とても疑問に思っていることについて触れておこう。

最近、帰無仮説(h2)が棄却されなかった場合には対立仮説(h1)を採択する、という意思決定の手続きを取るケースを散見するようになった。フィッシャーはこのような場合、「棄却できない」という判断は下すものの、「積極的に採択する」という判断は決して行わなかったから、これもピアソン・ネイマンが渡米後に確立した方法論なのだろう。翻訳された教科書に載っているから間違いない、ということで、このような意思決定の方法が普及したのは、さすが敗戦と同時に教科書に墨を塗ったり、教科書から不適切なページを切り取った国の体質だと思うことしきりだが、問題はこの意思決定の方法にどのような正当性があるか、ということである。

有意水準を5%に設定したとすれば、この場合の問題は、帰無仮説を棄却する際に「統計モデルが正しいという前提の下で帰無仮説(h2)が成立する可能性が最大でも5%未満である」という背理法的な論理を用いているのに対し、対立仮説を採択するための条件はこれと同じ条件のもとで「帰無仮説(h2)が成立する可能性が5%以上あるから、これを棄てられない」という証明の論理を用いていることになる。

ご承知の通り、統計的帰謬法のポイントは、「帰無仮説が正しいにもかかわらず、これを棄却してしまう確率」を管理することによって、判断を誤るリスクを一定水準未満に抑えようとすることにある。だから、pが5%未満である場合に、帰無仮説が正しいという可能性が5%未満は存在するものの、帰無仮説が正しいという仮説を捨てないでおくか、それとも対立仮説を採択するべきかの判断に迫られれば、1/20未満の確率でしか発生しない事象と19/20以上の確率で発生する事象のどちらにするか。個人的な強いこだわりがあるとか、確率に出てこない有力な情報があるなどの特別な事情がない限りは、確率が高い方を採用することが「合理的な判断」ということになる。

しかし、帰無仮説が棄却できなかった場合に、帰無仮説が正しいという可能性が5%以上存在するからといって、これを採択することが果たして、「合理的な判断」といえるだろうか。この方法の正当性について、十分な説明をしている書籍を、小生は見たことがない。この件につき、諸賢の見解を聞きたいものであるし、米国で使われている教科書にそう書いてあるから正しいのだという人がいたら、その人は英語を学ぶべきではなかったとさえ思うのだ。

このあたりは人間としての矜持の問題で、AIとロボットの時代に人間として生き抜いていく若者たちについて、同じ愚を繰り返すのは、社会的犯罪を構成するとさえ思うのだ。

分かると恐い統計的検定の仕組み

日本に統計の知識が入ってくる経緯などの事情があるのかもしれないが、統計量およびその値を導く際に用いられる数値の意味についても、全く理解することなく盲目的に計算をして型にはめて判断に使っているだけ、というケースが多い。

分散分析を例にして説明しよう。(一元配置)分散分析は、質的変数を独立変数、量的変数を従属変数として、質的変数によってそう分けされたサンプル群の間に、統計的に有為な差があると言えるかどうかを調べるものである。検定の際には、級内平方和を級内自由度で割って得られる級内平均平方と、級間平方和を級間自由度でわって得られる級間平均平方の値を計算したのち、後者を前者で割ることで得られるF値を用いる。

しかしながら、それぞれの自由度の意味と、それぞれの平均平方の意味、そして、F値がどうして統計的検定量として判断の指標になるのかを、きちんと説明している文献は、少なくとも日本には存在しない。ということはつまり、F検定を使って調査データの分析を行っている人のほぼ100%が、どうしてそう言えるのかを理解しないままに検定手法を使いこなしていると称していることになる。この状態を、恐ろしい・クレイジーという言葉以外に、どのように表現すれば良いのか、小生にはわからない。

ご承知のように、(一元配置)分散分析は、全体平均と個々のサンプルとの差の二乗和を、独立変数による層分けの効果を表す量(級間平方和)と、層分けによって影響を受けなかったデータの散らばりを表す量(級内平方和)に分ける。そして、両者をそれぞれに対応する自由度で割って得られるのがいわゆる「平均平方」ということになるのだが、不思議なことにこの値が何を意味するかについての記述のある書籍に、小生はお目にかかったことがないだけでなく、そのことに疑問を抱く人にもまたお目にかかった記憶がない。統計学品質保証と銘打った研究会にも、そうしたことをきちんと説明しようという方はいなかった。ここまでくると、分散分析の論理構造が露見すると、それを知った人が怖くなって使わなくなってしまうから、故意に説明しないのではないか、と勘繰ってみたくなる。いやしくも著名な大学で統計学を教え、税金から拠出される資金で「品質保証」という言葉を使った調査研究を行う方々が、理解しないままに使っているとは考えたくないものだ。

フィッシャーが分散分析を考案したのは、ドイツ軍のu-ボート攻撃により食糧輸入が儘ならなくなったイギリスで、農業生産を上げるための統計的方法が必要とされたからであった。その時、彼が思いついたのは、正規分布と中心極限定理そしてt-分布を応用した、新しいデータ分析の技法であり、それために必要な新たな統計量と確率分布の考案であった。農作物の成長には、肥料の種類と量が大きく影響する。農業の生産性を向上させるためには、どの作物とどの肥料の組み合わせが最適であるかを、科学的に明らかにする必要があった。フィッシャーは、肥料の種類と作物の様々な組み合わせについて、どれが最もよいものであるかを確認しようと考えた。いま、小麦を生産するための肥料としてA,B,Cの種類があるとすると、どの肥料が最も有効なのか。これを確認するには、細かい条件を別にすれば、A,B,Cそれぞれの肥料を与えて十分な本数の小麦を育て、一本当たりの育成状況を指標化して、それぞれのグループごとの平均値を比較すればよい。しかし、彼の時代には、その比較を実現するための方法が、存在しなかったのである。

そこで彼は、二つの仮定を置くことにした。一つ一つの麦の育成状況は、様々な条件によって左右されるから、その集積の結果を反映する育成状況の指標の値は、正規分布に従うだろう。そして、もし肥料によって麦の成長が左右されないのであれば、A,B,Cそれぞれのグループの小麦の育成状況の指標の平均値の出現確率は、中心極限定理に従うであろう。いま、肥料による麦の生育状況の差が全くないと仮定すれば、全ての標本値の平均値と全ての標本値の差の二乗和を、グループ分けの効果を表す値(級間平方和)とグループ内での標本値のばらつきを表す値(級内平方和)に分け、それぞれの値から母分散を推定すれば、二つの値は理論的には一致するはずである。しかし、仮に肥料によって生じる生育状況の差が無視できないほど大きければ、それだけ、級間平方和の値が大きくなり級内平方和の値が小さくなるので、級間平方和から推定した母分散の値(級間平均平方)は大きくなり、級内平方和から推定した母分散の値(級内平均平方)は小さくなる。したがって、肥料による差異が大きいほど、二つの値の比の値は、肥料の効果がないとの仮定の下では考えられないほど、大きなものになるはずである。この検定モデルを実現するために彼が考案したのが、分散比を意味するF値の概念であり、帰無仮説が正しいという仮定の下で、分子・分母それぞれの自由度に対応したFの値の出現確率分布であるF分布だった。

仮にネイマン・ピアソンがアメリカに渡って自らの考えに基づいて統計理論を再構築して公表した時、「分散分析の検定モデルでは、級間平均平方も級内平均平方も、ともに母分散の推定値である」ことに触れなかったとしても、次の世代を育てる責任のある教員には、きちんと理解した上で伝えるべきではなかったか、と思うのだが。

そして、統計学品質保証という言葉を使って活動を行った碩学の皆様方には、横文字を盾に直して伝えることをもって、自らの役割とみなした世代の常識を根本から見直して、それぞれの検定モデルの論理をきちんと理解した上で、リスクを認識したうえで使いこなせる人を育てる教育を実現して欲しいものだと、心の底から願っている。そうしなければ、自らの立場を守ることだけを目的として、やがてAIに代替されるだけの人材を育てるだけに終わってしまうような気がするからである。

文理融合型の統計学教育の必要性とは

次に、こうしたモデルの理解を例に、文系の側からの文理融合型統計学教育のあり方について考察していくことにしよう。小生が初めて先に示した理解に達した時、納得よりも恐怖を先に感じたものである。理系の立場から見れば良くできたモデルではあるが、文系の立場から見れば「よくもこんないい加減なモデルで意思決定をしようとしたものだ」と、かえって恐ろしくなったからである。

母集団と標本には中心極限定理に基づく確率的な関係しかない。標本から母数の推定の根拠は、t分布と自由度だけ。たったそれだけの根拠で、標本から母数を推定し、それをもとに意思決定を行うのは、どう考えても危険と感じたからである。そして、ただ単に言葉と概念を覚えp値による判断を機械的に行うことしかできない人が感じるはずのない「肌で危険を感じることのできるような理解の仕方」こそ、文理融合型の統計学教育を行うことの本質的な意味なのではないか、と思う。

もっともこうした問題意識は、統計的な考え方に基づくデータ収集と処理が物理学から生物学・社会科学・人文科学の領域に応用されようとしたときに、西欧社会で大いに議論されたことではあった。神ならぬ人間がどうしても避けえない測定誤差を管理するために考案された分布の型が、どうして成人男性の胸囲の分布の理解に適用できるのか。コイン投げの確率分布にすぎない二項分布が、誤審質的変数の確率を管理するために活用されてよいのか。しかしながら、様々な領域で統計的数字が収集・整理された後に明らかになったのは、社会現象の中にある「星々の運行にも似た」規則性・法則性であった。こうした規則性・法則性は、統計的運命論と呼ばれる考え方を生み出すが、これに異を唱えたのはやはり文系的な知性であった。人々の行動が統計的な法則によって決定されるとしたら、一人一人の行動について本人の責任を問うことができなくなり、犯罪者を逮捕し裁判で罪に問うこと自体が意味を持たなくなる。社会統計の発達がもたらした人間の自由意思に関する本質的な問題は、気体分子論のモデルの確立を通したスカトスティックなる概念の普及により解決を見るが、問題定義そのものが人文科学的な知性にもとづくものであり、社会科学的な問題意識に基づくものであったことは、記憶されるべきだろう。

文理融合型の統計学教育は、単に文系の学生が統計学を使いこなすための技術習得を意味するのではなく、文系的なセンスに基づいて統計学を応用する知的能力を養成するものであるべきではないか。先にみたように、統計的検定のモデルそのものも、確率モデルをもとに推定した値を確率モデルの上で判断するという、不確実性を含むものであるし(というよりはむしろ、統計的検定という方法そのものが、不確実な事象について危険を管理しながら意思決定するために考案されたもの、なのだが)、現代社会が直面しているのは、過去の統計データからは予測不能な事態が頻発し、さらに、急速に変貌を遂げる現実への対処なのであるから、多くの領域で統計的決定論という発想そのものが陳腐化しているというべきだろう。文理融合型の統計学教育は、そうした事実を見据えたうえで、統計的な手法のうさん臭さを文系的な知性で補いながら、より良い意思決定を行える人材を育成するために、新たに構想すべきものと考えるのは、一人小生のみであろうか。

AIとロボットを使いこなすための教育とは

外国へのキャッチアップが全てに優先する行動の根拠となる日本では、教育の分野でも、いわゆる潮目を見ることに注力するあまり、本質的なことには目を向けないという行動パタンが、今日に至っても是正されないばかりか、よりひどくなっているのではないか、とさえ思う。

物事の本質に思いを致さず、表面的な特性だけに目を奪われ、そこに集中的に時間配分をした教育を受けた者は、目の前に出されたものを疑ってかかる知的能力を封じられてしまう。確率・統計を盲目的に信じる者は、確率・統計による判断が常にはらむ危険を意に介さず、確率・統計を盲目的に信じることを疑う者は、確率・統計による判断が常に危険をはらむ、すなわち危険なものであるとして、分析結果について感情的に反発することになる。

そしてそのいずれもが、AIとロボットにより代替されるだけの、場当たり的で深みのない人材の大量生産という、悲惨な結果に終わってしまうのではないか、とさえ思える。小生にはそれが、若者たちが対峙していかなければならない「覚束ない未来」を見据えた、若者たちのための教育という発想からではなく、今まで学会と教育界を支えてきた碩学や現在の教育制度を前提とした延長線上での教育という発想に基づいた教育改革の、必然的で悲惨な結果のように思える。なぜならば彼らには、盲目的な技術習得か、感情的な反発かの、二者択一しか許されていないのだから。AIとロボットの時代を生き抜くために必要な、文理融合型の統計学教育は、両者を止揚したところにあるのだが、日本人には弁証法的な思考方法も単なる流行にすぎず、すでに忘却の彼方にあるらしい。

AIとロボットを使いこなすための教育が、AIとロボットに代替されるまでの間をつなぐための教育であっては、ならない。それは、国民を竹槍でB29に突進させるようなもので、極論すれば、いわゆる「不要階級」抹殺計画ともいうべきものではなかろうか。小生には、edtechも統計学教育も、今のままではいずれ「ゆとり教育」のように、「徒花」扱いされる結果になるような気がしてならない。その時、政策決定者はすでに現役を離れて、責任を取る立場にはないであろうが、その教育を受けて社会を生き抜いて行かねばならない若者たちは気の毒である。次の教育改革に向けて、さまざまな領域で文理融合の動きが具体化し、志ある若者たちを「寄ってたかって育てていく」動きが生まれてくることを、願うばかりだ。


天野徹
天野徹

明星大学人文学部人間社会学科教授。
専門は、情報社会学・社会統計学・都市社会学。東京都立大学大学院博士課程単位取得中退。社会学をベースに、文理融合・問題解決の知のあり方を追求してきた。(財)あしたの日本を作る協会の委員として、webサーバーを立て、「地域づくり運動情報データベース」を構築・公開。社会調査の領域に、ハイパーテキストを活用したプレゼンテーション作りや、3Dモデリングによる景観シミュレーションを導入。東日本大震災の後、自ら提唱したコミュニティ・ネットワークの理論をもとに、災害レジリエンスを備えた社会システムと、それを実現するための情報システムを構想。PHP、Java Script、CSSなどを用いて、義援物資マッチングシステムと避難所情報収集システムを構築し、サービスを公開。現在は、インバウンド等の災害対策として、AIを活用した被災者・帰宅困難者誘導システムの構築・一時滞在施設確保のためのビジネスモデルの構築と社会実装に取り組んでいる。

天野徹の記事一覧