ごあいさつ

 

 

新サイトの開設のごあいさつに代えて

 

 旧サイトQMSS https://qmss.ne.jp は開設以来25年以上になり、200万を超えるヒット数と数十万の方々の統計力の基礎学習と応用、実践に役立ってまいりました。時代も変わり、実に様々な分野に方法は展開しております。

だいぶ手狭になりましたので、新サイトを従来のサイトの上に展開をすることになりました。新しい領域は驚くほど広くなかなかカバーが追いつきませんが、着実に進めてまいります。旧サイトのぼう大な情報資産も引き続きご活用下さい。

 

  新サイトの新しい理念については新刊の

     『わかりやすい統計:データサイエンスの基礎』(丸善書店)

に述べましたので、これにてご理解いlただければ幸いです。

 

 

データ・サイエンス」の新しい道
公正と倫理も:前書きに代えて

 

 

本書は『わかりやすい統計学』(1996年初版、2009年改訂第2版)の続編ですが、「わかりやすさ」をひきつぎ、書名「データ・サイエンスの基礎」からも統計学の「新しい本」です。
  どこが新しいのでしょうか。統計学には350年以上にわたる歴史があり、決して新来のものではありません。だからこそ、だれにでもわかりやくためになり面白く、人類への貢献のこれだけ長い積み重ねがあるのです。実際、今でも各方面への応用の可能性では統計学ほど広いものは他に見出すことは難しいでしょう。今この本を取って下さる皆さんも仕事の分野や目的や期待もさまざまです。いつの時代も統計学は新しい時代のニーズにその都度答えてきました。統計学は私たちの共通資本なのです。これが「新しい」の第一の意味です。

  本書はふつうのことを当たり前に書いていますが、そのスピリットはデータの意味の「公正」な読み方・利用の学びです。そのためにデータを正しく読み解く力を養ってもらいたいということです。どんなデータもただの数字の羅列ではありません。意味とは何でしょう。統計学は社会に正しく必要な情報を供給するものです。それは難しいことではなく、学んでみると統計学のあちこちに自然に公正の発想が流れていることがわかります。むしろ公正に反する扱い方がどれだけ災いか例をあげましょう。
  <大本営発表への疑問(戦時)>
   ― 敵空母の撃沈発表隻数を合計すると保有数を超えてしまう ―(例)
  発表内容に疑念、疑問は一切許されず、反する者は捜査、検挙、送検された。
    明石博隆(他)『昭和特高弾圧史』  立場にかかわらず多くの研究者が資料として引用
  これでは戦争には勝てません。しかし、軍国主義はけしからん軍部は横暴だ非民主的だということだけではことがらの表面にすぎません。実はこのことに気付き指摘したのは一少年だったといいます。当然大人も気づいていたのでしょうが、データをごまかし真実を隠すことは実際大したことではなかったのです。でも、あたりまえですが戦争に勝てませんでした。

  堅苦しい話ですが、わずかな時間を社会観察に拝借します。メディアの新型コロナのデータ報道でもあらためてこの戦時を思い出しました。感染者数データの出所を明さない、検査数に左右されるのに感染者数増加だけを連日報道する、制度の比較をしないまま外国データを野放図に報道する、データに死因のきめ方の基準がない(重篤肺炎vsコロナ死)、研究者が委員会に諮らず個人独断でデータ検証不十分な理論をメディアに提供する、自粛強制やロックダウンが憲法で容認されるのかにも沈黙(野党も)でした。こういうことは難しい方程式を解くよりも易しく、基本の態度さえ学んでいれば誰でも常識から呼び出せることでした。「公正」は、権力のメディア利用とメディアの権力利用の商業主義、あるいは権力の科学者利用と科学者の権力利用といういわゆる「科学主義」の前に敗退したのですが、それもきっかけとなって、データの公正を頭の片隅におきながらこの本を執筆しました。

  最後に、データ・サイエンスではAIを正面から取り上げる期待もあることは承知し、むしろ重要と考えています。人間では限られた時間で、膨大なデータの処理とその結果に基づく瞬時の判断はAIには適いません。しかしその一方で、データの意味している内容や、クリエイティブな発想などはAIでは理解できずに、人間にしかできません。

この本にある統計学、データ・サイエンスは数学ではありません。むしろ、実際のデータに触れながら、データは何を表しているのか、出てきた結果の背後にはどのような関係が存在するのか、実際の内容に即して、出てきた結果を正しく理解し、読み解いていくことが目的です。

実装を別とすれば、AIの基礎は大部分ITさらには統計学ですから、本書程度のイロハも知らずにAIを学んでも指先クリックの学びだけで職も長続きしません。ですが、AIと呼ばれる機械学習については、刊行予定の第三巻でscikit-learn(サイキット・ラーン), TensorFlow(テンソルフロー)でわかりやすく説明しますから、期待して下さい。

  なお、念のため筆者は、人はAIについて主人であり続けられると考えています。哲学的問題ですが、哲学者サルトルとは違ったやり方でコップの水で説明します。写真のコップについてAIがいえることは
①     コップには半分の水が入っている
②     コップにはまだ水が半分も残っている
③     コップにはもう水は半分しか残っていない
 のうち①だけで、②③はAIが本人の人生態度を知らなくてはなりません。それは本人を
 囲む外の全世界および世界と本人の感情関係を述べることになりますが、全世界をAIがことごとく知り解釈することだけでも、常識で見積もって(SF的以外では)不可能と思われます。そこは皆さんがAIに指令を出すことになりますが、そのためには皆さんこそ、①のデータを②か③のどちらかに解釈することになるのではありませんか。 
 

グラス.jpg

Kurz.

 

 

(株)ベイズ総合研究所代表取締役

東京大学名誉教授

松原 望