新井紀子『AI vs. 教科書が読めない子どもたち』
藤井聡太七段(17)が永瀬拓矢二冠に勝利し、「棋聖」のタイトルへの挑戦権を獲得し、最年少記録を更新したようで。将棋に造詣が深くはない私が賛辞を贈るのは滑稽な話ではありますが、おめでとうございます。
今回は藤原和博さんの著書『10年後に、君に仕事はあるのか?』に少し似ているかもしれないですが、AI技術についてのお話です。
3年前、AI技術を組み入れた将棋ソフト「PONANZA」が将棋界の貴公子佐藤天彦名人(2017年当時)に2連勝したことは世間でも大きな話題になった。このAI技術にかの羽生善治さんはひと昔の将棋ソフトに比べ飛躍的に進化を見せたと述べている。
近年、大喜利人工知能なるものも誕生した。例えば、「『桃太郎』にサブタイトルをつけてください」というお題に対し、AI技術は「非正規雇用の実態」と答える。なかなか面白い。
本書、新井紀子『AI vs 教科書が読めない子どもたち』には、日本の国立情報学研究所が中心となって2011年に「ロボットは東大に入れるか」というプロジェクトをベースに書かれている。ちなみにそのプロジェクトリーダーが新井紀子氏だ。
2019年に日本経済新聞でこういった見出しが載せられていた。
「AIの英語、東大レベル センター試験9割超正解」
記事の内容を読む。
200点満点で185点、偏差値は64.1――。人工知能(AI)が今年1月に実施された大学入試センター試験の英語(筆記)に挑戦したところ、こんな結果が出た。「ロボットは東大に入れるか」プロジェクト(通称・東ロボくん)チームが19日までに明らかにした。
2016年に大手予備校のセンター試験模試で5教科8科目を受けた際の英語は95点(偏差値50.5)にとどまっており、今回は大幅な成績アップを果たしたことになる。チームは「記述式の2次試験はまだ難しいが、センター試験に限れば東大合格者と遜色ない結果だ」としている。センター試験本番への挑戦結果を公表したのは初めて。
成績が伸びた要因には、AI関連の先端技術「ディープラーニング(深層学習)」に基づく文章読解技術の大幅な進歩がある。さらに、文章から不要な文を見つけ出す問題など、従来は苦手だった分野にチーム独自の技術を適用し、正答率が大幅に高まったという。全問を解くのにかかった時間は数秒以内だった。
今回のAIは過去のセンター試験にも挑戦。17年が169点(偏差値60.1)、18年が167点(同60.5)だった。前回模試を受けた16年当時のAIを使って解かせた結果では、17年が102点(同45.1)、18年が95点(同43.0)、19年が83点(同40.7)で、AI自体が大幅に進歩したことになる。
なるほど、AI技術は進化している。EDIONに行けばPepperに会えるし、iPhoneにはSiriが宿っているし、LINEの公式アカウントには「元女子高生AIりんな」がいるし、AIが視覚を手に入れ顔認証システムを導入したiPhoneXが登場したなど、このまま技術が発展すれば、『ターミネーター』のような世界が到来しそうである。
まあ、でも、だ。
結論から述べると、
「AIはまだどこにも存在していないし、AIが人間の能力を超える地点(技術的特異点)を意味するシンギュラリティは到来しない」
である。
かなりはっきり断言しているが、これは私の言葉ではなく、新井氏の言葉である。
私自身、シンギュラリティはともかく、「AIはまだどこにも存在していない」ってどういうこと? と思った。一瞬、この本に信憑性を失ったくらいである。SiriとかOK Googleとかあるじゃん! そう思った。
どうやら「AI技術」と「AI」は別もので、前者はスマートフォン、ルンバなどに搭載されている技術であり、後者はArtificial intelligenceの略であることからAIは「人工知能」、つまり「人間の一般的な知能と同じか同等レベルの能力のある知能」を意味する。「あれ?今世界のどこかには人間の知能と同等レベルの知能持ったAIっているんじゃないの?」と思うかもしれないが、はっきりというが「いない」。
だからといって、「じゃあ、AIに必要以上に怯えなくていいのか」と安心できるわけではないこともここで述べておく。(以下、AI技術のことを「AI」と呼ぶことにする)
1.AIが仕事を奪う
よく巷間ではAIが仕事を奪うといった言説が飛び交っているが、それは正直事実だそうだ。だからといって悲観的になる必要はなく、過去、何でもかんでも機械化にしたことにより、改札鋏をパチパチ鳴らして切符に穴を開ける鉄道員はいなくなったり、宮沢賢治の名作『銀河鉄道の夜』の主人公ジョバンニのバイト先の「活字拾い」は今や見る影もなかったり(ほかにも辺見庸『自動起床装置』に出てくる「起こし屋」なる者がいたとかいないとか)、職は奪われてきた。それは時代の流れの中で起こる必然的なことなのだ。職は奪われるもの。しかし、奪われ続けたからといって職はゼロに向っていくことはなく、新しい職業が増える。「活字拾い」(文選)をしていたのが印刷機で大量に紙を刷れるようになり多くの出版社が登場したように、失われたものが出るたびに新しいものは誕生する。むしろ、それは仕事の労力の縮小を伴うため歓迎すべきことではないかとすら思う。
例えば、本著の中で、ある医学界の重鎮である内科医の先生が研修医時代に画像診断のアルバイトをしていて、それは患者の身体の中に異常(癌など)がないか診断するといったもので、暗い部屋の中で延々とただ機械的にその作業を繰り返すため、その人は精神的苦痛を味わったそうだ。その人は「ああいう仕事は、人間よりもむしろAIのほうがむいているのではないでしょうか?」と言った。AIは一枚の画像の中に猫がいるかどうかを見つけるというような限定された作業が得意なので、この仕事はAIに代替されることが予想される。この代替は歓迎されるべきではないだろうか。
とはいえ、以下は「10~20年後になくなる仕事TOP25」(オックスフォード大学の研究チームが予測したもの)であるが、これを見れば判るように、「AI技術万歳」と大きな声でいうこともできそうにない。
1 |
電気販売員(テレマーケター) |
2 |
不動産登記の審査・調査 |
3 |
手縫いの仕立て屋 |
4 |
コンピューターを使ったデータ収集・加工・分析 |
5 |
保険業者 |
6 |
時計修理工 |
7 |
貨物取扱人 |
8 |
税務申告代行者 |
9 |
フィルム写真の現像技術者 |
10 |
銀行の新規口座開設担当者 |
11 |
図書館司書の補助員 |
12 |
データ入力作業員 |
13 |
時計の組立・調整工 |
14 |
保険金請求・保険契約代行者 |
15 |
証券会社の一般事務 |
16 |
受付係 |
17 |
(住宅・教育・自動車ローンなどの)融資担当者 |
18 |
自動車保険鑑定人 |
19 |
スポーツの審判員 |
20 |
銀行の窓口係 |
21 |
金属・木材・ゴムのエッチング・彫刻業者 |
22 |
包装機・充填機のオペレーター |
23 |
調達係(購入アシスタント) |
24 |
荷物の発送・受け取り係 |
25 |
金属・プラスチック加工用フライス盤・平削り盤オペレーター |
アメリカ人の予測だから、日本は関係ないとはいっていられない。日本の「終身雇用制度」という神話がいつ打ち崩されるか判らない。というか、その神話を守ろうという力が働いてしまえば、日本は国際競争力を失ってしまう。AIは先程もいったが、仕事の労力を縮小してくれる。だから、従業員の雇用のためだといって、AIを使わなかったら従業員の労働環境をブラック化させることになるのだ。本著に面白い例えば載っていた。人間がAIに対抗するのは、「竹槍でB29に対抗する」のと同じだそうだ。
大変な時代に突入してしまった……。
2.意味を知らないAI
AIに怯えるなといいたいのか、それとも怯えろといっているのか、ここまで書いていても何ともよく判らない感じに思えるかもしれないが、正直なところ「怯えたり、怯えなかったりしろ」ということではないかなと思っている。「すべての職業がなくなってしまう……ターミネーターのような、人間がロボットに排斥される時代が来る……」と怯える必要はなく、「AI? ああ、ポンコツでしょ? ははっ」と楽観視してもいけないということだ。その中間。ようは、AIの性質を知り、将来の動きを予測しながら、その予測にあった行動をする、仕事を選ぶ(転職したりとか)といったことがこれから要される。
AIは常識を知らない。冷蔵庫からジュースを取り出すことすらAIには難しい。撮影に使う冷蔵庫やそのドアはどんな形状か、どうすれば開くのか、あらかじめプログラムされないといけないし、冷蔵庫内に一本のジュースがあるだけなら、AIは難なく取り出せるだろうが、野菜や牛乳などがたくさん置いてあれば、AIは「想定外」のことだとして立ち止まってしまうかもしれない。臨機応変の対応ができるのは人間の特権で、AIにはそれができないのである。
私が本著を読んで、驚いたのは、AIには次の問題ができないということだ。これは2016年のセンター模試の語句整序問題だ。
問:次の会話の空欄に入れるのに最も適当なものを、それぞれ①~④のうちから一つずつ選べ。
Nate : We’re almost at the bookstore. We just have to walk for another few minutes.
Sunil : Wait.( )
Nate : Oh, thank you. That always happens.
Sunil : Don’t you tie your shoe just five minutes ago?
Nate : Yes, I did. But I’ll tie it more carefully this time.
①We walked for a long time.
②We’re almost there.
③Your shoes look expensive.
④Your shoelace is untied.
答えは④である。「靴の紐ほどけてるよ」。
東ロボくん(冒頭に書いたのを参照)は②の「もうすぐだね」を選択した。
会話するAIはGoogle、Amazon、Microsoft、IBMなど名だたる企業が躍起になっている分野だが、ほんとうに会話するAIが実現するならば、センター試験程度の会話はできて当然だろうが、現状はこの通りだ。英語チームが東ロボくんに学習させた英文は、最終的には150億文に上ったにもかかわらず、だ。だからといって、150億文を万倍にするのはほぼ不可能な話(ビックデータ幻想)だ。人間にとっては同じ英語でも、AIにとっては、特許の文書の英語と新聞の英語、Twitter上の英語、センター試験の英語問題の英語はまったく別ものなのだ。(日本語で置換してみると判りやすい。公文書の日本語、新聞の日本語、Twitter上の日本語はまったくもって別ものだろう)つまり、正しい文章を書ける人が限定的であり、文章を書くのに時間がかかり、手本となる文から自動的に意味を変えずに、一万倍に増やす方法が見つからない限り、150億文を万倍にすることはできないのだ。
そもそも、AI(コンピューター)は計算機である。質問に応答する機能だって、日本語を英訳しようとする翻訳機能だって、AIの計算なのだ。Siriだって機械学習で当意即妙なレスポンスをしているわけではなく、「中の人」(Siriの開発チーム)が手作業で作り込んだものなのだ。
さて、ここで私はスマホに「Hey Siri. 近くの美味しいイタリア料理店」といってみる。すると、「はい見つかったのはこちらです」という無機質な声とともに提示してきたのは、いくつかのイタリア料理店だった。特段、驚くところはない。
次に、「近くのまずいイタリア料理店」といってみる。「はい見つかったのはこちらです」という声とともに提示したのはさっきと同じイタリア料理店たち……、人気者にファンとアンチが共存するのと同じく、おいしい料理店は「美味しい」と「まずい」を共存する……ってわけではなくて、単純にSiriが「美味しい」「まずい」という形容詞をすっ飛ばして「この近くの」「イタリア料理店」というワードから周辺のイタリア料理店を探しただけなのだ。センター模試の英語問題といい、Siriの例といい、コンピューターが「知能」を持たず、「意味」を理解できないということが判っただろう。
さっきも述べたが、AIは計算機だ。つまり大雑把にいうと数式で表そうとする機械、数学をする機械だ。そもそも数学にできることは「論理」「確率」「統計」の3つだけである。四則演算、幾何学、2次関数、三角関数は論理的(演繹的)だし、落下という現象、空気の流れ・温度などは論理だけで説明できないが、確率を用いることで説明ができる。さいころや気圧配置から論理でも確率でも表現できない事象に対して統計(過去のデータの集積)を用いることで表現できるようになる。
「人は死ぬ」、「ソクラテスは人である」。この二つの事実から「ソクラテスは死ぬ」と演繹的に説明することは数学Ⅰで習った「真・偽」の内容から数学的であると言えるだろうが、「私はあなたが好きだ」とか「私はカレーライスが好きだ」が本質的にどう意味が異なっているのか、AIには理解できないのだ。なぜなら、「意味」を理解するのは数学的ではないから。
3.人間に「AIにできない仕事」ができるか?
AIに代替されない職業は何か。
以下は「10~20年後まで残る職業TOP25」だ。
1 |
レクリエーション療法士 |
2 |
整備・設置・修理の第一線監督者 |
3 |
危機管理責任者 |
4 |
|
5 |
聴覚訓練士 |
6 |
|
7 |
|
8 |
|
9 |
口腔外科医 |
10 |
消防・防災の第一線監督者 |
11 |
栄養士 |
12 |
宿泊施設の支配人 |
13 |
振付師 |
14 |
セールスエンジニア |
15 |
内科医・外科医 |
16 |
教育コーディネーター |
17 |
心理学者 |
18 |
警察・刑事の第一線監督者 |
19 |
歯科医 |
20 |
小学校教師(特別支援教育を除く) |
21 |
医学者(疫学者除く) |
22 |
小中学校の教育管理者 |
23 |
足病医 |
24 |
臨床心理士・カウンセラー・スクールカウンセラー |
25 |
メンタルヘルスカウンセラー |
残る仕事の共通点は、コミュニケーション能力や理解力を求められる仕事や柔軟な判断力が求められる肉体労働だ。AIの弱点は、万個教えられてようやく一を学ぶこと、応用が利かないこと、柔軟性がないこと、決められたフレームの中でしか計算処理ができないことなどだから、このランキング表に首肯できるだろう。療法士とかメンタルヘルスとか心理学者とか、いってしまえば「人間にしかできない」職なんだろう。
つまり、一を聞いて十を知る能力や応用力、柔軟性、フレームに囚われない発想力などを備えておけば、AIに恐れる必要はないわけだ。その基盤にあるのは間違いなく「読解力」だろう。
……読解力。
はい、この著書の『AI vs 教科書が読めない子どもたち』というタイトルの真意が見えてきたのではないだろうか。
しかし、OECDが加盟国の15歳(義務教育修了者相当)の学生を対象に3年ごとで実施している学習到達度調査で、日本の学生は「読解力部門」で過去3回の調査で連続してトップ10入りしているのだ。
あれ?
いいじゃん、いいじゃん!!
だが、ちょっとこの問題を解いて見て欲しい。SPIっぽい問題です。
問題 次の報告から確実に正しいと言えることは〇を、そうでないものには×を、空欄に記入してください。
公園に子どもたちが集まっています。男の子も女の子もいます。よく観察すると、帽子をかぶっていない子どもは、みんな女の子です。そして、スニーカーを履いている男の子はひとりもいません。
(1)男の子はみんな帽子をかぶっている。
(2)帽子をかぶっている女の子はいない。
(3)帽子をかぶっていて、しかもスニーカーを履いている子どもは、一人もいない。
恥ずかしながら、私はこの問題、間違えました!!
(てか、私かなり読解力は低い方だと自負しておりますし、なんなら日本語弱いです。)
まあ、答えは(1)のみだ。
(私は(2)も〇だと思ってしまいました。「帽子をかぶっていない子どもは、みんな女の子です」というのは、別に女の子全員が帽子をかぶっていることを意味しているわけではないよね。)
この問題の正答率は64.5%だそうだ。全国のさまざまな大学の大学生の数学力を調査し、国立Sクラスでは85%が正答した一方、私大B、Cクラスでは正答率が5割を下回ったそうだ。
この「大学生数学調査」を受けて、学生の基本的な読解力に疑問を持った新井氏は中高生の「基礎的読解力」を調査することにした。それが、RST(人間の基礎的読解力を判定するテスト)だ。その問題について、本著にたくさん載っているので、興味があればぜひ。
ざっくばらんに説明すると、「係り受け」(主語・述語の関係、修飾語・被修飾語の関係の理解)、「照応」(指示代名詞指す言葉の理解)、「同義文判定」、「イメージ同定」(文章と図形やグラフを比べて、内容が一致しているかどうかを認識する能力)、「推論」(文の構造を理解した上で、生活体験や常識、さまざまな知識を総動員して文章の意味を理解する力)、「具体例同定」(定義を読んでそれと合致する具体例を認識する能力)などの問題がある。(ざっくばらん、かな?)
学年 |
照応 |
同義文判定 |
推論 |
イメージ同定 |
具体的同定(辞書) |
具体例同定(数学) |
|
小6 |
65.1 |
58.2 |
62.1 |
58.6 |
30.9 |
32.5 |
19.6 |
中1 |
65.7 |
62.3 |
61.6 |
57.3 |
31.0 |
31.0 |
24.7 |
中2 |
67.8 |
65.2 |
63.9 |
58.9 |
32.3 |
31.7 |
27.4 |
中3 |
73.7 |
74.6 |
70.6 |
64.6 |
38.8 |
42.2 |
34.2 |
高1 |
80.7 |
82.6 |
80.9 |
67.5 |
55.3 |
46.9 |
45.7 |
高2 |
81.5 |
82.2 |
81.0 |
68.5 |
53.9 |
43.9 |
42.4 |
これは最新のRSTの分野別正答率だ。係り受け解析と照応解決は、AIの射程内に入っている表層的な読みを問う問題だが、この二つは人間の受検者もそこそこできている。だが、重要なのは、AIにはまだ難しい「同義文判定」「推論」「イメージ同定」「具体例同定」がどの程度できるか、である。しかし、どうだろう? 表から判るように「同義文判定」「推論」はともかく「イメージ同定」、「具体例同定」の正答率の悪さたるや!
本著ではあらゆるエビデンスで学生の読解力のなさを露呈させていたが、それを長々と書いてもアレなので割愛する。
4.教科書が読めない子どもたち
RSTで判ったことは、以下の通りだ。
・中学校を卒業する段階で、約3割が(内容理解を伴わない)表層的な読解もできない
・学力中位の高校でも、半数以上が内容理解を要する読解はできない
・進学率100%の進学校でも、内容理解を要する読解問題の正答率は50%強程度である
・読解能力値と進学できる高校の偏差値との相関は極めて高い
・読解能力値は中学生の間は平均的には向上する
・読解能力値は高校では向上していない
・貧困は読解能力値にマイナスの影響を与えている可能性が高い
・通塾の有無と読解能力値は無関係
・読者の好き嫌い、科目の得意不得意、1日のスマートフォンの利用時間や学習時間などの自己申告結果と基礎的読解力には相関はない
高校生の半数以上が、教科書の記述の意味が理解できない。
今、私は教師をしているが、このことはわりと感じている。
そして――
「アクティブ・ラーニング」なんて夢のまた夢だということも。
もちろん、賢い学校ではできる。
でも、偏差値の低い学校ではまず不可能だ。
新井氏も「アクティブ・ラーニングは絵に描いた餅」とはっきりと述べている。
文科省の「教員による一方的な講義形式の教育とは異なり、学修者の能動的な学修への参加を取り入れた教授・学習法の総称。学修者が能動的に学修することによって、認知的、倫理的、社会的能力、教養、知識、経験を含めた汎用的能力の育成を図る。発見学習、問題解決学習、体験学習、調査学習などが含まれるが、教室内でのグループ・ディスカッション、ディベート、グループ・ワークなども有効なアクティブ・ラーニングの方法である」と定めているあの「アクティブ・ラーニング」、は! 絵に描いた餅! 理想論!
なんなら、「小学生のうちから英語を!」というのも、「中高生にコンピュータープログラミングを……!」というのも、言ってしまえば、全部全部理想論。学生たちの能力を過大評価して、こういった能力を身につけないといけないと、と学校の実態も知らないまま、口だけ達者に魅力的なことを仰りますが、はい、不可能! 不可能! ということなのです。(テンションおかしいな)
まあ、文部科学大臣のような高学歴のお方は、偏差値の低い人間の実態のことを考えたこともないのだろう(とはっきり言うのは正直怖いことですが、あえてここでははっきりと強く言いたいと思います)、だから「アクティブ・ラーニングをしていってね」とたやすく言えるわけだ。だけど、こんなことを言っている私は卑怯なもので「じゃあ、どうしろと? 従来の知識注入型を続けろと?」と言われたら、沈黙する。いや、考えはある。「N高校」よろしく学校に来たい人は来て、来たくない人はオンラインで授業を受けるというスタイルをとったり、義務教育も大学みたいに自由に教科を選択できるようにすればいい、という考えはある。だが、それはそれで問題点は山ほどある。貧困な家庭はオンラインの「オ」の字もない環境であることから教育が平等に与えられないといったことや、今まで指定されていた内容を教えていたのが教科に一気に自由性を与えられることで、どこまで教師が教えればいいか判らなくなるといったことなど。
じゃあ、どうしろと?
本著では、教科書が読めない子どもたちがこれからのAI社会を生き抜くためにどうすればいいか、はっきりしたことは書かれていない。読解力をどうやって養っていくべきか、ということについても書かれていない。危惧しているだけで解決策は載っていない。無責任か? 私はそうは思わなかった。
なぜか?
私なりの結論を導き出せたから。
子どもたちへのキャリア教育の徹底をすることで、AIが台頭する社会の訪れの音を聞き、少しでも危機感を持ってくれれば、自ら学びに向かうのではないかと思う。本著には読書をすることと読解力に相関関係はないと書いていたが、それは正しい読書の仕方を実践していないからではないからだと思っている。本を速読して読んだ気になっているのは読書ではない。インプットをしたら、アウトプットをしなければならない。そうすることで、「読書」に意味が表れるのではないか。読解力が生まれるのではないか。
ともかく、AI技術によってあらゆる仕事が奪われる時代が到来するが、以上に書いたようにAIに代替されることのない「人間らしい力」を育んでいくことがこれから求められる。そのことに気付き、行動した者だけに幸福はもたらされることだろう。
AI vs 教科書が読めない子どもたち
勝者はどちらか……
数十年後、答え合わせだね。