AIについてのハンブルな見解(断片的試論)

AIの議論がハイプサイクルをグイグイと急上昇しているので地に足の着いた議論がされにくいのは仕方ないのですが。大学、大学院で真面目に研究していたところからみると、随分と雑な議論がされているなというのが実感です。

この記事はとてもハンブルな見解を示しているんですが。きっとわかっている人向けだな。わからない人には妄想が変に広がるとも思いました。

industry-co-creation.com

 

人工知能は、ものすごくわかりやすく言うと、人間の知能のようなものを作るのではなくて、極めて人にとって単純だけど、計算機がやりにくかったエリアの自動化を進めましょうというふうに言えると思います。計算機での自動化というのは、情報を入力したときに、それを勝手に処理して、欲しい情報を得ること。 そのための技術が、広義の人工知能という研究領域で作られました。

計算機が取り扱うのが、けっこう難しかったのは、

です。それが特にインターネット企業によって急速に実用化されていったのが今です。人間知能の最も難しい問題設定能力のようなものは、まだその糸口もつかめていないといったほうが良いのではないかと思います。

 

さて、前者の画像、音声処理というのは、特に深層学習によって大変素晴らしい成果を達成しました。猫を猫と分類できたりするようになったのは、僕が大学院のラボでやっていた頃と比べれば、とんでもない進歩です。

画像処理がどのような概念なのかを概略すると、画像のデータから(これは単なる色の点のデータの集まり)、何かしらの猫らしき特徴量を出し(これは意味的に耳が立ってるとかそういう特徴ではなく、画像の信号的な傾向、例えば画像の周波数が高いエリアがあるなしとか、茶色っぽい点が多いだとか)、それをもとに猫っぽい確率を推定する。こういう数式のモデルを作ることです。

ここで機械学習というのがとても使えます。入力データにいろいろな猫の画像与え、それを何度も繰り返して、猫を入れたら猫と出力してくれるように計算式を徐々に直していくという手法で数式を作っていきます。とてもコンピュータ的な手続きによって行います。そのモデルのもともとの着想が神経細胞にあり、かつ視覚野を模しているということで、なんだか脳を作ったような解釈もされますが。このモデルが脳の働きと同じかどうかはよくわかっていません。

 

後者の自然言語処理も、非常に扱いにくいデータでした。特に、話し言葉というのは、あまり構造化されていなく。この中から意味合いを類推して、計算機に扱いやすい状態にするというのが非常に大変でした。

例えば「明後日の昼一に会おう」という文章を考えたときに。まず、今日という日付をコンピュータがわかっているにも関わらず、「明後日の昼一」は何年何月何日何時なのかは実は理解してくれない。そこに辞書的なものや、過去の傾向などを入れることで、ようやく20161206 13:00というような変換ができ。それをもってようやく計算機は処理をすることができます。

さらに、これが約束を依頼を意味している文章であることはコンピュータはわかりません。それを文法をベースにした辞書などで対応するアプローチもありますし、また含まれる語が日時と会うということを言っているので、やはり何かを約束している可能性が高いというアプローチもありえます。そしてこれが約束を依頼する分である確率が何%と推論するようなモデル作りが様々な角度からなされています。

 

こういったエリアが、この10年ぐらいでGoogleを筆頭に発達させた人工知能のエリアです。これがもっと幅広い問題に適応されいくことはありますが、かなり人間のプリミティブな領域を実現したに過ぎません。

一方で、単純なんだけど人間が苦手な領域。例えば、大量の記憶をするとか、瞬時でそれを処理するということが苦手です。ですから囲碁なんかはとても計算機が計算機の強みを使って戦いやすいエリアであって。それを持って、人の知能を超えたのなんだのというのは、あまりにも雑な議論という風に感じます。もちろん、コンピュータサイエンスをやっていた人からすれば、その業績はすごいんだけど。人の知能というのがもっと違った形で優れているということを忘れているような議論はそろそろなくなってもよいのかなと。