オッサンはDesktopが好き

自作PCや機械学習、自転車のことを脈絡無く書きます

AIについて雑記

 こんにちは.changです.

 「AIって何?」という話は切りが無いので,触れないのが吉と思っています. 「人工の知能とは何?」という話をしようとすると,「天然の知能とは何」って話になります. そういう哲学的な考察は実は大好きですなんですが,,, この本*1の著者の方とか、昔から好きですね.

 反面,エンジニアとしては細かいことを考えずに技術面を追求しがちです. 戒めの意味も込めて,今回は(あまり深入りはせずに)AIの実態について考察してみようと思います.

ニュースキャスターがAIって言うけど...

 ニュースでAIという言葉を聞かない日が無いです. 「AIって何?」は決められないと言いましたが、あまりに乱立している気がします. 一昔前はディープ・ラーニングを応用した技術をAIと呼んでいるケースが多かったと思いますが,最近は所構わずAIと言っている気がします.

 個人的な見解ですが,ニュースキャスターの言うAI は「データ」と同値だと思います. 過去の記録を使って正しい判断をしようと言う当たり前の手法を,大袈裟にAIと呼んでいるのです.

 不思議なんですが,「AI」よりも「データ」の方が人間が頑張っている印象を受けます. 先日亡くなった野村克也さんはデータ野球の卓越者でした. 野球のことは詳しく無いですが,各チームにはスコアラーという記録係がいます. 集めようと思えば,同じような内容のデータを誰でも集められると思います. その中で,野村さんが選手として,監督として卓越できたのは,データを読み解き,適切な行動に結び付ける能力に長けていたからでしょう.

 天気予報も同じです. 気象予報士は過去のデータと現在の状況を照らし合わせて答えを出す為の,特別な訓練を受けています.

 AIと言うとこの特別感が薄れませんか? 何も考えずに計算機にデータをぶち込めば,有用な答えが返ってくるみたいな,,, でも,これは間違いなのです.

AIの作り手は考えている

 ディープ・ラーニングを構成する為の基本作業の一つに,学習データの用意とラベル付けがあります. 以前に,「オートエンコーダによる異常検知では,異常画像のみを学習させた方が良い」と書きました*2. また,異常画像が少ない際の対策として,合成画像を学習させる方法を紹介しました*3. 自分で言うのも変ですが,苦労している感じがしますね.

 AIの作り手は,意図した動きをAIにさせる為にあれこれと考え,策を凝らしています. 決して,「ビッグデータがあれば後はAIが何とかしてくれる」わけでは無いのです.

AIは間違える

 AIは間違えます. よくある議論ですが,AI = データの見解に立つとより受け入れ易いのではないでしょうか.

 天気予報が外れたり,株価予想が外れたりと,データは100%正しい答えを出せません. その原因の一つに,外れ値の存在があります(他にも沢山あります).

 実験科学の根底は統計学です. 最も基本的な概念であるガウス分布を見てみましょう.

f:id:changlikesdesktop:20200722070141j:plain:w400
出典*4

 ガウス分布は,世の中の事象の多くが平均値とその周囲のばらつきに沿って存在していることを表しています. 下の表のデータを見ると、日本人男性の平均体重は70.0 kg,標準偏差(バラツキ)は11.6です(便宜的に僕の年齢層のデータを見てみます). 平均値の70.0 kgの近くには多くの人がいます. 逆に,平均値から離れる程(極端に軽い or 重い),珍しくなります. 一般的に,平均値から標準偏差の3倍離れる人は稀で,2倍でもかなり珍しいです. 上の図を見ると,-2σから下の範囲,つまり平均値70.0 kg - 標準偏差11.6 × 2 = 46.8 kg未満の人は2.1%しかいません. ちなみに,僕は下の表における5%未満に分布しています. 100人の中に5人しかいないので,そこそこ珍しい感じがしますね.

f:id:changlikesdesktop:20200722065934p:plain:w600
出典*5

 科学論文の多くは,論文で主張している議論が「95%の確立で正しい」と言っています(僕も学生時代に多用しました). 95%の確率で正しいという事は,5%の外れ値には正しく無いという事です. つまり,体重が外れ値の僕には当てはまらない理屈が,世の中には沢山あるのです. サイズの合う服が少ない,風邪薬を飲むと量が多すぎて効きすぎてしまう,などです. 不都合ですが,どうしようも無いので諦めています(泣).

 外れ値に起因した間違いは,データを使った判断に潜在する現象です. AI=データなので,同じ理屈でAIも間違えるという事です.

AIは未来予測をしない

 AIは未来予測をしません. 少なくとも僕は,そう考えています. 過去の記録から理想的な未来像を描けるなら,戦争が繰り返されたりしないでしょう. 人間はそんなに賢くないと思います. AI=データならば言わずもがな、です. ここまで来ると,AIの限界というより,人間の知識の限界になりそうですが..,

AIは人間の職を奪うのか

 以前にも書きましたが,AIに職を奪われることを心配されている方は,その前に人間に職を奪われる心配をした方が良いでしょう*6

シンギラーリティは起こるのか

 ターミネーターって,既に20年も前の映画なのですね. AIが反旗を翻して,危険因子となるターナを殺しに来る話だったと思います. AIが人間を凌駕する日は来るのでしょうか,,,?

 AI = データの見方に立つと,既に多くの領域で,AIが人間を凌駕していると感じます. Google先生という言葉がある位ですから. 昨今では,出木杉君みたいに沢山の本を読んでいる人よりも,スマホでサクサクと検索をこなす人の方が評価される気がします. 僕自身も、パソコンやスマホがなくなったら生活できません. 「参りました」ってことじゃないでしょうか.

 結局、AIも生態系の一部なんじゃないかなぁ. シンギラーリティなんてのは、人間だけが特別で、凄い何かを生み出せるという飛躍が産んだ虚構の議論だと思いますね。

むすび

 深入りしないと言ったのに,長々と書いてしまいました. たまの頭の体操には良いかもです.