「生成」できることでAIは次のステップに 利用時の注意点は?
2022年11月30日にChatGPTが登場したのを皮切りに、またたく間に社会に浸透した生成AI。進化のスピードも速く、わずか1年強の間にあらゆるモデルが世に誕生しているが、そもそも「生成AIはこれまで語られてきたAIとどう違うのか」と疑問を抱く人もいるのではないだろうか。
そこで、ハヤカワ五味氏はAIを大きく三つの種類に分け、次のように説明した。
「生成AI台頭以前のAIは、大きく『識別系AI』と『予測系AI』の二つが主流でした。『識別系AI』は、膨大なデータを学習し、画像や音声、テキストなどのデータに潜むパターンを認識することで、新しいデータに対して適切な分類や判断を行います。たとえば、猫の画像を見せれば『猫』、犬の画像であれば『犬』と、学習データから得られた特徴量に基づいて識別します。
一方、『予測系AI』は、過去のデータに基づいて未来に起こりうる出来事や傾向を予測します。株価や需要の予測、気象予測などが代表的な例です。予測AIには、ニューラルネットワークをはじめとした様々な機械学習アルゴリズムが活用されています。
このように、従来のAIは主に既存データの分析や予測に焦点を当てていましたが、生成AIは新たなデータを生み出す能力を持つという点で、これまでのものとは一線を画すといえるでしょう」
従来のAIは、膨大なデータを数理モデルやプログラムに従って解析し、傾向を予測するものだった。これに対し、生成AIは人間が提示した要件に合わせてテキストや画像、音声といったコンテンツを生み出す。ハヤカワ氏は「この『生成』に大きな意味がある」と説明する。
もう一つ、生成AIを語る上で欠かせないキーワードが「LLM(Large Language Models:大規模言語モデル)」だ。これは、スマートフォンの漢字予測変換のように、ある単語列が現れる確率を計算して表出する「言語モデル」をさらに高度化した技術で、膨大なテキストデータから文脈に合った自然な文章を生成できるモデルとなっている。
「たとえば『おはようございます。今日は○○ですね』という文章があったとします。ここには『良い天気』『雨』『火曜日』など、入っても違和感のない単語がいくつかありますが、こうした単語列が現れる確率を計算した上で提示しているのがLLMです。
高度な計算によって、指示の文脈に従った自然なアウトプットを生成してくれるため、つい会話をしているように人間は勘違いしてしまいますが、生成AIが行っているのはあくまで『計算』です。これを前提知識としてもっておく必要があります」
生成AI≠頭脳 理屈がわかるとハルシネーションとの付き合い方も見えてくる
生成AIは人間のように思考する頭脳をもつわけでなく、あくまで文字列などの与えられた情報に対する返答を確率計算した上で返している。これを踏まえると、生成AIの導入検討時に懸念される「正しい回答が返ってこない」「アウトプットがでたらめ」といった原因が見えてくるはずだ。
「実際に生成AIに触れてみるとわかりますが、彼らは事実に反する情報や存在しない出来事を描写することがあります。こうした現象を『ハルシネーション』と呼びます」
たとえば、生成AIに「ハヤカワ五味とはどんな人物か」と尋ねると、こういった回答が出てくるケースがある。しかし、実際にハヤカワ氏はこうした活動をしておらず、これはハルシネーションによって生まれた「偽情報」だといえる。
ハヤカワ五味は、日本の作家、評論家、イラストレーターで、特にライトノベルやSF、ファンタジーのジャンルで知られています。彼女の作品は独特な視点やキャラクター描写、緻密な設定が特徴で、多くのファンをもっています。
「これは恐らく、『ハヤカワ』という単語からある出版社の情報を拾い上げたのでしょう。そこからもっともらしい単語をつなぎ合わせた結果、事実とまったく異なる回答が出てきました。ちなみに、時間を置いて同じ質問をすると異なる回答が返ってくるはずです。
生成AIに正確性を求めようとすると『なぜ間違った情報を出すのか』と思われるかもしませんが、彼らが行っているのはあくまで『計算に基づく生成』です。この前提条件をしっかりと認識すれば、彼らに任せられる仕事や自社での業務活用の方向性が見えてくるでしょう」