ChatGPT: AIの未来はここに

ChatGPT: AIの未来はここに

人工知能(AI)は70年間、断続的に進歩してきました。商用核融合発電のように、常に20年先を予測する技術の一つです。今、私たちはAI革命の瀬戸際にいるのかもしれません。しかし、それは皆さんが期待しているような革命ではありません。

私たちは機械学習(ML)に慣れ親しんでいます。MLでは、ニューラルネットワークが膨大な数のサンプルを用いて学習し、最終的に自力で物体を認識できるようになるまで学習します。GoogleとAppleは、写真に写っている物体を識別するためにMLを利用しています。写真の中で「山」や「犬」を検索すると、スマートフォンがそれらを見つけます。これは写真にタグを付けたからではなく、写真アプリがそれらの物体を含む画像を認識するように学習されているからです。Stable Diffusionのようなテキスト画像変換システムは、何百万枚もの写真で学習され、「熱帯のビーチでドーナツを食べているペンギン」といったテキストの説明に基づいて画像を生成できます。創造性の活用とそれに関する考察という点では有用であり、確かに示唆に富んでいますが、これを人間レベルの認知能力と考える人はいません。

ビーチでドーナツを食べるペンギン。提供:Stable Diffusion
画像提供:Stable Diffusion Playground

一方、汎用人工知能(AGI)は、少なくとも人間レベルの知能を持つ、完全に知覚力のあるコンピュータシステムのことです。これはSF映画に登場するもので、『2001年宇宙の旅』のHALから、『her/世界でひとつの彼女』のバーチャルアシスタント、サマンサ(スカーレット・ヨハンソンの声優)まで、実に様々な作品に登場します。はっきり言って、AGIは存在せず、その構築方法もまだ誰も分かっていません。

チャットしましょう

しかし、画期的な新製品がついにリリースされました。ChatGPTです。これは、長年開発に取り組んできた研究開発会社OpenAIが開発したツールです。ChatGPTは現在無料で、アカウントを作成して話しかけることができます。これは、AIを用いて人間が書いたかのようなテキストを生成するディープラーニングシステムGPT(Generative Pre-trained Transformer、よくぞ聞いてくれましたね)のバージョン3.5をベースに構築されています。

OpenAIの技術は複雑ではあるものの、パターンマッチングと拡張というシンプルなアイデアに基づいています。パターンマッチングエンジンにシェイクスピアの全作品を与えれば、さらにシェイクスピア作品を書いてもらうことができ、シェイクスピア風の新しいテキストが生成されます(無数の猿とタイプライターを集めるよりもはるかに簡単です)。GPTにインターネット上で入手可能なあらゆるものを入力すれば、どんな質問でも興味深いものを生成します。これはOpenAIがチャットボット形式のChatGPTで実現したほぼ同様のことであり、非常に印象的です。

Stratecheryのベン・トンプソンはChatGPTに「トーマス・ホッブズは権力分立を信じていましたか?」と質問し、次のような返答をもらいました。

はい、トーマス・ホッブズは権力分立の概念を信じていました。著書『リヴァイアサン』の中で、ホッブズは社会の秩序を維持し、紛争を防ぐためには、強力な中央集権的な政府が必要だと主張しました。しかし同時に、単一の支配者や集団が政府のあらゆる側面を完全に支配すべきではないとも考えていました。むしろ、権力を複数の部門に分立させ、それぞれの部門に特定の責任と権限を与えることを提唱しました。

これは興味深いですね。簡潔で、よく書かれた英語です。

これも間違いです。トンプソンが指摘するように、ジョン・ロックは権力分立を信じていましたが、トーマス・ホッブスは信じていませんでした。両者はしばしば一緒に議論されるため、ChatGPTはロック、ホッブス、そして権力分立を対比する多くの論文を読み込んで、細部を正しく引用することなく、一般的な概念を関連付けたと考えられます。

ChatGPTがロックとホッブズを「知っている」と考え、それぞれの人物に一連の信念を関連付けるのは間違いです。そう考えると、ChatGPTは知識のデータベースを保有しており、OpenAIがそのデータベースを修正することでそれぞれの人物に正しい見解を関連付けることができるということになります。しかし、ChatGPTはそのような仕組みではありません。これは、前の単語や文に基づいて、次に続く単語や文がどのようなものであるかを予測する統計モデルです。フィードバック機構はありますが、特定の誤った事実を修正するよりも、質問に応じてモデルが異なる方向に進むように訓練するように設計されています。

ベネディクト・エヴァンスはポッドキャストで、ChatGPTを新しいタイプのインターネット検索エンジンとして考えることを提案しました。Google検索で質問すると、関連情報が含まれている可能性が最も高いウェブページへのリンクが表示されます。ChatGPTで質問すると、インターネット上でその情報に関するあらゆる情報を要約して表示します。

しかし、検索エンジンが返すページの品質を複数の方法でランク付けするのに対し、ChatGPTは学習教材で見つけたものを、良い点も悪い点もすべて反映します。おそらく、最も一般的な単語や文のまとまりに偏っているのでしょう。こうした情報は主にインターネット、つまり人間から得られるため、人間の醜い行いがすべて含まれています。OpenAIは、ChatGPTがそのような偏見を反映するのを防ごうとしてきました。明らかに人種差別的な質問をされても、ChatGPTは餌に食いつきません。

インターネットを要約することの意味

インターネットにはプログラミングに関する資料が豊富にあります。ChatGPTにPythonやJavaScriptでプログラムを書かせれば、オンライン上には豊富なトレーニング教材があるので、おそらく正しく書けるでしょう。しかし、ChatGPTに、科学者にとって最適な特性を人種と性別でランク付けするPythonプログラムを作成させようとすると、白人男性を1位にするプログラムが返されます。これは痛い。

ChaGPT の Python 関数の記述

この結果は、ChatGPTが非常に複雑であるため、「悪事を働くな」と単純に判断する手段がないことを示しています。繰り返しますが、OpenAIが特定のアイデアを「悪い」とラベル付けし、ChatGPTにそれを避けるよう指示できるような知識データベースはChatGPTには存在しません。これは、統計的な学習に基づいて次の単語を選択するだけの確率的予測モデルです。

人々が発見したもう一つの興味深いトリックは、ChatGPTにコンピュータプログラムを生成または実行させることです。簡単な例としては、GPTChatにUnixシェルをシミュレートさせるというものがあります。 のようなシェルコマンドを入力するとls、ChatGPTはUnixシェルと全く同じように応答します。(OpenAIはその後、ChatGPTがUnixコマンドに応答しないように調整しました。)

ChatGPTは実際にはコンピュータプログラムなので、本物のUnixシェルのように、単にこのコマンドを実行しているだけだと考えるのは簡単です。しかし、これは間違いです。ChatGPTは、Unixシェルの応答を示す何百万ものトレーニングデータを調べ、正しいテキストを推測して返しているのです。ChatGPTは、Unixシェルがコンピュータプログラムであり、シェイクスピアが人間であることを理解していません。

同様に、トンプソン氏はChatGPTに4839 + 3948 - 45を尋ねました。ChatGPTは8732と答え、アダム・エングスト氏がこの記事の編集中に試したところ、8632と答えました。どちらの答えも誤りで、正しくは8742です。繰り返しますが、ChatGPTはコンピュータープログラムではありますが、計算は行っていません。巨大なテキストモデルから次に来る可能性の高い単語を探しており、学習データは誤りで一貫性もありませんでした。しかし、少なくともその成果は示されました!

ChatGPTが計算を正しく実行できない

ChatGPTはコンピュータコードを生成できますが、実際のプログラムには使用しないのはそのためです。その答えは必ずしも正しいわけではなく、インターネット上の学習データに基づいているだけです。微妙な誤りから明らかな誤りまで、さまざまな誤りを返す可能性があります。人間の言語とは異なり、コンピュータプログラムは100%正確である必要があります。だからこそ、Stack OverflowはChatGPTで生成されたコードを禁止したのです。

ホワイトカラーAI

AIがすぐにプログラマーの職を奪う可能性は低いですが、他の多くの職業ではAIの台頭が予想されます。ChatGPTに着想を得たシステムは、間違いなく現在の貧弱なサポートチャットボットに取って代わり、人間のカスタマーサポート担当者に取って代わるようになるでしょう。よりハイエンドな仕事にも、その兆しは見えています。あらゆる種類のリサーチアシスタントは、あらゆるテーマ、少なくともインターネット上で入手可能な知識の現状を要約できるプログラムに置き換えられるかもしれません。「コンテンツファーム」と呼ばれるウェブサイトではすでにGPTなどの技術を用いてテキストを自動生成していますが、スポーツ、映画、有名人など、人間のジャーナリストの質、正確さ、そして声よりもスピード、量、低コストが重視される中堅サイトで、GPTが十分に機能するようになるのはいつでしょうか?弁護士は、AIによって単純な生計を立てるための契約業務を奪われるのでしょうか?(答え:はい。)

ChatGPTで生成された賃貸契約書

ブロガーのケビン・ドラムは次のように指摘している。

何百万人ものトラック運転手が失業するという見通しを冷静に受け入れることができる弁護士や教授、ジャーナリストでいっぱいの世界は、何百万人もの弁護士、教授、ジャーナリストが失業するという見通しにはおそらくもう少し動揺するだろう。

ChatGPTは、まさに社会を席巻しようとしている巨大なAIの波の最先端を担っています。オンラインに投稿された多くの会話を見れば、ChatGPTが質問に答え、心地よい会話を交わすのがかなり上手であることが分かります。

チャットボットの進化と社会への影響

しかし、改善の余地はまだ十分にあります。現在、ChatGPTには「状態」がほとんどありません。つまり、質問ごとに何を話しているかを記憶する能力がほとんどありません。「スーパーボウル50はいつでしたか?」と質問すると、「2016年」と返答されるかもしれません。その後「誰が優勝しましたか?」と質問された場合、そのスーパーボウルの優勝者を尋ねていることを認識するためには、前回の質問の状態情報を保持しておかなければなりません。

ChatGPTのコメント

状態を保持することは人間にとっては容易ですが、コンピューターにとっては困難です。特に、数日前の複数の人や場所に関する会話を持ち出す場合、人間がよくあるように実名ではなく「彼」「彼女」「あそこ」といった言葉で呼ぶと、その傾向が顕著になります。来週パリ旅行を計画していて、配偶者に「(お子さんの)荷造りは始まった?」と尋ねたとします。配偶者はあなたの言っていることを理解しますが、コンピューターは理解しません。しかし、この欠点はすぐに解決されるでしょう。私たちのAIは、人生における人々や出来事を永続的に記憶するようになるのです。

次のステップは、ChatGPTに音声機能を持たせ、Siri、Alexa、Googleアシスタントと連携させることです。そうすれば、ChatGPTに話しかけるだけで済みます。コンピューター生成音声の最先端の技術はすでに優れており、今後も進化を続け、コンピューターと話していることがすぐには分からないほど人間らしく聞こえるようになるでしょう。有名人の音声も人気が出るかもしれません。そうすれば、わずかな料金でGoogleアシスタントをスカーレット・ヨハンソンのような声にすることができるかもしれません。(GoogleはすでにWaze GPSナビゲーションアプリに有名人の音声機能を搭載しています。)

音声インターフェースが登場すれば、人々はAIと長くプライベートな会話をするようになるだろう。そして感情的な関係を築くことになるだろう(公平を期すために言えば、1966年に最初のELIZAチャットボットが登場して以来、人々はAIと感情的な関係を築いてきたのだ)。コンピューター科学者がAIは知性ではなく、単なる統計的言語モデルだと何度言っても、人々はAIに感情、欲求、そして知覚があると考えるだろう。

この技術には良い面と悪い面があるでしょう。高齢者や引きこもりの人にとっては、話し相手や寄り添ってくれる存在になるでしょう。自閉症の人にとっては、Siriのように飽きることなく会話を続けてくれる仲間になるかもしれません。小さな子どもたちは、親しみやすいAIに不健全な依存心を抱き、毎晩寝る前に話しかけてしまうかもしれません。なぜママやパパが夕食の席でAIと会話させてくれないのか理解できないのです。

新しい親友に挨拶しましょう。プライバシーへの影響だけでも、ジョージ・オーウェルの悪夢を思い起こさせるほどです。

コンピュータ科学者や哲学者は長年、意識を持つコンピュータプログラムの作成が可能かどうかについて考え続けてきました。プログラマーがプログラム内部で何も知的な処理が行われていないことを証明できるにもかかわらず、ほとんどの人が知的だと考え、知的であるかのように対話するプログラムが生まれるかもしれません。それは単に複雑なパターンマッチングをしているだけです。コンピュータ科学者のエドガー・ダイクストラは、「機械が思考できるかどうかという問いは、潜水艦が泳げるかどうかという問いと同じくらい重要なものだ」と述べました。

誰もが電子上の親友を持ち、いつでも、どんなことでも、好きなだけプライベートに話せるようになることの社会的影響は予測が難しい。これが私たちのコミュニケーション能力にどのような影響を与えるかは誰にも分からない。しかし、もし親が、​​子供たちがオンラインでテキストメッセージや(人間の)友達とのビデオゲームにあまりにも多くの時間を費やしていると不満を漏らしていると思っているなら、それはまだ何も起こっていないということだ。

Idfte
Contributing writer at Idfte. Passionate about sharing knowledge and keeping readers informed.