OpenAIが2022年に発表したChatGPTは、単にテキストを生成するだけでなく、大規模言語モデルを応用することでまるで人間が話しているような自然な受け答えをするようになったことから注目されています。4回にわたって開かれたデザインセミナーでは、それを可能にしている自然言語処理の基本を学ぶとともに実際にChatGPTに触れ、会話のできるAIのプロトタイピングを行いました。
Day 1〜 10月25日(水)「ChatGPTに触れ、システムをデザインする」
今回のカリキュラムには18名が6つのグループに分かれて参加し、1.ChatGPTや自然言語処理の基本、2.大規模言語モデルのプロンプト作成、3.業務課題などに使用できることを目指した議論AIの作成を学び、議論AIのプロトタイプづくりを行いました。
「本セミナーでは、大規模言語モデルをみなさんの目的に合わせて学習させていくマインチューニングを体験していただきます。このマインチューニングを自分でできるようになると、より業務に合わせたチャットボット、AIシステムを作ることができます。今回は最終的にはチャットボット同士を議論させるところまでを目指します」とファシリテーターの京都大学情報研究科の伊藤孝行先生。
初日はまず、名古屋工業大学情報工学類知能情報分野教授の白松俊先生のレクチャーからスタートしました。
現在のAIは特化型AIと呼ばれており、言語に特化したChatGPTの他に囲碁や将棋などのゲームAIやお絵描きAIなどのように、特定の分野では人間以上にその能力を発揮しています。それに対して人間に近い知能を持ち、自分で考えて判断することができる人工知能のことを汎用AI(AGI)と呼びます。少し前まで汎用AIは漫画や小説に登場する架空のものという位置付けでしたが、急激な技術の進歩によって昨春の時点で25%の確率で2027年、50%の確率で2035年までに実現するだろうと予測されるようになったそうです。
「そのなかでChatGPTが登場したことで、プログラミングの知識がない人でもAIを使うことが可能な世の中になりました。そのことから、ChatGPTの出現は『AIの民主化』と言われています」と白松先生。しかもAPIが公開されたことで、自分たちのシステムにChatGPTを読み込めるようになり、身近な存在として活用できるようになりました。
「つまりChatGPTで単に文章を生成させるだけでなく、例えば架空の小学校の統廃合についての議論をするというプロンプト(指示文)をChatGPTに与えると、学校関係者や自治会、保護者などの登場人物を自動で生成して、それぞれの立場に立った議論を作ってくれます。そこでは、統廃合推進派や反対派などの役割に分かれ、非常に整合性のあるテキストを生成することも可能になりました」。実際に生成されたテキストを見てみると、言語的な知識を超えてAIがまるで世の中の状況も理解しているかのような振る舞いをしていることに驚かされます。
とはいえ、一般社会の中でChatGPTを実際に使ったことのある人は約2割にとどまっているという調査もあり、まだ浸透するには至っていません。その背景には、ChatGPTは検索エンジンではないため、何かを調べようと思うと「それっぽい嘘が含まれるケースがある」ことや「機密内容を入力することで情報漏洩につながる」などの問題点があるからです。
そこで、ここでは上記の問題点に注意を払いながら、実際にハッカソンの企画書をChatGPTに作成させるという体験を行いました。ChatGPTの入力枠に、「#指示」「#ハッカソンの趣旨」を①詳細を決めずに入力した場合と②前提知識を入力した場合とで、生成内容にどれだけの違いがあるかを実感し、より希望内容に近づくような指示の仕方を工夫していきました。
午後からは、「AIに基づく大規模議論支援システム」をテーマに、伊藤孝行先生のレクチャーが行われました。ここでは、伊藤研究室が進めるAIが介在する大規模合意形成支援システム「Collagree」や、エージェント技術に基づく大規模合意形成システム「D-agree」の活用例を示し、AIが議論に介在することで生まれた議論の変化や導入のメリットなどについて紹介されました。
その後は、プロンプト構成の手法を学ぶために、「ChatGPTを使ったAI bot」の作成作業を行いました。ここでは白松研究室で作成された例(# あなた(つまりシステム)のペルソナ設定、# 白松研究室の情報、# 私(つまりユーザ)の情報)を参考に、参加者が独自の設定でプロンプトを作り、生成された情報の感想をグループごとに共有しました。「最初は思い通りにならなかったが、気長に修正をすると最終的にうまくいくようになった」「最初に設けた注意事項が途中で忘れられたり無視されることがある」「インプット済みのことはうまく答えるが、それ以外の情報は一般情報を使って事実とは異なるそれっぽいことを答える」などの感想が寄せられました。
Day 2〜 10月26日(木)「ChatGPTに触れ、システムをデザインする」
2日目はまず、オンラインによる北海道大学大学院情報科学研究員教授の川村秀憲先生のレクチャーから始まりました。川村先生がコンピュータに関心を持つきっかけになった少年時代から現在に至る人工知能の歴史に至るお話のなかで、チェスの世界チャンピオンがコンピュータに負けるという出来事に触れ、「AIと力を合わせることで、人間だけでは不可能な能力を発揮できることがわかりました。これによって人類は自分たちだけでは解決困難な課題を、AIを使って克服することができるかもしれないと思うようになりました」と、AIへの探究心がさらに深まったそうです。それから25年が経ちAIはさらに進化。ChatGPT無料版にアメリカ司法試験を実施させると下位10%レベルの性能なのに対して、有料版では上位10%の成績を収めるなど、私たちは高性能なAIを月に$20で利用できるところまで身近な存在となりました。研究者や開発者さえも予想できない高レベルの人工知能がいよいよ実用段階に入ってきており、AIはチューリング・テストに合格する段階になったとされているそうです。
とはいえ、現時点でのChatGPTは膨大なテキストを学習しているものの、テキストそのものをナレッジとして利用しているわけではなく、人に仕事を教えるようにプロンプトを通して十分な教育(プロンプトエンジニアリング)を行うことが重要であり、人工的知能と人との信頼性の構築が課題となっているそうです。
このように進化するテクノロジーの先には何があるのか。川村先生は「テクノロジーは指数関数的に進歩していることが知られていますが、ChatGPTの登場はテクノロジーの進化が垂直に立ち上がる、シンギュラリティの壁の入り口に今いることを認識しないといけないと思っています。10年前にはテスラがEV車を量産して世界中に供給することが想像できなかったように、数年後にはテスラのヒューマノイドが建設現場で活躍している未来があるかもしれません」。
今後、人とAIと差別化するためには、私たち自身の「多様な価値観、能力の追求」「人工知能にできないことの追求」が必要だと川村先生。「世界中で自分しか考えていないこと、自分しかやっていないこと、自分しか興味がないことがとても重要です。外れ値は人工知能化されないため大きなバリューを持っています」。
すでに社会システムやインフラが整っている先進国よりも発展途上国の方がスピード感を持ってAIを導入しやすいこともあり、私たちも古い価値観から脱却して対応しないと世界の競争から乗り遅れてしまうという危機感を持たなくてはいけないのかもしれません。
講演後は、「文書の質を高める議論
AIのデザイン」の実践を行いました。通常、複数の人が議論をするのと同じように、ChatGPT上に3〜4名のペルソナ及び前提知識を設定して、それぞれの役割分担を明確にしつつ議論をさせた上で何らかの新規事業を立ち上げるための企画書を作り、最終的に議論をまとめて事業計画や定款の作成を目指します。
この作業を行うために活用したのがGoogle
Colaboratoryです。これはブラウザから直接Pythonを記述実行できるサービスで、ここではOpenAIのAPIを通してPythonからChatGPTに接続し、さらにオープンソースのweb議論型掲示板であるDiscourse上でAIチャットbotの試作を行っていきました。
まずはグループ内で新規事業の方向性を決めるためのアイデア出しを行い、そのために必要なペルソナを設定した上で実際にPythonのサンプルコードを用いてColaboratoryに読み込み、プロンプトを作っていきます。プロンプトの内容を少しずつ変えていくことで、どのような文章が生成されるかをグループワークで体験し、最後に全体で共有を行いました。
【中間発表テーマ】
A:「スターウォーズの銀河帝国がスタートアップだったら?」銀河系の惑星を調査して資産価値を把握する。
B:「異世界人材派遣会社」。産業革命の中で人材不足に陥っている異世界に現実世界から人を派遣する企業。
C:「ウルトラマン協会との事業提携」。地球人が宇宙に進出した先で交流をしていく。
D:キッチンカー方式で提供するAI占い。アプリに個人の日記を入れてもらいビッグデータを収集し、マッチング等を行う。
E: ChatGPTにブレストさせて多様な職種から5人のペルソナを選出した上で、どんなビジネスが儲かるかを議論させていく予定。
F:動物との共生を通じた幸せな社会づくりを目指して、ペルソナに動物を加えて議論。
次回までに今回発表した内容を5分程度のスライドにグループでまとめておくとともに、具体的にプログラムを作ってプロトタイピング作りに取り掛かるという宿題が出されました。
Day 3〜 11月8日(水)「文書生成と議論AIのプロトタイピング」
3日目は、午後からオンラインにて開催されました。前回の最後に出された宿題の進捗状況について、グループごとに報告がありました。ChatGPTのAPIを使ったPythonプログラムについては、各グループから、「次の発言者をランダムに選択するよう工夫した」「議論が進むにつれてペルソナの設定が弱くなる傾向があった」「全員が肯定的な意見で、リスクをあまり考えていない」「議論の途中で人間が介入できるようにしたい」といった意見や感想がありました。
その後、「ChatGPTとLLM(大規模言語モデル)」をテーマとして、LLMの学術的な背景について、伊藤先生と丁先生のレクチャーが行われました。ChatGPTでも使われているLLMでは、Transformerと呼ばれる仕組みを使って、与えられた単語列から次の単語を予測したりしていること、パラメータ(層)を増やすほど正答度が上がることが近年わかってきたこと、などについて紹介されました。
講演後は、「ファインチューニング」の簡単な演習が行われました。ChatGPTで理想的な回答を得るには、タスクに特化したモデルを再学習させる方がより良いとのこと。今回は、Pythonのサンプルプログラムを使って、ファインチューニングのやり方を体験しました。
続いて、「起業のための書類を作成する」をテーマに、各グループで検討している事業について、定款、登記申請書、事業計画書をChatGPTに生成させる演習を行いました。ここではまず、ChatGPTに議論させることなく、これらの文書を生成させました(パターン0)。演習の終わりに、作業内容と生成された文書を全体で共有し、「テンプレート的な内容は生成されたが、具体的な内容が弱い」といった説明がありました。「具体的なペルソナを指定したり、追加の指示を与えた」というグループもありました。
Day 4〜 11月22日(水)「AIと議論しよう」
4日目は午後からのスタート。パターン0(議論なしでChatGPTに書かせた文書:比較用)、パターン1(AIだけの議論内容を使って書かせた文書)、パターン2(AIと人間の議論内容を使って書かせた文書)の3つのパターンのうち、前回作成したパターン0に続けて、今回はパターン1と2で定款・登記申請書・事業計画書を作成する作業を行い、同じ前提条件で生成内容にどのような変化があるかを比較するとともに、発表の準備を進めました。
【発表】
A:銀河リソースエクスプロレーション株式会社
パターン0では、支配する惑星は1個だけだったが、パターン1では、議論内容を踏まえて惑星を3つ挙げた。パターン2では人間の発言によりいきなり話題が変わってしまい支配する惑星の情報がなくなったため、ファシリテータ役のAIを置いた。過去の議論を都度要約して意見に反映させるようにしていれば、話題がいきなりそれることはなかったと考えられる。
B:じゃんけん株式会社
パターン1やパターン2の方が内容が具体的になり、代表者名や資本金額も入力された。パターン1では最初の発言者の意見が肯定される傾向にある、残り2人も同調してしまった。また、具体的な案は例外を除いてなかなか提案してくれず、指示を出してもふわっとしたままだった。一方で、パターン2では、ファシリテーターの発言に引っ張られることがあったが、話題転換時に「ここまでの議論は忘れて違う議論に入ってください」と指示をしたのは効果的だった。
C:事業計画書: 地球−ウルトラマン共同事業
ペルソナの詳細情報が膨らみきっていなかったためか、パターン0では一般的な内容が多かった。しかしパターン2で我々の意見を出すとより深い議論ができ、最終的に我々がやりたいと思っていたことがちゃんと文書にできたと思う。
D:AI占い移動式キッチンカー
議論なしでは与えた情報のみとなり、議論ありでは具体的ではあるが、例えば資本金が「10億円」というように現実離れした数字になった。人がファシリテーターとして介入するとそれっぽいものになるなど現実味をおびるようになった。とはいえ最終的にその人が介入することで結果はよくなるが、まだまだ追いついてないところがあると思った。
E:持続可能な食と住まいの融合
人が介在したほうが具体的になった。人が介在しないとペルソナ設定を強く引きずってしまい、異業種のペルソナ同士の議論だと平行線になってしまって、事業内容が発散してしまったように感じた。
議論する前に、注意事項として一つの事業について着目するようにすると発散が少なくなった。
F:動物との共生を通じて、人々の幸福を追求する新規事業「モルファーズ・ザ・パブ」
人間が入ることによって、事業内容が具体的になった。AIだけだと議論が収束することがなかった。もしファシリテーター専用のAIが介在したら結果が違ったかもしれない。AIで議論をさせるにしても、プロンプトが大事だと感じた。また、全体的に要約グセがあるように思った。
発表終了後には全員で投票を行い、最優秀賞にBグループ、優秀賞にE、Fグループが選ばれました。
伊藤先生は「ChatGPTにPythonを組み合わせたり人間がファシリテーターとして参加することで、生成される内容に差が生まれることを実感していただけたかと思います。今後研究者としては、人間の意思決定などにAIが生成した意見がどの程度受け入れられるべきかについて真剣に考えていけないと考えています」と今後の課題について触れ、白松先生は「職場にAIが入ってきたときにどのように付き合っていくべきか、このセミナーで先取り体験をしてもらえたと思います」と業務での活用に期待を寄せ、4日間のセミナーを締めくくりました。