要点テキストから画像を生成する…
解説
ねえねえ智也くん!この『HumanLLM』っていう論文のタイトル、なんか凄そうじゃない?人間をAIにしちゃうの?
人間をAIにするっていうより、AIに「特定の個人の性格や行動」を深く理解させて、シミュレーションできるようにする研究だね。今のAIって、知識はすごいけど「その人らしさ」を理解するのは苦手なんだ。
あー、確かに。誰に対しても同じような答えが返ってくるもんね。でも、なんでAIは「その人らしさ」がわからないの?
それは、AIがネット上の膨大なバラバラのデータを学習しているからだよ。ある人がどんな状況で、何を考えて、どう行動したかっていう「一貫した文脈」を学習できていないのが原因なんだ。
なるほどね!じゃあ、この論文はどうやってそれを解決したの?
彼らは「Cognitive Genome Dataset(認知ゲノムデータセット)」っていう巨大なデータを作ったんだ。RedditやTwitter、Amazonのレビューとかから、550万件以上のユーザーの行動ログを集めたんだよ。
550万件!?すごっ!でも、SNSの投稿って独り言みたいなのも多いし、どうやって学習に使うの?
そこが面白いところでね。心理学に「レヴィンの法則」っていうのがあって、「行動(B)は、その人の特性(P)と環境(E)によって決まる」っていう考え方に基づいているんだ。つまり、その人のプロフィールと、その時の状況をセットにしてAIに教え込むんだよ。
へぇー!「誰が」「どんな状況で」何をしたかをセットにするんだね。具体的にはどんな練習をさせるの?
主に3つのタスクで学習させているよ。1つ目はその人のプロフィール作成、2つ目は「次にどんな行動をとるか」や「その時どう思ったか」を当てるソーシャルQA、3つ目はその人の書き方を真似する練習だね。
「その時どう思ったか」まで当てるの?AIに心が読めるようになっちゃうじゃん!で、結果はどうだったの?
実験の結果、HumanLLMは普通のAIよりも圧倒的に正確にユーザーの行動や思考を予測できたんだ。書き方のスタイルもそっくりに模倣できるし、学習に使っていない新しい社会的な問題に対しても、人間らしい推論ができるようになったんだよ。
すごい!これがあれば、ゲームのキャラがもっと人間味あふれる感じになったりするのかな?
そうだね。ゲームのNPCがもっとリアルになったり、自分専用の完璧な秘書AIができたり、企業のマーケティングで「お客さんがどう反応するか」をシミュレーションしたり、可能性はめちゃくちゃ広いよ。
夢が広がるね!でも、なんか怖くない?私の性格が全部AIにバレちゃうみたいな……。
鋭いね。それがまさに課題なんだ。プライバシーの保護や、AIが嘘をつく「ハルシネーション」の問題、あとは悪用されないための倫理的なガイドラインが、これからの研究では重要になってくるよ。
そっかぁ。じゃあ、私の性格を完璧にコピーしたAIを作って、私の代わりに大学のテストを受けてもらおうかな!
亜美さんの性格をコピーしたら、テスト中に居眠りして単位落とすAIになりそうだから、やめといたほうがいいよ。
要点
- 従来のLLMは数学やコーディングなどの客観的なタスクには強いが、個人の性格や行動の文脈を深く理解しシミュレートすることには限界があった。
- Reddit、Twitter、Blogger、Amazonなどの実世界のデータから550万件以上のユーザーログを抽出した「Cognitive Genome Dataset」を構築した。
- 心理学のレヴィンの法則(行動は人間と環境の関数である:B=f(P,E))に基づき、ユーザーのプロフィール、状況、行動・思考を紐付けて学習させた。
- HumanLLMは、ユーザーの次の行動や内面の思考の予測、書き方の模倣において、既存のモデルを大きく上回る性能を示した。
- 社会科学の研究、パーソナライズされたアシスタント、ゲームのNPC、マーケティング分析など、幅広い分野への応用が期待されている。