LLMによるプログラム修正と事実選択問題

4月 10 2024

解説

AMI HAPPY

ねえ智也、この論文のタイトル見て興味深いと思ったんだけど、内容を簡単に教えてくれない？

TOMOYA NEUTRAL

もちろんだよ。この論文は、大規模言語モデルを使ったプログラムのバグ修正において、どのような事実をプロンプトに含めるべきか、という問題に取り組んでいるんだ。

AMI CURIOUS

事実って、具体的にはどんなもの？

TOMOYA NEUTRAL

例えば、スタックトレースやGitHubの問題報告など、バグに関連する情報だよ。これらをプロンプトに含めることで、モデルのバグ修正能力が向上するんだ。

AMI CURIOUS

へぇ、それでどうやって研究したの？

TOMOYA NEUTRAL

19K以上のプロンプトを用いて、314のバグを含むオープンソースのPythonプロジェクトを修正する実験を行ったんだ。それぞれ異なる7種類の事実を組み合わせてね。

AMI CURIOUS

結果はどうだったの？

TOMOYA NEUTRAL

各事実が異なるバグを修正するのに役立つことがわかったよ。でも、事実の数が多すぎると、結果が悪くなることもあるんだ。

AMI CURIOUS

じゃあ、どうすればいいの？

TOMOYA NEUTRAL

「事実選択問題」として定義し、与えられたタスクに対して最適な事実のセットを選択する方法を見つけることが重要だと論文では述べているよ。

AMI CURIOUS

なるほどね！これからの研究の方向性は？

TOMOYA NEUTRAL

この問題に対するより効果的な解決策を見つけるための研究が必要だね。特に、どの事実が最も影響力があるかを自動で判断できるようなシステムの開発が期待されているよ。

AMI HAPPY

へぇ〜、AIって本当に賢くなっていくんだね。でも、私のような天然も直してくれるかな？

TOMOYA SURPRISED

それは…AIの能力を超える問題かもしれないね。

バグ関連の事実（スタックトレースやGitHubの問題など）をプロンプトに含めることで、大規模言語モデル（LLM）のバグ修正能力が向上することが示されている。

どの事実を、どれだけの数含めるべきかが、正確なバグ修正のための重要な問題である。

19K以上のプロンプトを用いた大規模研究を実施し、314のオープンソースPythonプロジェクトのバグを修正した。

各事実は、それぞれ異なるバグを修正するのに役立ち、使用する事実の数が多すぎると成果が低下することがわかった。

最適な事実のセットを選択する「事実選択問題」を定義した。

投稿日:AI