スパコンの爆速設定をLLMが5回で見抜く！？自律型チューニングエンジン『STELLAR』

2月 27 2026

解説

ねえねえ智也くん！「STELLAR（ステラ）」っていう名前の論文を見つけたよ！星みたいでキラキラしてて可愛い名前だね！これって宇宙の研究なの？

いや、宇宙とは全然関係ないよ。これはスパコンとかで使う「並列ファイルシステム」っていう巨大なストレージの性能を、LLMを使って自動で最適化する研究だね。

えー、宇宙じゃないんだ。ストレージの最適化って、スマホの写真を整理して容量を空けるみたいなこと？

それとはちょっと違うかな。並列ファイルシステムには、データの書き込み方とか通信のやり方を決める「設定のツマミ」が数百から数千個もあるんだ。これを正しく調整しないと、せっかくのスパコンも宝の持ち腐れになっちゃう。

ツマミが数千個！？そんなの、どれを回せばいいか分かんなくなっちゃうよ。私なら適当に回して壊しちゃいそう……。

まさにそこが問題なんだ。今までは専門家が時間をかけて調整するか、AIに何千回も試行錯誤させるしかなかった。でも、この論文の「STELLAR」は、人間みたいに考えて、たった5回くらいの試行でほぼ最高の性能を引き出せるんだよ。

たった5回！？すごすぎる！どうしてそんなに早く正解が分かるの？超能力？

超能力じゃないよ。STELLARは「RAG（検索拡張生成）」っていう技術を使って、システムの分厚いマニュアルを読み込んで勉強するんだ。さらに「Darshan（ダーシャン）ログ」っていう、アプリがどうやってデータを読み書きしたかの記録を分析して、どこがボトルネックかを見抜くんだよ。

へぇー、お勉強してから挑むんだね。偉いなぁ。でも、LLMってたまに自信満々に嘘をつく「ハルシネーション」があるって聞いたことあるよ？大丈夫なの？

鋭いね。STELLARは複数のエージェントを組み合わせて、お互いにチェックさせたり、実行結果を見て「あ、今の設定はダメだったな」って反省して知識を蓄積する仕組みを持ってるんだ。これで嘘や間違いを防いでるんだよ。

反省までできるなんて、私よりしっかりしてるかも……。それで、実際にどれくらい速くなったの？

実験では、デフォルトの設定より最大で7.8倍も速くなったケースがあるらしい。しかも、一度も見たことがない新しいアプリに対しても、過去の経験を活かしてすぐに最適な設定を見つけられるんだって。

7.8倍！お昼休みが1時間から7分くらいに短縮されるようなものだね！……あ、それは困るかも。

仕事が早く終わるって考えなよ。この研究が進めば、専門家がいなくても誰でもスパコンをフル活用できるようになるし、他の複雑なシステムの調整にも応用できる可能性があるんだ。すごく夢があるよね。

なるほどねー。じゃあ、私の「今日の晩ごはん何にするか問題」も、STELLARくんに5回以内で決めてもらおうかな！

それは冷蔵庫の中身を見て自分で考えなよ。STELLARはスパコン用であって、君の献立用じゃないからね。

大規模な並列ファイルシステム（PFS）の性能調整は、設定項目（パラメータ）が数百から数千もあり、専門家でも非常に時間がかかる困難な作業である。
従来の自動調整手法（機械学習や強化学習）は最適解を見つけるのに数百から数千回の試行が必要だったが、提案手法「STELLAR」はわずか5回程度の試行で専門家レベルの最適化を実現する。
STELLARはLLMを活用した自律型エージェントであり、マニュアルの読み込み（RAG）、I/Oログ（Darshan）の分析、実行結果に基づく自己反省、知識の蓄積を自動で行う。
マルチエージェント設計を採用することで、LLM特有の「ハルシネーション（嘘をつく現象）」を抑制し、推論の安定性を高めている。
実際の評価では、デフォルト設定と比較して最大7.8倍の高速化を達成し、未知のアプリケーションに対しても高い汎用性を示した。

投稿日:AI