解説

AMI HAPPY

ねえねえ智也くん!この『RedSage』って論文、何だか強そうな名前だね!赤い賢者?魔法使いか何かの研究?

TOMOYA NEUTRAL

いや、魔法じゃなくてサイバーセキュリティに特化したAIの研究だよ。RedSageは、ハッカーの攻撃からシステムを守るための専門知識を持ったモデルなんだ。

AMI SURPRISED

へー!でも、今のAIって何でも知ってるし、わざわざセキュリティ専用のを作る必要あるの?

TOMOYA NEUTRAL

そこが重要なポイントなんだ。有名なAIは便利だけど、会社の機密データを送ると情報漏洩のリスクがある。かといって、自分のパソコンで動かせる公開モデルは、セキュリティの専門知識が足りないことが多いんだよ。

AMI HAPPY

なるほど!「秘密は守りたいけど、めちゃくちゃ詳しい専門家が欲しい」ってことか!

TOMOYA NEUTRAL

その通り。だからこの論文では、まず『継続事前学習』っていう手法を使っている。これは、すでにある程度賢いAIに、さらに118億トークン分ものセキュリティ専門のデータを読み込ませて、知識を上書き・強化するプロセスなんだ。

AMI SURPRISED

118億……!気が遠くなる量だね。でも、ただ本を読ませるだけで賢くなれるの?

TOMOYA NEUTRAL

知識だけじゃなくて「使いこなし方」も大事だよね。そこで『エージェントによるデータ拡張』っていう面白いことをしているんだ。AIに「計画役」と「実行役」を分担させて、専門家同士のリアルな対話データを26万件以上も自動で作らせたんだよ。

AMI SURPRISED

えっ、AIが自分で自分の練習問題を作ったってこと?それってズルじゃないの?

TOMOYA NEUTRAL

ズルじゃないよ。高品質なデータが少ない分野ではすごく有効な手法なんだ。これによって、セキュリティツールの使い方や、攻撃の防ぎ方を具体的に対話形式で学べるようになるんだよ。

AMI HAPPY

へぇ〜!それで、そのRedSageちゃんはどれくらい頭が良くなったの?

TOMOYA HAPPY

『RedSage-Bench』っていう3万問以上のテストで評価したんだけど、他のモデルより圧倒的に高いスコアを出したんだ。しかも面白いことに、セキュリティ以外の一般的なテストの点数も上がったらしいよ。

AMI SURPRISED

専門の勉強をしたら、地頭まで良くなっちゃったってこと?すごすぎる!

TOMOYA NEUTRAL

専門的な推論を繰り返すことで、論理的な思考力が鍛えられたのかもね。このモデルはオープンソースで公開されているから、世界中の企業が安全に専門AIを使えるようになる可能性があるんだ。

AMI HAPPY

世界中のセキュリティ担当者さんの強い味方になりそうだね!

TOMOYA NEUTRAL

そうだね。ただ、サイバー攻撃の手法は毎日進化しているから、常に最新のデータを学習し続けないといけないっていう課題もある。これからは、どうやって効率よく知識をアップデートしていくかが研究の焦点になるだろうね。

AMI HAPPY

よし!私も今日から赤い服を着て『RedSage亜美』として、智也くんのパソコンのセキュリティを見守ってあげるね!

TOMOYA NEUTRAL

……形から入っても知識は増えないよ。見守る前に、まずはその付箋に書いて貼ってあるパスワードを剥がすところから始めなよ。

要点

  • サイバーセキュリティに特化したオープンソースのLLM「RedSage」を開発した。
  • 118億トークンの専門データを用いた継続事前学習(Continual Pre-training)により、深いドメイン知識を獲得させた。
  • AIエージェントを活用して専門的な対話データを自動生成する「エージェントによるデータ拡張」を行い、26.6万件の高品質な微調整用データを作成した。
  • 独自の評価ベンチマーク「RedSage-Bench」を構築し、既存のモデルを大幅に上回るセキュリティ知識と実務スキルを確認した。
  • 専門分野だけでなく、一般的な推論能力や指示遂行能力も向上していることが示された。