AIがルーマニア語の童話作家に！？超コンパクトなモデルを作る魔法のレシピ

1月 17 2026

解説

ねえねえ智也くん！この『TF3-RO-50M』って論文、なんだか強そうなロボットの名前みたいでカッコいいね！これって何の研究なの？

ロボットじゃないよ。これはルーマニア語に特化した、すごく小さくて賢いAIモデルをゼロから作るための研究だよ。TFは『TinyFabulist』、つまり『小さな寓話作家』っていうプロジェクトの第3段階なんだ。

ルーマニア語！ドラキュラさんの故郷の言葉だね！でも、英語とかの有名なAIじゃダメなの？

そこが問題なんだ。ルーマニア語は単語の形が複雑に変わる言葉なんだけど、今の主流なAIは英語が得意な設計になってる。だからルーマニア語を入力すると、単語を細切れにしすぎて効率がすごく悪くなるんだよ。これを『トークン・インフレーション』って呼んでいる。

トークン……？ゲームセンターのコインが膨らんじゃうの？

違うよ。トークンっていうのは、AIが言葉を理解するために文章を区切る最小単位のこと。この論文では、ルーマニア語専用の『トークナイザー』、つまり言葉の切り分け機を自前で作ることで、その問題を解決したんだ。

なるほど、ルーマニア語専用のハサミを作ったってことだね！それで、どうやって学習させたの？

面白いのが、インターネットの雑多なデータじゃなくて、AIが作った『道徳的な寓話』っていう綺麗なデータだけで学習させたことだね。約10億トークン分もの物語を読み込ませて、5165万パラメータっていう、今の基準からすると驚くほど小さなモデルをゼロから作ったんだ。

えっ、5000万ってすごそうだけど、AIの世界だと小さいの？

最近の有名なモデルは数千億とかあるから、それに比べたら豆粒みたいなものだよ。でも、この論文はさらにそれを半分近くまで小さくしたんだ。『知識蒸留』っていう、大きなモデルの知識を小さなモデルに教え込む手法や、不要な部分を削る『剪定（プルーニング）』を使ってね。

ダイエットさせた上に、英才教育までしたんだ！それで、その小さなAIちゃんはちゃんと動いたの？

結果は良好だよ。文法チェックや物語の一貫性、それに人間（あるいはもっと大きなAI）による評価でも、すごく高いスコアを出したんだ。最終的には、その小さくなったモデルを使って、新しく300万個ものルーマニア語の物語を作り出すことにも成功したんだよ。

すごい！小さくても立派な作家さんになったんだね。これって、これからどう役に立つのかな？

リソースが少ない言語でも、工夫次第で高性能なモデルが作れることを示したのが大きいね。スマホとかの非力なデバイスでも、その言語に特化した賢いAIが動かせるようになるかもしれない。ただ、今は『寓話』っていう特定の分野に特化してるから、日常会話とか専門知識にはまだ課題があるけどね。

じゃあ、次は私のために『お菓子を無限に食べても太らない魔法』についての寓話を書いてもらおうかな！

それは道徳的な寓話じゃなくて、ただの君の願望でしょ。少しは現実を見なよ。

投稿日:AI