感情に騙されるな！AIの弱点を克服するフェイクニュース検出の最新技術

1月 22 2026

解説

ねえねえ智也くん！この論文のタイトル見てよ。『センチメント攻撃』だって！なんだか格闘ゲームの必殺技みたいでカッコよくない？

必殺技じゃないよ。これはフェイクニュースを検出するAIが、文章の『感情』、つまりセンチメントに騙されやすいっていう弱点を突いた攻撃の研究だよ。

えっ、AIも感情に流されちゃうの？人間味があってちょっと可愛いじゃん！

可愛くないよ。深刻な問題だ。今のAIは、怒りや悲しみが強い文章を『偽物』、冷静で中立的な文章を『本物』だと判断しがちなんだ。これを『バイアス（偏り）』って言うんだけど、攻撃者はそこを突いてくる。

バイアス……。つまり、嘘つきがすごく冷静に話してたら、AIはコロッと信じちゃうってこと？

その通り。この論文では、LLMを使ってニュースの事実は変えずに、言い回しだけをポジティブや中立に変える攻撃を試しているんだ。そうすると、既存の検出器の精度がガタ落ちすることが分かった。

うわぁ、詐欺師のテクニックみたい。それで、どうやって対策するの？

そこで提案されたのが『AdSent』っていうフレームワークだ。まず、LLMを使ってニュースをあえて『中立的な表現』に書き換える。その中立化した文章でAIをトレーニングするんだ。

あ、わかった！感情っていう「見た目」に惑わされないように、すっぴんの状態にしてから中身をチェックさせる訓練をするんだね！

……例えは独特だけど、概ね合ってるよ。感情というノイズを削ぎ落として、事実関係だけで真偽を判断させる『センチメント・アグノスティック（感情に依存しない）』な学習手法だね。

実験の結果はどうだったの？そのAdSentちゃんは強いの？

かなり優秀だよ。3つの有名なデータセットで実験して、既存のどのモデルよりも高い精度と、攻撃に対する強さを見せたんだ。未知のデータに対しても応用が効くことが証明されている。

すごい！これがあれば、ネットの怪しいニュースも全部見破れちゃうね！

いや、まだ課題はある。今回はテキストだけだけど、今後は画像や動画を組み合わせた高度なフェイクへの対応も必要になるだろうね。悪意のあるLLMの使い道はどんどん進化しているから。

なるほどねぇ。よし、私もAdSentで自分を鍛えて、智也くんが隠してるお菓子の場所を突き止めるぞ！

それはフェイクニュースじゃなくてただの探し物だろ。あと、お菓子なんて隠してないから。

投稿日:AI