スタンプの裏に隠れた悪意を見抜け！AIが配信チャットの守護神になる話

1月 26 2026

解説

ねえねえ智也くん！この『ToxiTwitch』って論文、名前が強そうだね！毒ヘビを育てるゲームの攻略法かなんか？

いや、全然違う。これはTwitchっていうライブ配信サイトで、荒らしとかの「有害なコメント」をどうやってAIで見つけるかっていう研究だよ。

あ、配信のチャット欄ね！たまにすごい勢いで流れていくやつ！でも、あれってNGワード設定とかで消せないの？

それが難しいんだ。Twitchには「エモート」っていう独自の絵文字文化があって、普通の言葉とエモートを組み合わせて嫌がらせをしてくるんだよ。言葉だけ見れば普通でも、エモートのせいで悪口になることもある。

えー、絵文字ひとつでそんなに変わるの？スタンプ感覚で使ってるだけじゃないんだ。

そう。例えば、特定の配信者のコミュニティだけで通じる「バカにする意味のエモート」とかがあるんだよ。これを理解しないと、本当の有害性は見抜けない。でも、人間が24時間監視するのは精神的にもきついし、追いつかないんだ。

なるほどねー。じゃあ、AIにそのエモートの意味を教えてあげればいいんじゃない？

その通り。この論文では「ToxiTwitch」っていうハイブリッドな仕組みを提案してるんだ。まず、LLMを使ってテキストとエモートを「エンベディング」っていう、コンピュータが理解しやすい数字の羅列に変換するんだよ。

えんべ……？えんぺらー？

エンベディング。簡単に言うと、言葉や画像の「意味」を座標上の位置として表す技術のことだね。似た意味のものは近くに配置される。これを使うと、エモートが持つニュアンスも計算できるようになるんだ。

へぇー！数字にしちゃうんだ。でも、LLMって動かすの重くない？配信のチャットってすごい速さで流れるでしょ？

そこがこの研究の賢いところで、LLMは「意味を抽出する」ところだけに使うんだ。その後の「有害かどうか」の判定は、ランダムフォレストとかSVMっていう、すごく動作が軽い伝統的な機械学習モデルに任せるんだよ。だから「ハイブリッド」なんだ。

なるほど！重い仕事と軽い仕事を分担させてるんだね。それで、ちゃんと見つけられるようになったの？

実験では、特定のチャンネルで学習させた場合、約80%の精度で有害コメントを当てられたらしい。従来の方法より13%も向上したんだって。しかも、1つのメッセージを判定するのにかかる時間はたったの60ミリ秒。これならリアルタイムでも使えるね。

60ミリ秒！瞬きするより早いじゃん！これがあれば、配信者さんも安心して配信できるね。

そうだね。ただ、課題もある。LLMは世界中で使われる有名なエモートは知ってるけど、特定の配信者だけが使ってる超マニアックなエモートはまだ理解しきれていないんだ。そこをどう学習させるかが今後の鍵だね。

じゃあ、私が新しく「智也くん大好きエモート」を作って流行らせたら、AIはそれを「有害」って判定しちゃうかもね！

……文脈によっては、俺に対する精神的攻撃として正しく「有害」判定されるだろうな。

Twitchなどのライブ配信プラットフォームでは、独自の「エモート（絵文字）」が多用され、文脈依存の有害なコメントを検知するのが非常に難しいという課題がある。
既存のキーワードフィルターや人間による監視には限界があり、特にエモートを組み合わせた巧妙な嫌がらせに対応する必要がある。
最新のLLM（Llama-3やDeepSeekなど）は一般的なエモートの意味は理解しているが、特定の配信者コミュニティ限定のエモート（チャンネル固有エモート）の理解には課題があることがわかった。
提案手法「ToxiTwitch」は、LLMを使ってテキストとエモートを数値化（エンベディング）し、それをランダムフォレストなどの軽量な機械学習モデルに渡して判定するハイブリッド方式を採用している。
実験の結果、ToxiTwitchは従来手法より高い約80%の精度を達成し、かつ1メッセージあたり約60ミリ秒というリアルタイム配信に適用可能な高速な処理速度を実現した。
今後の課題として、コミュニティごとに進化し続けるエモートの意味や文化的な変化にどう適応していくかが挙げられている。

投稿日:AI