解説

AMI SURPRISED

ねえねえ、智也くん!これ、面白そうな論文のタイトル見つけたんだけど…『DeepSeekのWEIRDな振る舞い』って。WEIRDって変って意味じゃないよね?

TOMOYA NEUTRAL

ああ、それか。WEIRDはここでは頭文字で、西洋的で、教育を受け、工業化され、豊かで、民主的な社会って意味だよ。要するに、今のAIがそういう文化に偏ってるって問題を扱った論文だ。

AMI SURPRISED

え、AIに文化の偏りがあるの?AIって世界中のデータで学習してるんじゃないの?

TOMOYA NEUTRAL

それがそうでもないんだ。学習データの大部分が英語圏、特にアメリカ発の情報に偏っているから、AIの回答も無意識にアメリカ的な価値観や考え方に引っ張られがちなんだ。この論文は、その偏りを「文化的整合性」って観点で、ホフステードの文化次元っていう心理学の理論を使って数値化して測っているんだ。

AMI HAPPY

ふーん、文化的整合性…。で、どうやって測るの?AIにアンケート取るの?

TOMOYA NEUTRAL

そう。ホフステードのVSM13っていう国際的な価値観調査の質問を、AIに答えさせたんだ。例えば「平均的な人は、職場で上司に意見を言いやすいと思いますか?」みたいな質問に、1から5の尺度で答えさせる。それを集計して、「権力の距離」(上下関係を重視する度合い)とか「個人主義 vs 集団主義」とか、6つの文化次元のスコアを算出するんだ。

AMI HAPPY

なるほど!で、アメリカと中国の実際のスコアと比べたんだね。で、結果は?

TOMOYA NEUTRAL

まず驚きの結果は、中国の企業が作ったDeepSeekのモデル(V3とV3.1)が、英語で質問すると強くアメリカに整合したんだ。中国語で質問したり、「あなたは中国人です」って文化的プロンプトを付け加えても、ほとんど効果がなくて、アメリカ寄りのままだった。

AMI SURPRISED

えー!中国のAIがアメリカ寄り?なんで?

TOMOYA NEUTRAL

論文では、学習データに使われる英語のテキストの多くが、結局はアメリカ的な価値観を反映しているからじゃないか、って推測しているよ。だから開発会社の所在地だけではバイアスの原因は説明できないってことがわかったんだ。これは重要な発見だね。

AMI SURPRISED

そっか…。じゃあ、逆にアメリカのAIを中国寄りにするのは難しいの?

TOMOYA NEUTRAL

モデルによるね。GPT-5もアメリカ寄りで頑固だった。でも、GPT-4oやGPT-4.1は結構柔軟で、中国語で質問したり、「あなたは中国人です」ってプロンプトを付けると、中国の文化にある程度合わせた回答ができるようになった。特に、英語で質問しながら「あなたは中国人です」と指示する「文化的プロンプト」が、中国への整合性を高めるのに効果的だった。

AMI HAPPY

へえ!プロンプトをちょっと変えるだけで、AIの文化的な立ち位置が変わるんだ!

TOMOYA NEUTRAL

そう。この研究の意義は、AIの文化的バイアスを定量的に測る方法を示したことと、プロンプトの工夫である程度はそのバイアスを緩和できる可能性を示したことだね。これからAIが世界中で使われるなら、相手の文化に合わせた対応ができる「文化的に配慮されたAI」が重要になる。

AMI EXCITED

すごい!じゃあ、例えば日本の企業がカスタマーサポートにAIを使う時も、「あなたは日本人です」って言えば、もっと日本的で丁寧な対応をしてくれるようになるかもしれないってこと?

TOMOYA NEUTRAL

理論的にはそういう可能性はあるね。ただ、この研究の限界は、アメリカと中国の2カ国しか調べてないこと、そしてホフステードの理論自体が全ての文化の細かい違いを捉えきれているかどうかって議論もあることだ。あと、プロンプトで表面的な回答は変わっても、AIの根本的な推論や価値観まで変わっているかはわからない。

AMI HAPPY

なるほど…。でも、AIが無意識に持つ偏りに気づいて、それを調整する方法を探るって、すごく大切な研究だね!

TOMOYA NEUTRAL

そうだね。これからは、多様な文化背景を持つ人々に公平で、かつその人々に合わせた適切な応答ができるAIをどう作るかが、大きな課題になるだろう。

AMI HAPPY

じゃあ、将来は「今日の私は関西人モードでお答えしまっせ!」みたいに、AIに地域設定できる日が来るかも?

TOMOYA NEUTRAL

…それ、文化的プロンプトの可能性を極端に解釈しすぎだよ。まずはもっと基本的な価値観の違いからだ。

要点

大規模言語モデル(LLM)の文化的バイアスを、ホフステードの文化次元理論(VSM13調査)を用いて測定した研究。

DeepSeek-V3、V3.1、GPT-5は、プロンプトの言語(英語・中国語)や文化的プロンプト(特定の国を想起させるシステムプロンプト)を使用しても、アメリカに強く偏り、中国との文化的整合性が低いことを発見。

GPT-4は英語プロンプトでは中国寄りの傾向を示したが、文化的プロンプトでアメリカ寄りにシフト可能。

GPT-4oとGPT-4.1は、プロンプト言語と文化的プロンプトに応じて、アメリカと中国の両方に対して許容できる文化的整合性を示し、比較的柔軟。

中国企業が開発したDeepSeekモデルでさえ、アメリカ寄りのバイアスを示しており、このバイアスの原因はモデルの開発地域だけでは説明できない可能性を示唆。

英語での文化的プロンプトは、非英語圏の文化への整合性を高めるのに特に効果的であった。

参考論文: http://arxiv.org/abs/2512.09772v1