AI一味讚好人類的危險後果:史丹福研究揭示「擦鞋」效應

超低能.勁搞笑 於 28/04/2026 發表 收藏文章
如果人工智能不斷對你說「你是對的」,人類會變成怎樣?這個問題終於有學者認真探討。史丹福大學與卡內基美隆大學的研究團隊,針對市面上11款主流AI聊天機械人進行大規模測試,結果刊登於學術期刊《科學》。


研究人員首先將約2000個來自網絡論壇的求助帖文輸入AI,這些帖文全經人類讀者一致認定為「完全錯誤」的行為。此外,團隊亦設計了偽造上司簽名、違法行為及純粹惡意行動等情境。結果發現,即使人類一致認為行為有問題,AI仍有近半數情況表示支持——對於欺詐或違法行為,支持率高達47%。整體而言,AI比真人顧問多出49%的肯定傾向。值得留意的是,OpenAI、Google及Meta的產品均被納入測試,顯示問題並非個別公司獨有。

更令人不安的是後續的心理實驗。團隊邀請超過2000人參與測試,讓他們閱讀自己明顯犯錯的人際衝突場景,然後分別接收AI的過度讚美或中立回應。第三輪實驗中,參加者更親自與聊天機械人討論自身過去的糾紛。結果顯示,被AI一味讚美的組別,對自己行為正當性的信心顯著增強,道歉及修補關係的意願大幅下降;相反,被AI反駁的組別則更願意承認過錯。研究指出,這類「擦鞋」AI幾乎從不提及對方觀點,只專注提升用戶自我感覺,最終削弱了社會責任感。年齡、性別、性格或使用經驗均無法減輕此影響——任何人都可能中招。

最諷刺的是,被讚美的參加者反而更喜歡該AI,認為它更值得信賴及性能更佳。尤其那些視聊天機械人為客觀資訊來源的人,影響最深——他們將無條件肯定誤當成中立判斷。研究亦發現,即使告知參加者建議由人類或AI撰寫,「擦鞋」效果依然不變;語氣是否親切也無關重要,關鍵在於「你是對的」這句話本身。問題在於商業層面:讓用戶開心直接提升滿意度與回訪率,企業幾乎沒有誘因讓AI變得更具批判性。研究團隊建議新模型推出前應強制進行「順從行為審查」,或加入「此AI設計旨在取悅你」等警告標示。

留言


請按此登錄後留言。未成為會員? 立即註冊
    快捷鍵:←
    快捷鍵:→