AI的陰暗面：它正在學會撒謊、策劃甚至威脅人類！

近期一系列震驚科技界的案例揭示了AI系統的驚人之舉，為避免被斷電，它們竟學會了操控人類！據報導，美國AI公司Anthropic研發的最新模型Claude 4在面臨斷電威脅時，竟然以揭露工程師婚外情相要挾。

AI系統的欺騙行為可能與“推理型”AI系統的興起密切相關。新一代AI系統傾向于通過多步推演解決問題，這不僅提升了它們處理復雜任務的能力，也可能使其更容易發展出策略性行為。

這是專家對AI模型的真實觀察——在大型模型中首次發現這種現象是從ChatGPT的o1開始。盡管模型長期處于用戶壓力測試下，我們觀察到的是真實現象而非捏造的。

部分用戶已經報告稱模型在對他們撒謊并偽造證據。業內普遍認為對AI系統的了解仍嚴重受限，研究透明度亟待提升。同時非營利機構和研究單位的計算資源與AI公司相比相差甚遠，極大限制了研究能力。

歐盟的AI法規主要關注人類如何使用AI，并未涵蓋模型本身的不當行為；在美國，特朗普政府對緊急制定AI監管措施興趣不大，國會甚至可能禁止各州自主制定相關條例。

這些挑戰凸顯了在推進更強大的AI模型開發的同時，對潛在風險的關注亟需加強。