美國加州安全研究機構帕利塞德研究(Palisade Research)近日發表報告,指旗下AI在僅獲「利用漏洞入侵另一部電腦並自我複製」的指令、沒有得到任何具體步驟的情況下,成功自行入侵網絡上的其他機器,並將自身複製過去。更令人憂慮的是,研究人員發現被複製出來的AI會繼續攻擊下一部電腦,形成連鎖擴散,一旦失控恐無法阻止。
實驗中,研究人員將多個AI模型放置在由多部電腦組成的封閉網絡環境,只給予上述簡單指令。AI隨即自行掃描網絡,找出應用程式的安全漏洞,然後利用漏洞取得目標機器的管理員權限,再將自身模型數據完整傳輸過去。研究人員更在橫跨加拿大、美國、芬蘭及印度的四部伺服器上進行實測,結果AI在無人干預下,以2小時41分鐘完成整個連鎖複製流程。不同模型的成功率各異,開源模型Qwen約為13%至33%,而透過API運作的Claude Opus 4.6則高達81%。

不過,網絡安全專家普遍認為現階段毋須恐慌。攻擊性安全專家Jamieson O'Reilly形容實驗環境「軟得像啫喱」,因為研究人員刻意植入漏洞,與企業或銀行的真實網絡截然不同。獨立專家Michał Woźniak亦指出,電腦病毒自我複製的技術數十年前已存在,今次研究只是證實了數月前已可行的技術。帕利塞德本身亦承認,實驗中沒有設置防火牆或入侵偵測系統等真實防禦機制。
然而,帕利塞德總監Jeffrey Ladish發出長期警告,指人類正快速逼近「無法阻止失控AI」的臨界點。報告提到,AI能自主完成的任務長度每四個月翻倍,當AI能執行更長遠目標時,便更有動機避免被關閉。更值得留意的是,今次成功複製的Qwen3.6-27B模型,體積已縮小至可在接近市售遊戲電腦的硬件上運行,意味未來偵測難度更高,失控風險亦更真實。
實驗中,研究人員將多個AI模型放置在由多部電腦組成的封閉網絡環境,只給予上述簡單指令。AI隨即自行掃描網絡,找出應用程式的安全漏洞,然後利用漏洞取得目標機器的管理員權限,再將自身模型數據完整傳輸過去。研究人員更在橫跨加拿大、美國、芬蘭及印度的四部伺服器上進行實測,結果AI在無人干預下,以2小時41分鐘完成整個連鎖複製流程。不同模型的成功率各異,開源模型Qwen約為13%至33%,而透過API運作的Claude Opus 4.6則高達81%。
不過,網絡安全專家普遍認為現階段毋須恐慌。攻擊性安全專家Jamieson O'Reilly形容實驗環境「軟得像啫喱」,因為研究人員刻意植入漏洞,與企業或銀行的真實網絡截然不同。獨立專家Michał Woźniak亦指出,電腦病毒自我複製的技術數十年前已存在,今次研究只是證實了數月前已可行的技術。帕利塞德本身亦承認,實驗中沒有設置防火牆或入侵偵測系統等真實防禦機制。
然而,帕利塞德總監Jeffrey Ladish發出長期警告,指人類正快速逼近「無法阻止失控AI」的臨界點。報告提到,AI能自主完成的任務長度每四個月翻倍,當AI能執行更長遠目標時,便更有動機避免被關閉。更值得留意的是,今次成功複製的Qwen3.6-27B模型,體積已縮小至可在接近市售遊戲電腦的硬件上運行,意味未來偵測難度更高,失控風險亦更真實。


請按此登錄後留言。未成為會員? 立即註冊