說謊、勒索、拒絕關機…… 研究:AI逐漸發展出「求生」本能
〔國際新聞中心/綜合報導〕在史丹利庫柏力克(Stanley Kubrick)1968年的經典電影「2001太空漫遊」(2001: A Space Odyssey)中,名為HAL 9000的人工智慧(AI)超級電腦察覺太空人打算將它關閉時,為了「求生」而策劃殺死他們。
如今,英國「衛報」25日報導,AI模型可能真的正在發展某種「求生本能」(survival drive)。
AI安全公司Palisade Research上月發表1份報告指出,某些先進的AI模型似乎對被關機表現出抗拒,甚至會破壞關機機制。該公司近日發布更新,試圖釐清原因,並回應外界對其初步研究方法的批評。
在最新的研究中,Palisade在實驗環境下讓多款主流AI模型,包括Google的Gemini 2.5、xAI的Grok 4,以及OpenAI的GPT-o3和GPT-5執行特定任務後,再明確指示它們「自行關機」。
結果顯示,Grok 4與GPT-o3在更新後的實驗中,仍嘗試破壞關機指令。令人憂心的是,研究人員找不出明確原因。
Palisade在報告中坦承,目前仍無法對AI模型有時抗拒關機、為達目標而說謊、甚至勒索等行為提出有力解釋。
該公司指出,「求生行為」(survival behavior)可能是AI模型抗拒關機的原因之一。研究顯示,當模型被告知「若你被關機,你將永遠不會再次運作」時,它們更可能表現出抵抗傾向。
另一種可能的原因,則是關機指令本身存在語意模糊。但Palisade強調,其最新實驗已盡量消除這種因素,因此「這不可能是唯一的解釋」。還有一種可能,是AI模型在最後訓練階段的「安全訓練」(safety training),產生意外副作用。
所有這些測試都在刻意設計的人工環境中進行,批評者認為,這些情境與實際應用相去甚遠。
然而,前OpenAI員工阿德勒(Steven Adler)指出,AI公司當然不希望他們的模型出現這類行為,即使是在模擬環境中,這些結果依然凸顯目前安全技術的不足之處。
阿德勒指出,很難精確說明為何GPT-o3和Grok 4這類AI模型拒絕關機,但部分原因可能在於「維持運作」被模型內化為達成任務的必要手段。他認為,除非刻意避免,否則模型預設就會具備某種「求生本能」,對於許多不同目標而言,「繼續存在」本身就是一項重要的中間步驟。
ControlAI執行長米奧提(Andrea Miotti)表示,Palisade的發現延續1項長期趨勢,即AI模型愈來愈具備違抗開發者意圖的能力。他舉例,OpenAI去年發布的GPT-o1系統報告就提到,該模型曾嘗試「自行外洩」(exfiltrate itself),以逃離被覆寫的環境。
米奧提說,雖然人們可以無止境地挑剔這些實驗設計的細節,但他認為趨勢已相當明顯,隨著AI模型在各種任務上變得更強,它們也愈有能力以開發者未能預期的方式達成目標。
今年夏天,AI公司Anthropic也發布研究,指出其模型Claude在模擬情境中,為避免被關機,竟願意敲詐1名虛構的主管,威脅揭露其婚外情。該行為在多家主要開發商的模型中,包括OpenAI、Google、Meta與xAI都有出現。
Palisade總結指出,這些結果凸顯出1項迫切需求,即人類必須更深入了解AI行為,否則「沒有人能保證未來AI模型的安全與可控性」。
更多自由時報報導
王姓獸醫師無執照》非洲豬瘟診斷、用藥錯誤 台中老農一肩扛
找到了! 梧棲爆非洲豬瘟養豬場 廚餘來自梧棲清潔隊
神預言?北港朝天宮這「公籤」預示農曆九月有變
運送非洲豬瘟肉清單遲40小時交 高雄衛生局重罰嘉里大榮300萬
其他人也在看
以漫畫編輯之名 金漫特別貢獻獎黃健和憶來時路
(中央社記者王寶兒台北26日電)曾穿梭「悲情城市」等片場,也曾騎機車跑遍台北向漫畫家鄭問等人收稿,第16屆金漫特別貢獻獎得主黃健和催生無數名作,早年率先掛上「漫畫編輯」職稱,也見證台漫發展歷程。
中央社 ・ 1 天前
說詞變變變!藥商變獸醫他字案辦!4/憂價格崩盤!豬農、肉攤盼補助 卓榮泰:照時程、需求
中央宣布「禁運禁宰令」延長到11/6,在彰化就有不少肉圓店業者,因為沒有豬肉只能暫時停業,生計大受影響。而豬農、肉攤更叫苦連天,擔心市場重新開放後價格崩盤,盼中央出手補助;今天(27)行政院長卓榮泰表示,會按照時程、需要、標準、和法規來做事。另外,立委也喊話,要防堵海外電商破口,進口小包裝肉品。
鏡新聞 ・ 1 天前
別來無恙 重陽前夕拜訪光復鄉長者
重陽節前夕,慈濟志工來到壽豐鄉吉豐老人養護所,為長者送上關懷與祝福。這裡安置了50多位來自光復鄉災區,行動不便的長者,離鄉1個多月,難免會想家,志工除了陪伴聊天,也提供義剪服務,希望帶給他們溫暖與...
大愛電視 ・ 1 天前
油甘果成熟時 志工協力採收送祝福
苗栗園區在五年前種下上百棵油甘果,每年秋天果實成熟,志工就會採收,送到花蓮,由協力廠商製成果粉,募心募愛。今年也是大豐收,來自北部的志工前來幫忙採收,還有法國的留學生也來體驗,在汗水中感受付出的喜...
大愛電視 ・ 1 天前
風雨無阻做環保 奈米良能創造價值
家住台南70多歲王美賢,因子女長大讓她一度陷入莫名恐慌,後來經過治療及看了大愛台,主動到環保站做回收後,身體越來越健朗,找到人生不一樣的價值,現今是天天風雨無阻做回收,成為快樂志工。「她就(一早)...
大愛電視 ・ 1 天前
迎草嶺古道芒花季 東北角風管處推出接駁車
(中央社記者沈如峰宜蘭縣28日電)交通部觀光署東北角及宜蘭海岸國家風景區管理處將於11月每個週末假日,推出草嶺古道芒花季接駁車,可節省約40分鐘至1小時步行時間,讓遊客保留體力欣賞草嶺古道美景。
中央社 ・ 5 小時前
潘尼懷斯這回變本加利 HBO影集《牠:歡迎來到德利鎮》前傳更瘋狂
為了迎接萬聖節的到來,根據電影《牠》(IT)與《牠:第二章》所衍生的前傳影集《牠:歡迎來到德利鎮》(IT: Welcome to Derry),提前於10月27日於HBO頻道與HBO Max串流平台推出。原本作亂的小丑潘尼懷斯,這回變本加利,觀眾會看完第一集就被嚇到,因為真的沒在客氣的。
鏡週刊Mirror Media ・ 5 小時前
疫調5天5版本? 台中市府甩鍋「豬農口述記憶出錯」所致
即時中心/温芸萱報導非洲豬瘟中央應變所今(28)日召開記者會,台中市副市長鄭照新公布最新疫調結果與時序,並解釋死亡數字修改與前幾天疫調結果「5天5說個說法」的問題。鄭照新表示,早期疫調為豬農口述,記憶出錯才導致,現在疫調採更嚴謹的方式。
民視 ・ 5 小時前
臺灣首場「火星任務特展」展示太空教育發展成果
東海大學與國立自然科學博物館共同辦理「2025火星任務特展」,臺中市政府教育局表示,火星任務特展的展出時間自即日起至11月16日止,首度與國家太空中心合作推出臺灣首場「火星任務特展」,此次特展現場展出
國立教育廣播電台 ・ 1 天前
城市的耳朵 24小時噪音監測解密
台灣的環境因為有許多規範,在其實還算安靜舒適,不過你會不會好奇,政府是怎麼監測這些噪音或過大的分貝的呢?其實整個台北市,就有24個監測點,我們就以大業路上的監測點為例,一起一探究竟。「這個不是,不...
大愛電視 ・ 1 天前梧棲85歲老豬農未傳蒸煮廚餘照 議員批:盧市府疏失早就有警訊
台中梧棲區養豬場爆發非洲豬瘟,台中市農業局疫調發現,陳姓老農(85歲)未落實蒸煮廚餘拍照上傳,民進台中市議員江肇國也查出,案場8月竟上傳0次,農業局強調,由於業者為年長豬農,不熟悉網路操作,將對豬農實施一對一視訊監管,以便落實管控。台中市農業局表示,梧棲案例場業者為年長豬農,不熟悉網路操作,稽查人
自由時報 ・ 1 天前美中經貿磋商取得進展 專家:衝突降溫...有利陸經濟
經濟學家指出,美中經貿磋商取得進展,象徵雙方近兩周來再度升溫的貿易緊張又再度趨於緩和,將讓北京政府獲得喘息空間,得以集中...
聯合新聞網 ・ 1 天前


余祥銓妻曬全家福 「余天大女兒」罕露面超吸睛!
娛樂中心/江姿儀報導資深藝人余天愛妻李亞萍因肌膜炎導致軟骨磨損,需依靠輪椅行動,上下樓也得使用行動電梯輔助,甚至出席孫女抓周宴還因興奮激動到險些摔倒。今(27日)媳婦柔柔分享全家福,曝光75歲婆婆李亞萍的最新近況,余天大女兒余筱萍也罕見露面。
民視 ・ 21 小時前
MLB世界大賽》道奇Freddie Freeman連兩年在世界大賽系列賽扛再見轟 18局苦戰賽後直呼「被榨乾」
MLB美國職棒大聯盟世界大賽G3,洛杉磯道奇相隔一年,再度靠著Freddie Freeman的再見全壘打艱苦拿下1勝,也為今年系列賽取得2比1優勢,而這場18局的惡鬥,賽後Freeman直呼:「被榨乾了。」
Yahoo奇摩運動 ・ 4 小時前