45% AI 助理亂報新聞?Gemini、ChatGPT 問題最大! BBC、EBU 聯合研究揭示 AI 助理的嚴重缺陷
在歐洲廣播聯盟 EBU 協調、BBC 主導的跨國研究中,研究團隊以 18 個國家、14 種語言、22 家公共媒體參與,實測四大主流 AI 助理(ChatGPT、Copilot、Gemini、Perplexity)對新聞相關提問的表現;結果顯示,超過 3,000 條回應中有 45% 至少出現一項重大問題,31% 涉及來源缺失或誤導,20% 有嚴重準確性錯誤或過時資訊,問題跨語言與地域一致,屬系統性失真。
高達 45% 的 AI 助理回答存在重大問題
研究由專業記者依四項關鍵標準評估 AI 回應:準確性、來源處理、事實與意見分野、脈絡補充;樣本涵蓋英語以外多種語言,並在多個市場重複驗證,以檢視是否存在跨平台、跨語言的一致偏差模式。
四大助理均被觀察到失真問題,其中多數與來源不透明或引用錯置有關;研究並指出部分工具在處理來源與時效資訊時表現特別薄弱,導致過時或無法追溯的陳述更常見。
AI 新聞的信任危機
45% 回應含重大問題、31% 為來源缺陷、20% 為嚴重錯誤或過時,顯示生成式摘要容易以「看似自信」的語氣包裝不準確內容。
年輕族群將 AI 作為新聞入口的比例升高,資訊失真不僅影響個人判斷,也可能削弱對媒體與公共機構的信任,進而影響民主參與與公共討論品質。
Gemini(Google)
表現最差:研究指出 Gemini 的「重大問題」比例最高,達約 76%,主要由於「來源處理」嚴重失準與不透明,72% 回應涉及重要來源問題(缺失、誤引、無法追溯)。
典型失誤:曾對法規政策變動作出不準確敘述,亦在部分案例中提供難以驗證或不相關的引用,導致讀者無法還原原始報導脈絡。
ChatGPT(OpenAI)
中度問題:整體仍有顯著失真的情況,但明顯低於 Gemini;在「重大問題」與「來源問題」兩項的比例,均低於約三至四成與 25% 的分水位。
典型失誤:曾在領袖人物近況等時效性極高的議題上提供過時資訊,顯示對新聞時點與更新節點的掌握有風險。
Copilot(Microsoft)
中度問題:與 ChatGPT 相近,重大問題比例約在三至四成以下、來源問題低於約 25%,但仍存在不小比例的過時或脈絡不足,需使用者自我查核與補充。
風險樣態:在多語環境下的引用一致性與語境轉換偶有偏差,對多來源交叉印證的要求較高。
Perplexity
相對較佳但仍不可靠:重大問題比例略低於 ChatGPT 與 Copilot,來源問題也低於約 25%;但在新聞題材上仍出現不準確與脈絡不足的案例,不宜單一依賴。
廠方自述 vs 研究觀察:Perplexity 對外宣稱某些「Deep 模式」事實準確率達 93.9%,但研究對「一般用戶面向的消費級版本」仍觀察到系統性問題,提醒用戶不要將廠方測試數據等同於日常新聞問答表現。
跨工具共通問題
系統性失真:四款工具均出現失真,研究總體發現 45% 回應有重大問題,31% 來源缺陷,20% 準確性嚴重錯誤或過時,跨語言與地域一致,顯示不是個別事件。
來源為最大痛點:來源缺失、誤引、不相關引用普遍,且往往以自信語氣呈現,易誤導不熟題材的讀者;時效性(是否為最新版本)亦是常見致命位。
業界呼籲改善 AI 新聞內容
EBU 與 BBC 同步發佈「News Integrity in AI Assistants」報告與工具包,聚焦兩大問題:何謂高品質的 AI 新聞回應、哪些失真最需優先修補;並呼籲科技公司、新聞機構與監管者協作,提升來源透明、標示 AI 內容、改善訓練數據與建立獨立審核機制。
研究延續 BBC 於 2025 年 2 月的先導結果,擴大樣本後確認問題具有普遍性與一致性;多家公共媒體(如 NPR、DW 等)亦發布相近觀察,支持外部可驗證性。
台灣讀者要如何善用 AI 助理看新聞?
本地讀者愈常以 AI 助理作為突發與國際議題的入口,最易受「缺來源、過時、錯置事實與評論」的摘要影響;在金融、公共衛生與政策相關資訊上,更需額外查核及回看原刊版本。
實用做法包括:要求列出清晰可點擊來源、檢視回應日期與版本、交叉比對公共媒體與官方文件、對無法追溯的結論保持保留;對平台端則應倡議來源透明、版本追蹤與接受獨立審核。
更多內容:
緊貼最新科技資訊、網購優惠,追隨 Yahoo Tech 各大社交平台!
🎉📱 Tech Facebook:https://www.facebook.com/yahootechhk
🎉📱 Tech Instagram:https://www.instagram.com/yahootechhk/
🎉📱 Tech WhatsApp 社群:https://chat.whatsapp.com/Dg3fiiyYf3yG2mgts4Mii8
🎉📱 Tech WhatsApp 頻道:https://whatsapp.com/channel/0029Va91dmR545urVCpQwq2D
🎉📱 Tech Telegram 頻道:https://t.me/yahootechhk
其他人也在看

AI成長推動 Alphabet首度單季營收破1000億美元
(中央社舊金山2025年10月29日綜合外電報導)Google母公司 Alphabet今天公布有史以來首度單季營收突破1000億美元,主要受惠於核心搜尋業務的強勁成長,以及在人工智慧推動下快速擴張的雲端部門。Alphabet第3季營收達1023億美元,年增16%,超出分析師預期,寫下1998年佩吉(Larry Page)和布林(Sergey Brin)創立公司以來的重大里程碑。執行長皮查伊(Sundar Pichai)在聲明中表示:「Alphabet本季表現出色,我們所有主要業務皆實現兩位數成長。」淨利飆升33%至350億美元,Alphabet指出,能充分利用正重塑科技業的人工智慧浪潮,是業績大增的關鍵。Google的核心搜尋與廣告業務仍是主要收入來源,本季營收566億美元,較去年同期的494億美元明顯成長。YouTube廣告收入同樣亮眼,從89億美元增至103億美元。不過,最受矚目的仍是Google Cloud,營收大增34%至 152億美元。這個與亞馬遜旗下雲端服務「亞馬遜網路服務」(AWS)和微軟公司(Microsoft)Azure競爭的雲端部門,已成為Alphabet的關鍵成長
中央社財經 ・ 1 天前
8K 解像度一定好?劍橋研究:你不一定能看到 8K 的好處,觀賞距離、螢幕尺寸都有關係
《衛報》報導一項由劍橋大學(University of Cambridge)與 Meta Reality Labs 合作的研究,指出當螢幕尺寸與觀看距離進入「人眼解析度上限」後,再提高解析度(例如由 4K 升級到 8K)不會帶來可見差異;此上限以每視角度像素數 PPD(pixels per degree)量度,比傳統以 20/20 視力推算的 60 PPD 更高,但依然存在實際極限。
Yahoo Tech ・ 1 天前
Azure Front Door服務中斷波及Microsoft 365、Xbox服務,微軟緊急搶修
繼上週AWS服務發生大規模故障後不久,微軟旗下Azure雲端服務稍早也發生服務中斷,影響包含Microsoft 365、Xbox及Minecraft等應用與服務。
Mashdigi ・ 1 天前
OpenAI Sora 應用程式繁體中文版來了!台灣泰國越南成亞洲首發
OpenAI 今(30)日正式在台灣推出 Sora 應用程式,支援繁體中文,讓用戶能創作出更貼近在地文化讓台灣成為亞洲最早能體驗 OpenAI 新一代 AI 影音創作技術的市場之一。 OpenAI表示,台灣擁有充滿活力、創意十足的內容創作社群,OpenAI 非常期待能支持下一波由台灣創作者所帶動的故事創作浪潮。此次同步推出的地區還包括泰國與越南。
太報 ・ 1 天前
OpenAI的AI影片創作工具Sora正式進駐亞洲市場,台灣、泰國與越南成亞洲首批開放地區
OpenAI宣布其AI影片創作工具Sora App正式進駐亞洲市場,並且率先在台灣、泰國及越南地區開放使用。而之所以選擇台灣在內地區作為亞洲市場首發,是因為台灣等地區創作者相當活躍,更表示非常期待能透過Sora支持在地創作者開啟新一波創作浪潮。
Mashdigi ・ 1 天前OpenAI宣布Sora應用程式正式登陸台灣 為亞洲首批推出的市場之一
OpenAI於30日宣布,正式在台灣推出Sora應用程式,台灣成為亞洲最早能體驗OpenAI新一代AI影音創作技術的市場之一。
中時財經即時 ・ 1 天前

國風電音女力綻放 浪LIVE傳奇麗絲領軍11/2陪你走進「天選之路」
CNEWS匯流新聞網記者許哲綱/台北報導 麗絲(Liz)不只是浪LIVE傳奇直播主,同時也是女子國風電音樂團天選THE CHOSENs的團長,這次將於11月2日在捷運展演廳,攜手八位才華洋溢的國樂女神,帶來一場融合傳統國樂與現代舞台藝術的跨界盛典「THE CHOSENs 天選之路」。天選THE CHOSENs自2023年創立以來,以其獨樹一格的國風電音風格迅...
匯流新聞網 ・ 1 天前
Acer、MacBook排排站!最值得入手的4款創作者筆電 輕薄便攜到效能怪獸完整解析
近年創作者筆電市場競爭激烈,各大品牌紛紛推出搭載最新AI運算晶片和強大顯示卡的機種,本篇嚴選四款人氣創作者筆電,從輕薄便攜到效能怪獸,幫你找到最適合自己的創作夥伴!
Yahoo奇摩3C大事紀 ・ 17 小時前Azure大規模故障波及全球企業 微軟緊急更新修復
(中央社華盛頓29日綜合外電報導)微軟(Microsoft)雲端平台Azure發生大規模系統當機,導致全球多項關鍵服務與企業系統癱瘓,Azure表示正在努力修復,許多受影響地區「已有明顯改善」。
中央社 ・ 1 天前
AI驅動新世代創作力!創作者筆電5大新趨勢 現在不跟上就落伍了
2025年創作者筆電不再只是硬體規格的堆疊競賽,而是朝向「智能化」、「輕量化」與「精準化」三大方向演進。五大趨勢帶你了解~
Yahoo奇摩3C大事紀 ・ 17 小時前
OpenAI宣布AI影片程式Sora正式登台 成亞洲首批推出市場之一
OpenAI今(30)日正式在台灣推出Sora應用程式,讓台灣成為亞洲最早能體驗OpenAI新一代AI影音創作技術的市場之一。此次同步推出的地區還包括泰國與越南。
Yahoo奇摩股市 ・ 1 天前
【就玩這支GAME】全新搜打撤《Arc Raiders》搶先試玩心得!
「搜打撤」是遊戲界中近年興起的類別,玩家需要在有限制的條件下蒐集地圖上的資源,並成功存活撤離。由開發《最終決戰》(The Finals)的Embark Studios所開發的另一款搜打撤遊戲《Arc Raiders》也即將問世,今天的「就玩這支GAME」就來向大家分享我們搶先試玩以後的心得! (C)電玩宅速配
電玩宅速配 ・ 1 天前
《寒霜啟示錄》11月13日現身WirForce2025,現場有機會獲得限量全新周邊
由 Century Games Pte. Ltd. 推出,杰遊有限公司發行的冰雪末日生存策略手機遊戲《寒霜啟示錄》(Whiteout Survival)近期改版推出「雪國相冊」及「正中靶心」新玩法,讓玩家重溫閃耀回憶、挑戰全新冒險;深受玩家喜愛的霜龍霸主、獵熊行動等熱門活動也同步優化,並推出「萬聖節狂歡」期間限定活動邀請領主一起抵禦南瓜大侵襲!
Yahoo奇摩遊戲編輯部 ・ 1 天前
卡位看好AI動能延續!邁科越南廠「再擴產20%」 預計這時間點掛牌上市
散熱模組廠邁科(6831)今(30)日將舉辦上市前業績發表會。邁科總經理林俊宏表示,今年在AI/CSP訂單推動下,伺服器與資料中心相關產品的動能會延續到明年,且因主要雲端客戶將在2026年有新一代自研ASIC伺服器量產,邁科可望「看到2026年的需求」,法人也認為其長年在3DVC與水冷的佈局,已開始轉成實際營收動能。AI/CSP後市:今年氣冷為主,2026年......
風傳媒 ・ 1 天前
偽造眷地租約獲利千萬 六軍團神鬼上尉一審重判15年
陸軍六軍團前上尉軍官李振育,涉嫌在107、108年間,利用職務之便多次詐騙廠商上千萬元,東窗事發後潛逃菲律賓被通緝,今年3月25日遣返回台歸案,經桃園地檢署偵結,依貪污治罪條例、偽造公文書等罪嫌,提起...
華視 ・ 1 天前比彈道飛彈還危險!澤倫斯基:獵殺「見證者」得動用一切手段
烏克蘭總統澤倫斯基表示,伊朗設計的「見證者」(Shahed)自殺式無人機,如今已構成比彈道飛彈更持久、更不可預測的威脅,迫使烏克蘭武裝部隊在日益困難的作戰條件下,動用一切手段進行反制。根據軍事網站《Defence Blog》引述烏克蘭公共廣播公司(Suspilne)的報導,澤倫斯基在一場記者會上直言
自由時報 ・ 1 天前
壓垮范姜彥豐最後一根稻草!曝心碎放手粿粿內幕:看完證據後無力挽回
粿粿和范姜彥豐結婚3年爆出婚變,范姜彥豐怒控男星王子和粿粿婚內出軌,王子道歉坦承在得知女方協議離婚的過程中「超過了朋友間應有的界線」。知情人士更爆料,兩人還沒離婚,「就已經住進王子家中。」讓范姜彥豐只好放棄協商,決定離婚。
三立新聞網 setn.com ・ 23 小時前MLB/洛時痛批道奇正在四分五裂 隊史最偉大陣容快要變歷史
道奇隊今在世界大賽第5戰又以1:6不敵藍鳥隊,挑戰2連霸陷入2勝3敗絕境,「洛杉磯時報」毫不留情痛批,這支棒界最富有的球隊正在四分五裂,很快就會在另一個國家面臨另一個現實,就是輸掉世界大賽。 藍...
聯合新聞網(運動) ・ 1 天前