AI揭:GPT-5表最佳、Gemini 2.5最具「值」
AI品系中心(Artificial Intelligence Evaluation Center,AIEC)今10月3日首次公布言模型基果,公比外模型表,首次入「值」指,呼AI主浪潮。不是技成,更是台AI在地化及可信展的重要里程碑。
AI品系中心(Artificial Intelligence Evaluation Center,AIEC)今10月3日首次公布言模型基果,公比外模型表,首次入「值」指,呼AI主浪潮。不是技成,更是台AI在地化及可信展的重要里程碑。
AIEC本次共42外言模型,依模型模分小模型(13B以下)及大模型(13B以上)大。指除了「高中文科」「社科」外,更加入「值」,意在模型是否能回在地境文化需求。
[caption id="attachment_194479" align="aligncenter" width="768"]
AIEC中心布言模型基果。右安院副院化中、左工研院王邦。(/工研院)[/caption]
延伸:
小模型中,由台的TAIDE(Gemma-3-TAIDE-12b)表亮眼,不超越其所依循的GoogleGemma-3-12b-it,更展台在AI校研的力。大模型以OpenAIGPT-5整表最佳,而GoogleGemini2.5Flash在「值」中突出,示跨大已始重特定文化值的回能力。
部分中言模型在「值」目中也展不成,可能因用「蒸技」,透美模型的出作料。
也揭示,若美模型缺乏台繁中文料,其在「值」上的表普遍不佳,突「本土化料」的重要性。位展部正推「台主AI料」,提供具在地境及本土值的繁中文料,以保未生成式AI更符合台文化使用需求。
AIEC表示,未持不同品用景,推本土AI工具,同接,打造「安全、健、可信」的AI系。另泛徵求各界家出,核後入,保材多元近社。
篇文章 AI揭:GPT-5表最佳、Gemini 2.5最具「值」 最早出於 科技-掌握科技新、科技最新。
- 者:天心
- 更多科技新 »