「中小企友好」 IBM 表 Granite 4.0小言模型 量 高效 低成本

全球第一得ISO/IEC 42001:2023 AI 管理系的源模型
理代理型任而生可部署或作大型推理系的模
台北2025年10月7日 /美通社/ -- IBM 日前表其最新一代企「小言模型」 Granite 4.0,以新的混合式架,合 Mamba-2Transformer 技,前所未有的效能效率。Granite 4.0 不大幅降低硬成本,更提供企部署AI 的安全性、可控性性,台各型企的AI 用落地提供力支援。

IBM 表「中小企友好」的小言模型 Granite 4.0,理AI 任大幅降低的使用量 70%,推理速度加快 2 倍,同支援更平的 GPU包括家用硬;大幅降低企部署AI成本,更提高用AI 的安全性、可控性性。
Granite 4.0已在IBM watsonx.ai平台正式上,同步支援Dell Technologies (Dell Pro AI Studio Enterprise Hub)、Docker Hub、Hugging Face、Kaggle、LM Studio、NVIDIA NIM、Ollama、OPAQUE 及Replicate 等平台;未也支援Amazon SageMaker JumpStart Microsoft Azure AI Foundry。
混合式架,造效能成本的完美平衡
Granite 4.0 用新的Mamba/Transformer 混合架,突破Transformer 模型理文本的效能瓶。Mamba 架可性展上下文度,Granite 4.0 在理任,大幅降低的使用量70%,推理速度加快2 倍,同支援更平的GPU包括家用硬。突破台中小企者意味著高效能AI 不再是高成本的同,而是人人可及的技源。
多元模型版本,足各企需求
Granite 4.0 提供多模型格,活不同景:
- Granite-4.0-H-Small:量32B的混合式家模型,活9B,合客服自化、多工具代理任;
- Granite-4.0-H-Tiny:量7B的混合式家模型,活1B,合算地端部署;
- Granite-4.0-H-Micro:量3B 的混合式模型,快速行任;
- Granite-4.0-Micro: Transformer 架,用於尚未支援混合架的平台。
Granite 4.0 所有模型皆提供Base Instruct 版本;於2025年底推出化推理的Thinking 模型。
小模型,大效能
Granite 4.0模型然尺寸精,但在多基中的表,超越同其他大型源模型:
- 在 Stanford IFEval 指令遵循中,Granite-4.0-H-Small 表於所有源模型(除 Llama 4 Maverick 外);
- 在 Berkeley Function Calling Leaderboard v3 中,Granite-4.0-H-Small 以更低成本到大型模型相同的工具用率;
- 在 MTRAG 多索增生成中亦有亮眼表。
上述成果功於IBM 全面升了模型架、方法料品,包含使用一精心、聚焦於企用的22 兆字元模的料。Granite 4.0 的料涵多元源,包括DataComp-LM (DCLM)、GneissWeb、TxT360 子集、Wikipedia 以及其他企景高度相的料源。了增模型理企任的表,些模型後(post-training),涵言理解、程式生成、推理、多言理、安全性、工具用(tool calling)、索增生成(RAG)安等多域,合合成料放料集行化。
安全、可信、可控,是企部署的首
Granite 4.0 是全球第一得ISO/IEC 42001:2023 AI 管理系的源模型家族,展IBM AI 安全任治理的高度承:
- 所有模型皆加密章,保源完整性;
- 料皆理查企授;
- 若在 watsonx.ai 平台使用 Granite 模型,IBM 提供上限第三方 IP 保障。
此外,IBM HackerOne 共同宣布「找Granite漏洞」,最高金美金十元,鼓社群共同提升AI 安全。
企部署AI更、更活
Granite 4.0 支援多硬推理框架,台企者可快速整合至有系:
- 支援 AMD Instinct MI-300X GPU Qualcomm Hexagon NPU,用於行;
- 相容於 vLLM、llama.cpp、MLX、NexaML 等主流推理框架;
- 可透 Unsloth 行微,整合至 Continue 等者工具。
者可在 Granite Playground用Granite 4.0,考Granite Docs 中的RAG、摘要、自化教源。
IBM 展Granite 4.0 模型家族,推出:
- 更小型的 Medium Nano 模型,化AI部署能力;
- 化推理的 Thinking 模型,支援策分析任;
- 持化架平台支援,推 AI 普及化在地化。
IBM推出Granite 4.0,持倡放、安全、高效的企AI,助全球企在位型旅程中健前行。Granite 4.0 模型已在IBM watsonx.ai 平台放使用,用Apache 2.0 源授。更多IBM Granite 4.0。
於IBM
IBM 是全球先的混合、人工智慧及企服提供者,服遍及全球175 多家。IBM 助企料中得商洞察、化流程、降低成本增力。自金融服、信和等域的,用IBM 混合平台及Red Hat OpenShift 行位型。IBM 在人工智慧、量子算和向的端解方案及企服域持新,客提供放且活的。公司秉持信、透明治理、社任、多元包容的企文化,奠定了IBM 的基石。
台IBM 公司新室:https://taiwan.newsroom.ibm.com/
新
IBM 公司公部 Kate Liu kateliu@cn.ibm.com
- 者:美通社
- 更多新 »