IBM Granite 4.0:企就绪 量 高效 低成本

- 全球首得 ISO/IEC 42001:2023 AI 管理系的源模型
- 理代理型任而生 可部署或作大型推理系的模
香港2025年10月10日 /美通社/ -- IBM 日前其最新一代企言模型 Granite 4.0,以新的混合式架,合 Mamba-2Transformer 技,前所未有的效能效率。Granite 4.0 不大幅降低存硬成本,更提供企部署AI 的安全性、可控性性,香港各型企的AI 用落地提供力支援。

IBM Granite 4.0:企就绪 量 高效 低成本
Granite 4.0已在IBM watsonx.ai平台正式上,同步支援Dell Technologies (Dell Pro AI Studio Enterprise Hub)、Docker Hub、Hugging Face、Kaggle、LM Studio、NVIDIA NIM、Ollama、OPAQUE 及Replicate 等平台;未也支援Amazon SageMaker JumpStart Microsoft Azure AI Foundry。
混合式架,造效能成本的完美平衡
Granite 4.0 用新的Mamba/Transformer 混合架,突破Transformer 模型理文本的效能瓶。Mamba 架可性展上下文度,Granite 4.0 在理任,大幅降低存的使用量70%,推理速度加快2 倍,同支援更平的GPU包括家用硬。突破香港中小企者意味著高效能AI 不再是高成本的同,而是人人可及的技源。
多元模型版本,足各企需求
Granite 4.0 提供多模型格,活不同景:
- Granite-4.0-H-Small:量32B的混合式家模型,活9B,合客服自化、多工具代理任;
- Granite-4.0-H-Tiny:量7B的混合式家模型,活1B,合算地端部署;
- Granite-4.0-H-Micro:量3B 的混合式模型,快速行任;
- Granite-4.0-Micro:Transformer 架,用於尚未支援混合架的平台。
Granite 4.0 所有模型皆提供Base Instruct 版本;於2025年底推出化推理的Thinking 模型。
小模型,大效能
Granite 4.0模型然尺寸精,但在多基中的表,超越同其他大型源模型:
- 在 Stanford IFEval 指令遵循中,Granite-4.0-H-Small 表於所有源模型(除Llama 4 Maverick 外);
- 在 Berkeley Function Calling Leaderboard v3 中,Granite-4.0-H-Small 以更低成本到大型模型相同的工具用率;
- 在MTRAG 多索增生成中亦有亮眼表。
上述成果功於IBM 全面升了模型架、方法品,包含使用一精心、聚焦於企用的22 兆字元模的料。Granite 4.0 的涵多元源,包括DataComp-LM (DCLM)、GneissWeb、TxT360 子集、Wikipedia 以及其他企景高度相的源。了增模型理企任的表,些模型後(post-training),涵言理解、程式生成、推理、多言理、安全性、工具用(tool calling)、索增生成(RAG)安等多域,合合成放集行化。
安全、可信、可控,是企部署的首
Granite 4.0 是全球第一得ISO/IEC 42001:2023 AI 管理系的源模型家族,展IBM AI 安全任治理的高度承:
- 所有模型皆加密章,保源完整性;
- 皆理查企授;
- 若在watsonx.ai 平台使用Granite 模型,IBM 提供上限第三方IP 保障。
此外,IBM HackerOne 共同宣布「找Granite漏洞」,最高金美金十元,鼓社群共同提升AI 安全。
企部署AI更、更活
Granite 4.0 支援多硬推理框架,香港企者可快速整合至有系:
- 支援AMD Instinct MI-300X GPU Qualcomm Hexagon NPU,用於行;
- 相容於vLLM、llama.cpp、MLX、NexaML 等主流推理框架;
- 可透Unsloth 行微,整合至Continue 等者工具。
者可在 Granite Playground用Granite 4.0,考Granite Docs 中的RAG、摘要、自化教源。
IBM 展Granite 4.0 模型家族,推出:
- 更小型的Medium Nano 模型,化AI部署能力;
- 化推理的Thinking 模型,支援策分析任;
- 持化架平台支援,推AI 普及化在地化。
IBM推出Granite 4.0,持倡放、安全、高效的企AI,助全球企在位型旅程中健前行。Granite 4.0 模型已在IBM watsonx.ai 平台放使用,用Apache 2.0 源授。更多IBM Granite 4.0。
於IBM
IBM 是全球先的混合、人工智能及企服提供商,助超 175 家和地的客,其有的中取商洞察,化流程,降低成本,得行。金融服、信和健康等基施域的千家政府和企依靠 IBM 混合平台和帽 OpenShift 快速、高效、安全地字化型。IBM 在人工智能、量子算、行解方案和企服方面的突破性新我的客提供了放和活的。企信、透明治理、社任、包容文化和服精神的期承是 IBM 展的基石。解更多信息,: www.ibm.com/
查更多本地,IBM香港新:https://hongkong.newsroom.ibm.com/
媒查:
- 者:美通社
- 更多新 »