「中小企友好」 IBM 表 Granite 4.0小言模型 量 高效 低成本 - 新 - PChome Online 新

「中小企友好」 IBM 表 Granite 4.0小言模型 量 高效 低成本

「中小企友好」 IBM 表 Granite 4.0小言模型 量 高效 低成本

全球第一得ISO/IEC 42001:2023 AI 管理系的源模型

理代理型任而生可部署或作大型推理系的模

台北2025年10月7日 /美通社/ -- IBM 日前表其最新一代企「小言模型」 Granite 4.0,以新的混合式架,合 Mamba-2Transformer 技,前所未有的效能效率。Granite 4.0 不大幅降低硬成本,更提供企部署AI 的安全性、可控性性,台各型企的AI 用落地提供力支援。


「中小企友好」 IBM 表 Granite 4.0小言模型 量 高效 低成本

IBM 表「中小企友好」的小言模型 Granite 4.0,理AI 任大幅降低的使用量 70%,推理速度加快 2 倍,同支援更平的 GPU包括家用硬;大幅降低企部署AI成本,更提高用AI 的安全性、可控性性。

Granite 4.0已在IBM watsonx.ai平台正式上,同步支援Dell Technologies (Dell Pro AI Studio Enterprise Hub)、Docker Hub、Hugging Face、Kaggle、LM Studio、NVIDIA NIM、Ollama、OPAQUE 及Replicate 等平台;未也支援Amazon SageMaker JumpStart Microsoft Azure AI Foundry。

混合式架,造效能成本的完美平衡

Granite 4.0 用新的Mamba/Transformer 混合架,突破Transformer 模型理文本的效能瓶。Mamba 架可性展上下文度,Granite 4.0 在理任,大幅降低的使用量70%,推理速度加快2 倍,同支援更平的GPU包括家用硬。突破台中小企者意味著高效能AI 不再是高成本的同,而是人人可及的技源。

多元模型版本,足各企需求

Granite 4.0 提供多模型格,活不同景:

  • Granite-4.0-H-Small:量32B的混合式家模型,活9B,合客服自化、多工具代理任;
  • Granite-4.0-H-Tiny:量7B的混合式家模型,活1B,合算地端部署;
  • Granite-4.0-H-Micro:量3B 的混合式模型,快速行任;
  • Granite-4.0-Micro: Transformer 架,用於尚未支援混合架的平台。

Granite 4.0 所有模型皆提供Base Instruct 版本;於2025年底推出化推理的Thinking 模型。

小模型,大效能

Granite 4.0模型然尺寸精,但在多基中的表,超越同其他大型源模型:

  • 在 Stanford IFEval 指令遵循中,Granite-4.0-H-Small 表於所有源模型(除 Llama 4 Maverick 外);
  • 在 Berkeley Function Calling Leaderboard v3 中,Granite-4.0-H-Small 以更低成本到大型模型相同的工具用率;
  • MTRAG 多索增生成中亦有亮眼表。

上述成果功於IBM 全面升了模型架、方法料品,包含使用一精心、聚焦於企用的22 兆字元模的料。Granite 4.0 的料涵多元源,包括DataComp-LM (DCLM)、GneissWeb、TxT360 子集、Wikipedia 以及其他企景高度相的料源。了增模型理企任的表,些模型後(post-training),涵言理解、程式生成、推理、多言理、安全性、工具用(tool calling)、索增生成(RAG)安等多域,合合成料放料集行化。

安全、可信、可控,是企部署的首

Granite 4.0 是全球第一得ISO/IEC 42001:2023 AI 管理系的源模型家族,展IBM AI 安全任治理的高度承:

  • 所有模型皆加密章,保源完整性;
  • 料皆理查企授;
  • 若在 watsonx.ai 平台使用 Granite 模型,IBM 提供上限第三方 IP 保障。

此外,IBM HackerOne 共同宣布「找Granite漏洞」,最高金美金十元,鼓社群共同提升AI 安全。

企部署AI更、更活

Granite 4.0 支援多硬推理框架,台企者可快速整合至有系:

  • 支援 AMD Instinct MI-300X GPU Qualcomm Hexagon NPU,用於行;
  • 相容於 vLLM、llama.cpp、MLX、NexaML 等主流推理框架;
  • 可透 Unsloth 行微,整合至 Continue 等者工具。

者可在 Granite Playground用Granite 4.0,考Granite Docs 中的RAG、摘要、自化教源。

IBM 展Granite 4.0 模型家族,推出:

  • 更小型的 Medium Nano 模型,化AI部署能力;
  • 化推理的 Thinking 模型,支援策分析任;
  • 持化架平台支援,推 AI 普及化在地化。

IBM推出Granite 4.0,持倡放、安全、高效的企AI,助全球企在位型旅程中健前行。Granite 4.0 模型已在IBM watsonx.ai 平台放使用,用Apache 2.0 源授。更多IBM Granite 4.0

IBM

IBM 是全球先的混合、人工智慧及企服提供者,服遍及全球175 多家。IBM 助企料中得商洞察、化流程、降低成本增力。自金融服、信和等域的,用IBM 混合平台及Red Hat OpenShift 行位型。IBM 在人工智慧、量子算和向的端解方案及企服域持新,客提供放且活的。公司秉持信、透明治理、社任、多元包容的企文化,奠定了IBM 的基石。

台IBM 公司新室:https://taiwan.newsroom.ibm.com/

IBM 公司公部 Kate Liu kateliu@cn.ibm.com

Google新-PChome Online新


延伸
最新新
人新
行版
ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86