IBM开源了最新企业级大模型Granite 3.0,该模型包括8B和2B两个微调版本,支持RAG、高级推理、文本/代码生成等,支持12种语言和116种编程语言,接受了12万亿tokens数据训练。
据悉,在AST、BT、安全测试基准中,Granite 3.0 8B超越了Meta最新开源的Llama-3.1 8B。
Granite 3.0的8B和2B版本被设计为企业级AI的“主力”模型,具备更强的稳健性和可靠性,能够处理更广泛的任务,在检索增强生成、分类、摘要等任务中提供卓越性能。这些紧凑多功能的模型可根据企业数据进行微调,并无缝集成到各种业务环境或工作流程中。
Granite 3.0的扩展性和推理能耗方面非常不错,可在多种平台上运行,包括IBM的Watson、英伟达的NIM、Hugging Face、谷歌云的Vertex AI Model Garden,甚至可以在笔记本上使用Ollama支持本地运行。
Granite 3.0 8B模型具备高级推理能力和高度结构化的聊天模板,适用于实现工具使用工作流,同时为IBM的智能体AI(agentic AI)努力奠定了基础。