Meta发布类ChatGPT开源模型Llama 2 允许商业化

当地时间7月18日,Meta在官网发布了类ChatGPT开源大语言模型——Llama 2。Llama 2是在Llama基础之上构建而成,拥有70亿、130亿和700亿三种参数,还有一种340亿参数正在训练中并没有在此次发布。

开源地址:https://github.com/facebookresearch/llama

Llama 2

Llama被誉为类ChatGPT开源模型的“鼻祖”,几乎国内外所有知名开源项目等都是基于或借鉴了该产品。但LLaMA一直有一个致命缺点,无法商业化,只能用于学术研究。与第一代Llama相比,Llama 2最大亮点之一是允许商业化,任何企业、个人开发者都能将其用在商业用途,例如,开发生成式AI助手、聊天机器人、增强个人应用等。不过,根据Meta的商业协定显示,如果使用Llama 2的企业月活人数超过7亿,将需要向Meta申请特定的商业许可。

在技术方面,Llama 2预训练模型接受了2万亿个标记的训练,上下文长度是Llama 1的两倍。其微调模型已经接受了超过100 万个人类注释的训练。Llama 2在许多外部基准测试上的表现,都优于其他开源语言模型,包括推理、编码、熟练程度和知识测试等。

训练数据方面,Llama 2的数据集包含了来自公开可用资源的混合数据。Llama 2采用了Llama 1中的大部分预训练设置和模型架构,包括标准 Transformer架构等。

与此同时,微软在“Microsoft Inspire 2023”大会上宣布与Meta达成技术合作,将在Windows和Azure云服务中提供LLama 2。用户可以在Azure上,安全可靠地使用或微调LLama 2模型。同时Llama 2可以在Windows上本地运行,这使得Windows开发人员将能够通过 ONNX以DirectML执行提供程序为目标来使用该模型,从而在为应用程序集成生成式AI体验时实现无缝工作流程。

微软表示,将Llama 2大语言模型集成在Windows中,有助于推动 Windows成为开发人员构建针对客户需求量身定制的生成式AI体验的最佳开发平台。

服务商动态

携程发布首个旅游行业大模型“携程问道”

2023-7-18 9:34:47

服务商动态

商汤发布SenseTrust治理平台 护航生成式AI可信发展

2023-7-19 9:51:32

相关推荐