文章
关键词 [Llama 3] 的搜索结果:
-
Meta开源多模态模型Llama 3.2
最近,Meta开源了多模态模型Llama 3.2,此次开源的是1B和3B轻量级模型。Meta使用了带有LoRA适配器的量化感知训练和SpinQuant进行了大幅度性能优化,平均减少了41%的内存使用、减少56%的模型规模,但推理效率却提升了2—4倍。 作为整个系列里最轻量级的模型,Llama3.2 1B和3B适合边缘设备和移动应用程序的检索和摘要,可用于个人信息管理和多语言知识检索等,支持128k… -
Meta发布多模态Llama 3.2新模型
最近Meta发布了多模态Llama 3.2新模型,能够同时理解图像和文本。此次一共发布了四个版本,分别为Llama 3.2 1B、Llama 3.2 3B、Llama 3.2 90B和Llama 3.2 11B。 其中Llama 3.2 1B和Llama 3.2 3B是整个系列最轻量级的模型,适合边缘设备和移动应用程序的检索和摘要,可用于个人信息管理和多语言知识检索等,支持128k标记的上下文长度… -
阿里云PAI使用LLaMA Factory微调LlaMA 3模型的教程
LLaMA Factory是什么?LLaMA Factory是一个开源微调框架,旨在简化和优化大规模语言模型的训练和部署。LLaMA Factory集成了业界广泛使用的微调技术,支持通过Web UI界面零代码微调大模型。本文将基于LlaMA 3模型,为大家介绍阿里云PAI使用LLaMA Factory微调LlaMA 3模型的具体操作方法。 点击进入:阿里云官网 前提条件: 1、创建工作空间。 2、… -
Meta发布首个超GPT-4o开源大模型Llama 3.1
最近,Meta宣布推出迄今为止最强大的开源模型——Llama 3.1。Llama 3.1共有8B、70B及405B三种版本,其中405B版本是目前最大的开源模型之一。 Llama 3.1 405B版本在多项测试中一举超越GPT-4o和Claude 3.5 Sonnet,支持128K上下文长度,英语、法语、德语等8种语言,能生成代码、文本、文本摘要等。 Llama 3.1 405B版本现在没有开放还… -
Meta发布了最新大模型Llama 3
随着人工智能大战持续升级,4月19日,全球科技、社交巨头Meta在官网,正式发布了开源大模型——Llama 3。目前,Llama 3已经开放了80亿(8B)和700亿(70B)两个小参数版本,上下文窗口为8k。 Meta表示,通过使用更高质量的训练数据和指令微调,Llama 3比前代Llama 2有了“显著提升”。Llama 3使用了15T tokens的训练数据,在推理、数学、代码生成、指令跟踪… -
百度智能云:国内首家推出针对Llama3全系列训练方案
4月18日,Facebook母公司Meta重磅推出了号称“史上最强大开源模型”的Llama3。4月19日,百度智能云千帆大模型成为国内首家推出针对Llama3全系列版本的训练推理方案的平台。现已开放邀约测试。 百度智能云千帆大模型平台中各种尺寸模型定制工具千帆ModelBuilder已上架最新Llama 3系列模型,用户在「体验中心」可以随时体验模型效果。同时,开发者可以根据需求上传数据,在千帆M… -
国产130亿参数大模型开源 性能超Llama2-13B
近日,由元象XVERSE研发的国产大模型XVERSE-13B正式开源,可免费商用。据了解,XVERSE-13B支持40多种语言、8192上下文长度。在多项中英文测评中,性能超过了同尺寸(130亿参数)的LIama2、Baichuan等。 GitHub链接:https://github.com/xverse-ai/XVERSE-13B XVERSE-13B大模型主要有这几个方面的特点: 模型架构方面… -
IBM开源最新企业级大模型Granite 3.0
IBM开源了最新企业级大模型Granite 3.0,该模型包括8B和2B两个微调版本,支持RAG、高级推理、文本/代码生成等,支持12种语言和116种编程语言,接受了12万亿tokens数据训练。 据悉,在AST、BT、安全测试基准中,Granite 3.0 8B超越了Meta最新开源的Llama-3.1 8B。 Granite 3.0的8B和2B版本被设计为企业级AI的“主力”模型,具备更强的稳… -
微软发布Phi-3.5系列模型 支持128K上下文 可在移动设备使用
近日微软发布了Phi-3.5系列模型,包括mini-instruct、MoE-instruct和vision-instruct三种模型,适合在内存和算力受限的环境中运行,均支持128k上下文长度。目前可以在手机、平板电脑等移动设备中使用。 Phi-3.5系列中的Phi-3.5-mini-instruct参数规模非常小,但性能却超过了Meta最新开源的Llama 3.1 8B和Mistral 7B等… -
谷歌宣布开源大语言模型Gemma性能超过Llama 2!
谷歌在2月22日官网宣布,开源大语言模型Gemma。 Gemma与谷歌最新发布的Gemini 使用了同一架构,有20亿、70亿两种参数,每种参数都有预训练和指令调优两个版本。 根据谷歌公布的测试显示,在MMLU、BBH、GSM8K等主流测试平台中,其70亿模型在数学、推理、代码的能力超过Llama-2的70亿和130亿,成为最强小参数的类ChatGPT模型。 目前,Gemma可以商用,并且普通笔记… -
ChatGPT正在测试原生文件分析功能 DALL·E3能P图啦!
10月29日,有部分用户在社交平台上分享,ChatGPT Plus正在测试原生文件上传、分析功能,可以通过文本问答的方式,对上传的PDF等数据文件进行提问、搜索。 例如,上传一份50页的员工手册PDF文件,然后向ChatGPT提问,能帮我总结一下手册的5个核心观点吗?;新入职员工触犯规则后,会遭遇哪些处罚? 其实,文件分析功能并不是最近才推出的,用户借助ChatGPT早期推出的第三方插件功能就能实… -
谷歌对Vertex AI大更新 支持Llama 2模型微调
8月30日,谷歌在美国旧金山召开“Google Cloud Next 23”,生成式AI成为本次大会的核心主题。谷歌围绕生成式AI,从基础设施、开发工具到产品全方位多维度地进行了重磅更新。此外,谷歌为了帮助全球开发者提升对生成式AI、大语言模型等开发效率,加速应用场景化落地,对Vertex AI进行了多项功能优化,尤其是发布了全球首个数字水印,用于AI生成的图像识别和安全。 Vertex AI是G… -
文本生成代码模型Code Llama正式开源 可商业化
8月25日,全球社交、科技巨头Meta在官网正式开源了,文本生成代码模型Code Llama。据悉,Code Llama是基于Meta前不久发布的,最强开源大语言模型Llama 2之上开发而成,提供基础代码、专门针对Python开发和基于自然语言指令微调的,70亿、130亿、340亿三种参数模型。允许企业、个人开发者使用此模型,进行商业化。 开源地址:https://github.com/face… -
腾讯云TI平台正式上架 全面接入Llama 2等主流开源模型
8月16日,在2023中国数字经济创新发展大会上,腾讯高级执行副总裁、云与智慧产业事业群CEO汤道生宣布腾讯云TI平台正式上架。 据悉,腾讯云TI平台已经全面接入Llama 2、Falcon、Dolly、Vicuna、Bloom、Alpaca等20多个主流模型!这些主流模型支持直接部署调用、应用流程简单、可全程低代码操作。企业、开发者可以根据不同细分场景的业务需求,灵活选择各类大模型,降低大模型使… -
IBM将提供类ChatGPT开源模型Llama 2 最高700亿参数
8月10日,IBM在官网宣布,将在watsonx.ai和数据平台中,提供700亿参数开源大语言模型Llama 2。Llama 2是科技、社交巨头Meta在上个月开源的一款类ChatGPT大语言模型并允许商业化。Llama 2是在Llama基础之上构建而成,拥有70亿、130亿和700亿三种参数,可用于开发各种生成式AI产品,是目前最强开源大语言模型之一。 免费试用地址:https://datapl… -
阿里云率先支持Llama2全系列训练和部署
7月25日,阿里云宣布在国内率先推出针对Llama2全系列版本的训练和部署方案,意味着所有开发者都可以在阿里云上打造专属大模型。据悉,Llama2是科技巨头Meta最新开源的类ChatGPT大语言模型,包括70亿、130亿及700亿参数版本。 一直以来,中小企业、普通开发者对Llama2的再训练、微调和部署都存在较高门槛,尤其是针对效果更胜一筹的大参数版本。由阿里云牵头发起的AI模型社区魔搭Mod… -
Meta发布类ChatGPT开源模型Llama 2 允许商业化
当地时间7月18日,Meta在官网发布了类ChatGPT开源大语言模型——Llama 2。Llama 2是在Llama基础之上构建而成,拥有70亿、130亿和700亿三种参数,还有一种340亿参数正在训练中并没有在此次发布。 开源地址:https://github.com/facebookresearch/llama Llama被誉为类ChatGPT开源模型的“鼻祖”,几乎国内外所有知名开源项目等… -
阿里达摩院开源Video-LLaMA 一个具有综合视听能力大模型
近日,阿里达摩院正式开源大模型Video-LLaMA,论文、代码、交互demo都已开放。另外,在 Video-LLaMA 的项目主页中,研究团队还提供了中文版本的模型,让中文用户的体验更丝滑。据悉,Video-LLaMA 能够感知和理解视频中的视频和音频信号,并能理解用户输入的指令,完成一系列基于音视频的复杂任务,例如音视频描述、写作、问答等。 Video-LLaMA 采用了模块化设计原则,把视频… -
Mistral.ai发布首个专业代码模型Codestral
最近,由微软支持、估值高达60亿美元的法国人工智能初创公司Mistral发布了首个用于编码的生成式人工智能模型,名为Codestral。 Codestral旨在帮助开发人员编写代码并与代码交互,支持包括Python、Java、C++和JavaScript在内的80多种编程语言。 据悉,Codestral有220亿参数,支持32K上下文窗口,使用了80多种编程语言数据集进行了预训练,例如,Pytho… -
UCloud GPU云主机 AI大模型最佳实践汇总
目前,AI大模型已经成为了人工智能的主流趋势。这些AI大模型需要庞大的计算资源和存储空间,因此部署AI大模型通常需要使用云计算服务。在众多云服务产品之中,GPU云主机是部署AI大模型的最佳选择之一。本文,小编就以UCloud为例,为大家整理了GPU云主机AI大模型最佳实践汇总。 UCloud GPU云主机购买方案介绍:《UCloud GPU云主机价格及配置信息》 一、ChatGLM-6B模型快速部…