-
Meta开源多模态模型Llama 3.2
最近,Meta开源了多模态模型Llama 3.2,此次开源的是1B和3B轻量级模型。Meta使用了带有LoRA适配器的量化感知训练和SpinQuant进行了大幅度性能优化,平均减少了41%的内存使用、减少56%的模型规模,但推理效率却提升了2—4倍。 作为整个系列里最轻量级的模型,Llama3.2 1B和3B适合边缘设备和移动应用程序的检索和摘要,可用于个人信息管理和多语言知识检索等,支持128k…...- 0
- 19
-
Meta发布多模态Llama 3.2新模型
最近Meta发布了多模态Llama 3.2新模型,能够同时理解图像和文本。此次一共发布了四个版本,分别为Llama 3.2 1B、Llama 3.2 3B、Llama 3.2 90B和Llama 3.2 11B。 其中Llama 3.2 1B和Llama 3.2 3B是整个系列最轻量级的模型,适合边缘设备和移动应用程序的检索和摘要,可用于个人信息管理和多语言知识检索等,支持128k标记的上下文长度…...- 0
- 14
-
Meta发布首个超GPT-4o开源大模型Llama 3.1
最近,Meta宣布推出迄今为止最强大的开源模型——Llama 3.1。Llama 3.1共有8B、70B及405B三种版本,其中405B版本是目前最大的开源模型之一。 Llama 3.1 405B版本在多项测试中一举超越GPT-4o和Claude 3.5 Sonnet,支持128K上下文长度,英语、法语、德语等8种语言,能生成代码、文本、文本摘要等。 Llama 3.1 405B版本现在没有开放还…...- 0
- 21
-
Meta发布了最新大模型Llama 3
随着人工智能大战持续升级,4月19日,全球科技、社交巨头Meta在官网,正式发布了开源大模型——Llama 3。目前,Llama 3已经开放了80亿(8B)和700亿(70B)两个小参数版本,上下文窗口为8k。 Meta表示,通过使用更高质量的训练数据和指令微调,Llama 3比前代Llama 2有了“显著提升”。Llama 3使用了15T tokens的训练数据,在推理、数学、代码生成、指令跟踪…...- 0
- 21
-
百度智能云:国内首家推出针对Llama3全系列训练方案
4月18日,Facebook母公司Meta重磅推出了号称“史上最强大开源模型”的Llama3。4月19日,百度智能云千帆大模型成为国内首家推出针对Llama3全系列版本的训练推理方案的平台。现已开放邀约测试。 百度智能云千帆大模型平台中各种尺寸模型定制工具千帆ModelBuilder已上架最新Llama 3系列模型,用户在「体验中心」可以随时体验模型效果。同时,开发者可以根据需求上传数据,在千帆M…...- 0
- 20
-
国产130亿参数大模型开源 性能超Llama2-13B
近日,由元象XVERSE研发的国产大模型XVERSE-13B正式开源,可免费商用。据了解,XVERSE-13B支持40多种语言、8192上下文长度。在多项中英文测评中,性能超过了同尺寸(130亿参数)的LIama2、Baichuan等。 GitHub链接:https://github.com/xverse-ai/XVERSE-13B XVERSE-13B大模型主要有这几个方面的特点: 模型架构方面…...- 0
- 41
-
IBM开源最新企业级大模型Granite 3.0
IBM开源了最新企业级大模型Granite 3.0,该模型包括8B和2B两个微调版本,支持RAG、高级推理、文本/代码生成等,支持12种语言和116种编程语言,接受了12万亿tokens数据训练。 据悉,在AST、BT、安全测试基准中,Granite 3.0 8B超越了Meta最新开源的Llama-3.1 8B。 Granite 3.0的8B和2B版本被设计为企业级AI的“主力”模型,具备更强的稳…...- 0
- 16
-
微软发布Phi-3.5系列模型 支持128K上下文 可在移动设备使用
近日微软发布了Phi-3.5系列模型,包括mini-instruct、MoE-instruct和vision-instruct三种模型,适合在内存和算力受限的环境中运行,均支持128k上下文长度。目前可以在手机、平板电脑等移动设备中使用。 Phi-3.5系列中的Phi-3.5-mini-instruct参数规模非常小,但性能却超过了Meta最新开源的Llama 3.1 8B和Mistral 7B等…...- 0
- 37
-
谷歌宣布开源大语言模型Gemma性能超过Llama 2!
谷歌在2月22日官网宣布,开源大语言模型Gemma。 Gemma与谷歌最新发布的Gemini 使用了同一架构,有20亿、70亿两种参数,每种参数都有预训练和指令调优两个版本。 根据谷歌公布的测试显示,在MMLU、BBH、GSM8K等主流测试平台中,其70亿模型在数学、推理、代码的能力超过Llama-2的70亿和130亿,成为最强小参数的类ChatGPT模型。 目前,Gemma可以商用,并且普通笔记…...- 0
- 15
-
ChatGPT正在测试原生文件分析功能 DALL·E3能P图啦!
10月29日,有部分用户在社交平台上分享,ChatGPT Plus正在测试原生文件上传、分析功能,可以通过文本问答的方式,对上传的PDF等数据文件进行提问、搜索。 例如,上传一份50页的员工手册PDF文件,然后向ChatGPT提问,能帮我总结一下手册的5个核心观点吗?;新入职员工触犯规则后,会遭遇哪些处罚? 其实,文件分析功能并不是最近才推出的,用户借助ChatGPT早期推出的第三方插件功能就能实…...- 0
- 17
-
谷歌对Vertex AI大更新 支持Llama 2模型微调
8月30日,谷歌在美国旧金山召开“Google Cloud Next 23”,生成式AI成为本次大会的核心主题。谷歌围绕生成式AI,从基础设施、开发工具到产品全方位多维度地进行了重磅更新。此外,谷歌为了帮助全球开发者提升对生成式AI、大语言模型等开发效率,加速应用场景化落地,对Vertex AI进行了多项功能优化,尤其是发布了全球首个数字水印,用于AI生成的图像识别和安全。 Vertex AI是G…...- 0
- 75
-
文本生成代码模型Code Llama正式开源 可商业化
8月25日,全球社交、科技巨头Meta在官网正式开源了,文本生成代码模型Code Llama。据悉,Code Llama是基于Meta前不久发布的,最强开源大语言模型Llama 2之上开发而成,提供基础代码、专门针对Python开发和基于自然语言指令微调的,70亿、130亿、340亿三种参数模型。允许企业、个人开发者使用此模型,进行商业化。 开源地址:https://github.com/face…...- 0
- 41