DeepSeek-R1是幻方量化旗下AI公司深度求索研发的推理模型,采用强化学习进行后训练,旨在提升推理能力,尤其擅长数学、代码和自然语言推理等复杂任务。那么如何部署DeepSeek-R1模型呢,本文就来为大家详细介绍如何将DeepSeek-R1开源模型部署到阿里云GPU云服务器上,仅供参考。
一、创建阿里云GPU云服务器
阿里云GPU云服务器是基于GPU与CPU应用的计算服务器,具有超强的计算能力,服务于深度学习、科学计算、图形可视化、视频处理多种应用场景。提供丰富的实例规格可选,用户可以按需进行选择。
阿里云GPU云服务器方案推荐
《点击进入官网选购》
1、进入阿里云官网,注册并登录账号。
2、登录专有网络管理控制台,创建专有网络VPC和交换机。
3、创建一个安全组,用于限制该专有网络VPC下交换机的网络流入和流出。
4、进入GPU云服务器管理控制台,在左侧导航栏,选择实例与镜像>实例。
5、在顶部菜单栏,选择华东1(杭州)地域。
6、在实例页面,单击创建实例,并完成相关配置选择,等待创建完成。
相关推荐:
二、部署DeepSeek-R1模型
DeepSeek作为一款源自中国深度求索团队的大规模预训练语言模型,以其高效推理、多模态融合及对垂直领域的深度优化而著称。该模型通过深度优化Transformer架构,融合稀疏注意力机制,大幅降低计算复杂度,从而在保持强大能力的同时,实现了对大算力依赖的显著降低。
1、进入阿里云GPU云服务器控制台,在左侧导航栏,选择实例与镜像>实例。
2、在顶部菜单栏,选择华东1(杭州)地域。
3、部署示例应用程序。
- 在实例页面,找到前面步骤中创建的GPU云服务器实例,查看IP地址列,记录公网IP,然后在其右侧操作列,单击远程连接。
- 在远程连接对话框的通过Workbench远程连接区域,单击立即登录,然后根据页面提示登录。
4、输入密码并点击确定按钮,通过Workbench远程连接至ECS控制台。
5、如图所示GPU驱动尚未完成安装,请等待10-20分钟,安装完成后实例将自动重启。
6、驱动安装完成如下图所示,请刷新页面重新连接至GPU云服务器控制台。
7、执行以下命令等待部署完成。
/bin/bash -c "$(curl -fsSL https://help-static-aliyun-doc.aliyuncs.com/install-script/deepseek-r1-for-platforms/vllm_install.sh)" -- deepseek-ai/DeepSeek-R1-Distill-Qwen-7B
8、如下图所示,说明模型部署完成,复制保存好vLLM API TOKEN。
相关推荐: