亚马逊免费云服务器部署DeepSeek-R1教程

自国产AI模型DeepSeek横空出世后,不到一周就迅速火爆全球。如今腾讯云、阿里云、百度智能云、亚马逊云科技纷纷接入了这个大模型,那么如何部署呢,本文就以亚马逊云科技为例,为大家介绍一下亚马逊免费云服务器部署DeepSeek教程,感兴趣的朋友可以参考哦。

亚马逊免费云服务器也就是大家熟知的Amazon EC2,访问可靠、可扩展、可用性高达99.99%。现提供免费试用服务,试用规格为1核1G、30G SSD,包括每月750个小时的Linux、RHEL或SLES t2.micro或t3.micro实例使用时间,每月750个小时的Windows t2.micro或t3.micro实例使用时间,每月750小时无实例类型限制的公有IPv4地址使用时间,多操作系统可选,可免费试用12个月。

新用户注册亚马逊云科技账户,在控制台中试用免费套餐产品。

点击获取:免费云服务器Amazon EC2

Amazon EC2

相关推荐:《如何注册亚马逊AWS账号?

一、创建并配置Amazon EC2实例

1、找到亚马逊云科技管理控制台,导航到Amazon IAM页面并点击“创建角色”。选择Amazon Web Services作为受信任的实体类型,并选择Amazon EC2作为用例。

注:这些步骤使用了较为宽松的Amazon IAM托管策略,这仅是为了在沙盒账户中简化演示过程,在任何实际工作负载中,即使是非生产环境,也请遵循最小权限原则。

创建并配置Amazon EC2实例

2、将两个托管策略AmazonS3FullAccess和AmazonSSMManagedInstanceCore附加到deepseek-r1角色上,然后点击“创建角色”。

创建并配置Amazon EC2实例

3、设置Amazon EC2实例

登录AWS控制台,进入EC2服务,点击启动实例;

4、配置参数:

AMI:Amazon Linux 2 AMI。

实例类型:g4dn.xlarge。

5、网络设置:点击“编辑”并使用默认的VPC设置,创建一个新的安全组,并设置以下入站规则:

来自受信任IP范围的HTTP流量(在本示例中,将允许来自“My IP”的HTTP流量)。

来自VPC CIDR范围的目标端口为3000的TCP流量(这是在后续步骤中部署应用程序负载均衡器时,能够将流量转发到Amazon EC2实例的必要条件)。

来自VPC CIDR范围的HTTPS流量。

6、配置存储:100GiB gp3。

7、高级详情:Amazon IAM实例配置文件选择DeepSeek-R1。

创建并配置Amazon EC2实例

创建并配置Amazon EC2实例

8、连接服务器

在Amazon EC2实例启动完成后,选择deepseek-r1,然后在“会话管理器”(Session Manager)选项卡下点击“连接”。

创建并配置Amazon EC2实例

9、在Amazon EC2实例上安装并配置NVIDIA驱动程序

在会话管理器终端中运行以下命令,以在“g4dn EC2实例”上安装NVIDIA GRID驱动程序。

sudo yum update -y
sudo yum install gcc makesudo yum install -y gcc kernel-devel-$(uname -r)
cd ~
aws s3 cp --recursive s3://ec2-linux-nvidia-drivers/latest/ .
chmod +x NVIDIA-Linux-x86_64*.run
mkdir /home/ssm-user/tmp
chmod -R 777 tmp
cd /home/ssm-user 
export TMPDIR=/home/ssm-user/tmp
CC=/usr/bin/gcc10-cc ./NVIDIA-Linux-x86_64*.run --tmpdir=$TMPDIR

按照屏幕上的提示完成驱动程序安装过程,选择默认的配置选项。在安装过程中可能会出现一些警告,确认这些警告并继续安装。安装完成后,验证驱动程序是否正确安装,并禁用GSP(GPU Safety Package)。

nvidia-smi -q | head
sudo touch /etc/modprobe.d/nvidia.conf
echo "options nvidia NVreg_EnableGpuFirmware=0" | sudo tee --append /etc/modprobe.d/nvidia.conf

10、在Amazon EC2实例上安装并配置Docker

在会话管理器终端中运行以下命令,以在Amazon EC2实例上安装并启动Docker。

sudo yum install docker
sudo usermod -a -G docker ec2-user
sudo systemctl enable docker.service
sudo systemctl start docker.service

启动Docker服务后,运行以下命令以使用NVIDIA驱动程序配置Docker。

curl -s -L https://nvidia.github.io/libnvidia-container/stable/rpm/nvidia-container-toolkit.repo | \
sudo tee /etc/yum.repos.d/nvidia-container-toolkit.repo
sudo yum install -y nvidia-container-toolkit
sudo nvidia-ctk runtime configure --runtime=docker
sudo systemctl restart docker

相关推荐:《Amazon EC2启动和连接实例的具体操作教程

二、部署DeepSeek-R1模型

本文选择的是DeepSeek-R1-Distill-Qwen-14B模型,是指在DeepSeek-R1基础之上通过蒸馏技术得到的一系列具有较小参数规模的模型。具体来说,它代表了一组基于DeepSeek-R1进行压缩处理后的模型变体,其参数规模介于15亿至700亿之间。这些模型保留了原始模型的部分功能,但在计算资源占用和响应速度上有所优化,适合在性能有限的设备上部署。

1、在Amazon EC2实例上安装并配置Ollama服务器和Ollama Web UI

运行以下命令以部署Ollama服务器,并验证Ollama服务器是可访问状态。

docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama --restart always ollama/ollama
curl localhost:11434

在Ollama服务器运行后,可以通过运行以下命令从Ollama库中拉取DeepSeek-R1-Distill-Qwen-14B模型。

docker exec -it ollama ollama pull deepseek-r1:14b

最后,设置Ollama Web UI,以便用户可以通过网络浏览器与DeepSeek-R1-Distill-Qwen-14B进行交互。

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v ollama-webui:/app/backend/data --name ollama-webui --restart always ghcr.io/ollama-webui/ollama-webui:main

2、访问DeepSeek-R1的Amazon EC2实例

在亚马逊云科技管理控制台中,导航到Amazon EC2页面,并在左侧导航栏中选择“负载均衡器”。选择“应用程序负载均衡器”(Application Load Balancer,简称ALB)作为负载均衡器类型,然后点击“创建”。

为应用负载均衡器(ALB)使用以下配置:

  • 方案:面向互联网。
  • 负载均衡器IP地址类型:IPv4。
  • 网络设置:选择默认的VPC设置,并选择Amazon EC2实例所在的可用区。
  • 安全组:选择在Amazon EC2配置步骤中创建的安全组。

部署DeepSeek-R1模型

3、在“监听器和路由”部分,使用默认的HTTP:80设置,然后点击“创建目标组”。

部署DeepSeek-R1模型

将目标类型指定为“实例”,将目标组命名为deepseek-tg,然后点击“下一步”。

部署DeepSeek-R1模型

将DeepSeek-R1实例注册为目标,指定端口为3000,并点击“标记为待处理并包含”(Include as pending)。然后,点击“创建目标组”(Create Target Group)。

部署DeepSeek-R1模型

最后,返回到应用负载均衡器创建页面,选择deepseek-r1目标组。然后,向下滚动并点击“创建负载均衡器”。

部署DeepSeek-R1模型

4、通过ALB DNS访问Ollama Web UI上的DeepSeek-R1

在亚马逊云科技管理控制台中,导航到Amazon EC2页面,并在左侧导航栏中选择“负载均衡器”。选择在上一步中创建的deepseek-alb,并获取其DNS名称。

部署DeepSeek-R1模型

5、使用选择的网络浏览器访问ALB的DNS名称,将看到一个注册页面。

部署DeepSeek-R1模型

6、使用选择的电子邮件地址和密码进行注册,用户就可以开始探索部署在Amazon EC2上的DeepSeek-R1-Distill-Qwen-14B模型,该模型通过Ollama和Ollama Web UI提供服务。

部署DeepSeek-R1模型

至此,用户已经完成Amazon EC2部署DeepSeek-R1模型的完整操作流程。

相关推荐:《Amazon SageMaker部署DeepSeek-R1教程

使用教程

Amazon SageMaker部署DeepSeek-R1教程

2025-2-27 13:52:29

使用教程

京东云使用Ollama部署DeepSeek-R1教程

2025-3-6 10:32:35

相关推荐