亚马逊免费云服务器部署DeepSeek-R1教程

自国产AI模型DeepSeek横空出世后，不到一周就迅速火爆全球。如今腾讯云、阿里云、百度智能云、亚马逊云科技纷纷接入了这个大模型，那么如何部署呢，本文就以亚马逊云科技为例，为大家介绍一下亚马逊免费云服务器部署DeepSeek教程，感兴趣的朋友可以参考哦。

亚马逊免费云服务器也就是大家熟知的Amazon EC2，访问可靠、可扩展、可用性高达99.99%。现提供免费试用服务，试用规格为1核1G、30G SSD，包括每月750个小时的Linux、RHEL或SLES t2.micro或t3.micro实例使用时间，每月750个小时的Windows t2.micro或t3.micro实例使用时间，每月750小时无实例类型限制的公有IPv4地址使用时间，多操作系统可选，可免费试用12个月。

新用户注册亚马逊云科技账户，在控制台中试用免费套餐产品。

点击获取：免费云服务器Amazon EC2

Amazon EC2

相关推荐：《如何注册亚马逊AWS账号？》

一、创建并配置Amazon EC2实例

1、找到亚马逊云科技管理控制台，导航到Amazon IAM页面并点击“创建角色”。选择Amazon Web Services作为受信任的实体类型，并选择Amazon EC2作为用例。

注：这些步骤使用了较为宽松的Amazon IAM托管策略，这仅是为了在沙盒账户中简化演示过程，在任何实际工作负载中，即使是非生产环境，也请遵循最小权限原则。

创建并配置Amazon EC2实例

2、将两个托管策略AmazonS3FullAccess和AmazonSSMManagedInstanceCore附加到deepseek-r1角色上，然后点击“创建角色”。

创建并配置Amazon EC2实例

3、设置Amazon EC2实例

登录AWS控制台，进入EC2服务，点击启动实例；

4、配置参数：

AMI：Amazon Linux 2 AMI。

实例类型：g4dn.xlarge。

5、网络设置：点击“编辑”并使用默认的VPC设置，创建一个新的安全组，并设置以下入站规则：

来自受信任IP范围的HTTP流量（在本示例中，将允许来自“My IP”的HTTP流量）。

来自VPC CIDR范围的目标端口为3000的TCP流量（这是在后续步骤中部署应用程序负载均衡器时，能够将流量转发到Amazon EC2实例的必要条件）。

来自VPC CIDR范围的HTTPS流量。

6、配置存储：100GiB gp3。

7、高级详情：Amazon IAM实例配置文件选择DeepSeek-R1。

创建并配置Amazon EC2实例

8、连接服务器

在Amazon EC2实例启动完成后，选择deepseek-r1，然后在“会话管理器”（Session Manager）选项卡下点击“连接”。

创建并配置Amazon EC2实例

9、在Amazon EC2实例上安装并配置NVIDIA驱动程序

在会话管理器终端中运行以下命令，以在“g4dn EC2实例”上安装NVIDIA GRID驱动程序。

sudo yum update -y
sudo yum install gcc makesudo yum install -y gcc kernel-devel-$(uname -r)
cd ~
aws s3 cp --recursive s3://ec2-linux-nvidia-drivers/latest/ .
chmod +x NVIDIA-Linux-x86_64*.run
mkdir /home/ssm-user/tmp
chmod -R 777 tmp
cd /home/ssm-user 
export TMPDIR=/home/ssm-user/tmp
CC=/usr/bin/gcc10-cc ./NVIDIA-Linux-x86_64*.run --tmpdir=$TMPDIR

按照屏幕上的提示完成驱动程序安装过程，选择默认的配置选项。在安装过程中可能会出现一些警告，确认这些警告并继续安装。安装完成后，验证驱动程序是否正确安装，并禁用GSP（GPU Safety Package）。

nvidia-smi -q | head
sudo touch /etc/modprobe.d/nvidia.conf
echo "options nvidia NVreg_EnableGpuFirmware=0" | sudo tee --append /etc/modprobe.d/nvidia.conf

10、在Amazon EC2实例上安装并配置Docker

在会话管理器终端中运行以下命令，以在Amazon EC2实例上安装并启动Docker。

sudo yum install docker
sudo usermod -a -G docker ec2-user
sudo systemctl enable docker.service
sudo systemctl start docker.service

启动Docker服务后，运行以下命令以使用NVIDIA驱动程序配置Docker。

curl -s -L https://nvidia.github.io/libnvidia-container/stable/rpm/nvidia-container-toolkit.repo | \
sudo tee /etc/yum.repos.d/nvidia-container-toolkit.repo
sudo yum install -y nvidia-container-toolkit
sudo nvidia-ctk runtime configure --runtime=docker
sudo systemctl restart docker

相关推荐：《Amazon EC2启动和连接实例的具体操作教程》

二、部署DeepSeek-R1模型

本文选择的是DeepSeek-R1-Distill-Qwen-14B模型，是指在DeepSeek-R1基础之上通过蒸馏技术得到的一系列具有较小参数规模的模型。具体来说，它代表了一组基于DeepSeek-R1进行压缩处理后的模型变体，其参数规模介于15亿至700亿之间。这些模型保留了原始模型的部分功能，但在计算资源占用和响应速度上有所优化，适合在性能有限的设备上部署。

1、在Amazon EC2实例上安装并配置Ollama服务器和Ollama Web UI

运行以下命令以部署Ollama服务器，并验证Ollama服务器是可访问状态。

docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama --restart always ollama/ollama
curl localhost:11434

在Ollama服务器运行后，可以通过运行以下命令从Ollama库中拉取DeepSeek-R1-Distill-Qwen-14B模型。

docker exec -it ollama ollama pull deepseek-r1:14b

最后，设置Ollama Web UI，以便用户可以通过网络浏览器与DeepSeek-R1-Distill-Qwen-14B进行交互。

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v ollama-webui:/app/backend/data --name ollama-webui --restart always ghcr.io/ollama-webui/ollama-webui:main

2、访问DeepSeek-R1的Amazon EC2实例

在亚马逊云科技管理控制台中，导航到Amazon EC2页面，并在左侧导航栏中选择“负载均衡器”。选择“应用程序负载均衡器”（Application Load Balancer，简称ALB）作为负载均衡器类型，然后点击“创建”。

为应用负载均衡器（ALB）使用以下配置：