如何使用 SGLang 在 Vultr 服务器部署 Deepseek R1 推理大语言模型

Deepseek R1 是第一代推理模型，旨在擅长数学、编码和逻辑推理任务。它利用强化学习（RL）和精心集成的冷启动阶段来增强可读性、连贯性和推理能力。这种方法有助于模型生成清晰、结构良好的响应，同时最大限度地减少重复和语言混合等问题。Deepseek R1 针对高质量推理进行了优化，使其成为处理复杂问题解决任务的强大工具。

在本文中，由于需要较大的 VRAM ，您将使用 SGlang 在 MI300X Vultr Cloud GPU 上部署 Deepseek R1，并配置模型以进行推理。通过利用 Vultr 的高性能云基础设施，您可以有效地设置 Deepseek R1 以执行高级推理任务。

文章目录 隐藏

先决条件

部署步骤

结论

Vultr 优惠推荐

先决条件

获取 AMD Instinct™ MI300X 实例的访问权限。

部署步骤

在本节中，您将安装必要的依赖项，构建支持 ROCm 的容器镜像，并在 Vultr Cloud GPU 上使用 Deepseek R1 部署 SGlang 推理服务器。然后，您将通过发送 HTTP 请求来测试模型的推理响应来验证部署。

安装 Hugging Face 命令行界面（CLI）软件包。
```
$ pip install huggingface_hub[cli]
```
下载DeepSeek R1型号。
```
$ huggingface-cli download deepseek-ai/DeepSeek-R1
```
以上命令将模型下载到$HOME/.cache/huggingface目录。建议在后台下载该模型并继续下一步，因为该模型的尺寸非常大，直到运行容器映像才需要。

克隆sglang推理服务器存储库。

$ git clone https://github.com/sgl-project/sglang.git

构建一个 ROCM 支持的容器镜像。
```
$ cd sglang/docker
$ docker build --build-arg SGL_BRANCH=v0.4.2 -t sglang:v0.4.2-rocm620 -f Dockerfile.rocm .
```
上面的命令构建了一个名为sglang:v0.4.2-rocm620使用Dockerfile.rocm清单。此步骤可能需要长达30分钟。

如果您面对error: RPC failed; curl 56 GnuTLS recv error在容器映像构建时错误，您可以尝试将以下行添加到Dockerfile.rocm文件之前，请先在克隆储存库的语句之前。
```
RUN git config --global http.postBuffer 1048576000
RUN git config --global https.postBuffer 1048576000
```
此外，如果您在构建时间期间面对连接超时，则可以尝试再次运行该过程以重新建立连接。 Docker能够缓存构建过程的部分，以确保有效利用时间和资源。

运行SGLANG推断服务器容器。

$ docker run -d --device=/dev/kfd --device=/dev/dri --ipc=host \
    --group-add video --cap-add=SYS_PTRACE --security-opt seccomp=unconfined \
    -v $HOME/dockerx:/dockerx -v $HOME/.cache/huggingface:/root/.cache/huggingface \
    --shm-size 16G -p 30000:30000 sglang:v0.4.2-rocm620 \
    python3 -m sglang.launch_server --model-path deepseek-ai/DeepSeek-R1 --tp 8 --trust-remote-code --host 0.0.0.0 --port 30000

上面的命令在带有ROCM支持的独立模式下运行SGLANG推理服务器容器，启用GPU访问和必要的权限。它安装了需要目录，分配共享内存，并使用张张量并行性（TP）设置为8的DeepSeek R1模型在端口30000上启动服务器。

发送HTTP请求以验证推理响应。

$ curl http://localhost:30000/v1/chat/completions \
     -H "Content-Type: application/json" \
     -d "{\"model\": \"deepseek-ai/DeepSeek-R1\", \"messages\": [{\"role\": \"user\", \"content\": \"I am running Deepseek on Vultr powered by AMD Instinct MI300X. What's next?\"}], \"temperature\": 0.7}"

可选：允许端口30000上的传入连接。
```
$ sudo ufw allow 30000
```

结论

在本文中，您使用 sglang 成功地在 MI300X vultr Cloud GPU 上部署了 DeepSeek R1，并准备了推理模型。通过利用 Vultr 的高性能基础架构，您已经建立了一个优化的环境，以有效地运行 DeepSeek R1。现在准备好模型，您可以在各种应用程序中使用其高级推理功能。

Vultr 优惠推荐

1. Vultr 充多少送多少活动

优惠码：VULTRMATCH
优惠说明：双倍存款！当您开设新账户时，Vultr 将匹配您的第一笔存款，最高 100 美元。不能与任何其他优惠结合使用，仅限新客户。
优惠页面：点击直达充值页面

2. Vultr 新用户免费赠送 250 美元

优惠码：FLYVULTR250
优惠说明：使用 250 美元免费额度免费试用 Vultr。仅限新客户。
优惠页面：点击直达优惠页面

3. Vultr 推荐套餐

CPU	内存	硬盘	月流量	带宽	IP	价格	购买
1核	0.5GB	10GB SSD	0.5TB	1Gbps	仅IPv6	$2.5/月	购买
1核	0.5GB	10GB SSD	0.5TB	1Gbps	1个IPv4	$3.5/月	购买
1核	1GB	25GB SSD	1TB	1Gbps	1个IPv4	$5/月	购买
1核	2GB	55GB SSD	2TB	1Gbps	1个IPv4	$10/月	购买
2核	4GB	80GB SSD	3TB	1Gbps	1个IPv4	$20/月	购买
4核	8GB	160GB SSD	4TB	1Gbps	1个IPv4	$40/月	购买
6核	16GB	320GB SSD	5TB	1Gbps	1个IPv4	$80/月	购买
8核	32GB	640GB SSD	6TB	1Gbps	1个IPv4	$160/月	购买
16核	64GB	1280GB SSD	10TB	1Gbps	1个IPv4	$320/月	购买
24核	96GB	1600GB SSD	15TB	1Gbps	1个IPv4	$640/月	购买

如何使用 SGLang 在 Vultr 服务器部署 Deepseek R1 推理大语言模型

先决条件

部署步骤

结论

Vultr 优惠推荐

相关推荐

最新优惠通知

最新文章

随机文章

归档

分类

网站统计

切换注册登录

切换登录注册