DeepSeek-V3/R1-671B全参数微调指南及使用教程

DeepSeek-V3/R1-671B 全参数微调指南是什么?

DeepSeek-V3/R1-671B 全参数微调指南是一个关于 DeepSeek-V3/R1-671B 模型全参数微调的开源指南,由中国科学院自动化研究所和中科闻歌联合推出。项目提供了从训练到推理的完整代码和脚本,并总结了训练和部署过程中的经验和问题解决方案。

功能特点

全参数微调支持:提供从训练到推理的完整代码和脚本,支持数据并行和序列并行。

硬件优化:提供详细的硬件配置建议和实验结果,帮助高效利用计算资源。

数据格式适配:支持 Openai 标准数据格式,并扩展了对 reasoning 数据的兼容。

推理部署:支持将模型权重转换为 Hugging Face 格式,并通过 vLLM 等框架进行推理部署。

DeepSeek-V3/R1-671B 全参数微调指南用途

自然语言处理:适用于文本生成、机器翻译、情感分析等任务。

复杂场景推理:能够处理长篇幅文档和多领域任务,如医疗辅助诊断、金融分析等。

科研与技术探索:作为技术试验平台,探索通用人工智能(AGI)的潜在路径。

企业级应用:可用于智能客服、文档分析等场景,提升企业效率和决策能力。

如何使用DeepSeek-V3/R1-671B 全参数微调指南

1. 硬件配置

需要 32 台服务器,每台配置:

8 x NVIDIA H100 80GB GPU

96 核 CPU

2TB 内存

100TB 共享存储

InfiniBand 400G 网络

2. 环境配置

condacreate-nds_envpython=3.10
condaactivateds_env
pipinstall-rrequirements.txt
cp-r./code/xtuner/path/to/env/site-packages

3. 数据准备

数据格式示例:

{
"messages":[
{"role":"system","content":"Youareahelpfulassistant."},
{"role":"user","content":"用户问题"},
{"role":"assistant","content":"思考过程\n最终回答","loss":true}
]
}

4. 启动训练

使用 pdsh 或 slurm 启动训练:

pdsh-Rssh-wnode[0-31]'bash./code/scripts/sft_deepseek.sh'

5. 模型权重转换

将训练结果转换为 Hugging Face 格式:

bash./code/scripts/convert_pth_to_hf.sh

6. 推理部署

使用 vLLM 部署:

#启动Ray
pdsh-Rssh-wnode0"condaactivatevllm&&raystart–head"
pdsh-Rssh-wnode1,node2,node3"condaactivatevllm&&raystart–address='node0:6379'"
#启动vLLM
pdsh-Rssh-wnode0"vllmserve/path/to/model–tensor-parallel-size8–pipeline-parallel-size4"

GitHub仓库:https://github.com/ScienceOne-AI/DeepSeek-671B-SFT-Guide

(0)
上一篇 2025年9月19日 上午10:39
下一篇 2025年9月19日 上午10:39

猜你喜欢

扫码选款
扫码选款
关注我们
关注我们
联系我们

 

2023082207533677

客服热线:0577-67998888

返回顶部