推理效率与国外同类产品架构解决方案相当,国产飞腾 CPU 实现对 DeepSeek 全系列大模型端到端支持

发布时间:2025-02-10 11:45:25 来源:互联网

本站 2 月 9 日消息,飞腾信息技术有限公司昨日晚发文宣布,旗下腾云 S5000C 和腾锐 D3000 成功实现对 DeepSeek 全系列大模型的端到端支持,覆盖数据中心和终端场景,本地部署的推理效率与国外同类产品架构解决方案相当。

据介绍,DeepSeek-V2.5 236B 大模型于2024 年在飞腾腾云 S5000C 平台实现稳定运行。基于飞腾腾云 S5000C 设备搭配 8 块国产 AI 卡,整体性能可达国外平台性能 80% 左右。DeepSeek-V3 和 R1 版本发布后,飞腾技术团队在腾云 S5000C 平台和腾锐 D3000 上对其进行本地部署验证,形成整体解决方案。

数据中心侧,飞腾腾云 S5000C 服务器可与多款 AI 加速卡配合实现 DeepSeek 蒸馏版和全量版部署。飞腾 AI 实验室在单机 8 卡服务器平台已进行蒸馏版 DeepSeek-R1-Distill-Llama-70B 版本测试,推理速度可达 22tokens / s。完整版 DeepSeek R1 671B 模型采用分布式推理框架,基于四机 32 卡 AI 服务器集群运行可部署成功。

用户终端侧,基于飞腾腾锐 D3000 的台式机可以本地部署 DeepSeek-R1 7B 蒸馏版模型,搭配 1 张国产推理卡,实现 AI PC 能力。

本站附飞腾腾云 S5000C和飞腾腾锐 D3000 两款 CPU 的主要信息如下:

腾云 S5000C

飞腾腾云 S5000C 拥有 64 核、32 核、16 核 3 种产品形态,兼容 ARMv8 指令集,支持硬件虚拟化,产品支持商业和工业分级,该产品主要面向计算服务器、存储服务器、AI 服务器、高端网安、行业级业务主机服务器系统、大型互联网数据中心等场景。

腾锐 D3000

飞腾腾锐 D3000 集成 8 个飞腾自主研发的新一代高性能处理器核 FTC862,兼容 64 位 ARMv8 指令集并支持 ARM64 和 ARM32 两种执行模式,支持单精度、双精度浮点运算指令和 ASIMD 处理指令,主频达到 2.5GHz,支持硬件虚拟化,支持商业和工业分级。

本周热门攻略

1
如何通过俄罗斯搜索引擎实现无需登录:如何更好保护隐私与数据安全?

如何通过俄罗斯搜索引擎实现无需登录:如何更好保护隐私与数据安全?

2024/12/25

2
三个母亲共侍一夫的背景故事:多妻制家庭的历史与现实影响

三个母亲共侍一夫的背景故事:多妻制家庭的历史与现实影响

2025/02/01

3
如何通过77777免费观看最新热门电视剧?有哪些值得推荐的剧集?

如何通过77777免费观看最新热门电视剧?有哪些值得推荐的剧集?

2024/12/02

4
《女教师用夹我的动漫》是什么?它究竟为什么如此吸引人?

《女教师用夹我的动漫》是什么?它究竟为什么如此吸引人?

2025/01/13

5
欧美肥大BBBBBBBBB成为主流,为什么这种身材会越来越受欢迎?

欧美肥大BBBBBBBBB成为主流,为什么这种身材会越来越受欢迎?

2025/01/30

6
如何使用“我爱搞G52.ppt网页版链接”提升你的工作效率:PPT制作平台的强大功能与实用技巧

如何使用“我爱搞G52.ppt网页版链接”提升你的工作效率:PPT制作平台的强大功能与实用技巧

2025/01/11

7
为什么我们总是说“好久没C你了,黄”?背后隐藏的情感与联系如何影响我们的生活?

为什么我们总是说“好久没C你了,黄”?背后隐藏的情感与联系如何影响我们的生活?

2025/01/08

8
如何避免使用“靠逼软件”?破解不正当软件带来的风险与隐患

如何避免使用“靠逼软件”?破解不正当软件带来的风险与隐患

2025/01/27

9
如何选择最适合的大叔授课C1V1方式老师,提升学习效率?

如何选择最适合的大叔授课C1V1方式老师,提升学习效率?

2025/01/03

10
群飞范冰冰刘亦菲杨幂baby的成功秘诀是什么?她们各自的特色与魅力有哪些?

群飞范冰冰刘亦菲杨幂baby的成功秘诀是什么?她们各自的特色与魅力有哪些?

2025/01/27