阿里云确认：李飞飞团队 s1 模型基于 Qwen2.5-32B-Instruct 模型训练-周佳软件园

本站 2 月 6 日消息，今日，李飞飞研究团队以不到 50 美元的云计算费用训练了一个名叫 s1 的人工智能推理模型，该模型在数学和编码能力测试中的表现与 OpenAI 的 o1 和 DeepSeek 的 R1 等尖端推理模型类似。

不过很快，该 s1 模型被指“并非从零开始训练”，其基座模型为“阿里通义千问（Qwen）模型”。对此，新浪科技向阿里云方面求证，阿里云方面确认了这一消息。

阿里云回应称：“他们以阿里通义千问 Qwen2.5-32B-Instruct 开源模型为底座，在 16 块 H100 GPU 上监督微调 26 分钟，训练出新模型 s1-32B，取得了与 OpenAI 的 o1 和 DeepSeek 的 R1 等尖端推理模型数学及编码能力相当的效果，甚至在竞赛数学问题上的表现比 o1-preview 高出 27%。”

据本站此前报道，s1 团队透露他们通过“蒸馏”技术创建了该人工智能模型，该技术旨在通过训练模型来学习另一个人工智能模型的答案，从而提取其“推理”能力。

s1 的论文表明，可以使用一种称为监督微调（SFT）的方法，可以使用相对较小的数据集来蒸馏推理模型。在 SFT 中，人工智能模型会被明确指示在数据集中模仿某些行为。SFT 比 DeepSeek 用于训练其 R1 模型的大规模强化学习方法更具成本效益。

s1 基于阿里巴巴旗下中国人工智能实验室 Qwen 提供的一款小型、现成的免费人工智能模型。为了训练 s1，研究人员创建了一个仅包含 1000 个精心策划的问题的数据集，以及这些问题的答案，以及谷歌 Gemini 2.0 Flash Thinking Experimental 给出的每个答案背后的“思考”过程。

阿里云确认：李飞飞团队 s1 模型基于 Qwen2.5-32B-Instruct 模型训练

1

如何通过77777免费观看最新热门电视剧？有哪些值得推荐的剧集？

如何通过77777免费观看最新热门电视剧？有哪些值得推荐的剧集？
2024/12/02

2

爽…躁多水…快…深女女表情包：年轻人社交互动中的幽默与情感表达新方式

爽…躁多水…快…深女女表情包：年轻人社交互动中的幽默与情感表达新方式
2025/02/02

3

欧洲尺码与日本尺码专线对照，为何流畅不卡顿？

欧洲尺码与日本尺码专线对照，为何流畅不卡顿？
2024/12/10

4

18网站为何如此受欢迎？了解其多样化功能与未来发展趋势：你了解这种网站的潜力吗？

18网站为何如此受欢迎？了解其多样化功能与未来发展趋势：你了解这种网站的潜力吗？
2025/01/29

5

为什么选择国产精品999品牌的产品？揭秘国产商品的高性价比与技术创新

为什么选择国产精品999品牌的产品？揭秘国产商品的高性价比与技术创新
2025/01/30

6

虫虫漫画在线阅读页面弹窗-虫虫漫画登录页面免费弹窗

虫虫漫画在线阅读页面弹窗-虫虫漫画登录页面免费弹窗
2024/12/15

7

欧美无人区码AAAAA的作用和发展趋势，如何提高物流行业效率并保证数据安全？

欧美无人区码AAAAA的作用和发展趋势，如何提高物流行业效率并保证数据安全？
2025/01/05

8

如何理解NP文〈重口〉H的创作模式与社会争议？其对读者和社会的影响如何评估？

如何理解NP文〈重口〉H的创作模式与社会争议？其对读者和社会的影响如何评估？
2024/11/20

9

如何通过俄罗斯搜索引擎实现无需登录：如何更好保护隐私与数据安全？

如何通过俄罗斯搜索引擎实现无需登录：如何更好保护隐私与数据安全？
2024/12/25

10

混合交换5：如何提升网络效率与稳定性？未来应用前景如何？

混合交换5：如何提升网络效率与稳定性？未来应用前景如何？
2025/01/03

如何通过77777免费观看最新热门电视剧？有哪些值得推荐的剧集？

欧洲尺码与日本尺码专线对照，为何流畅不卡顿？

为什么宝宝睡前C1V1好满会影响宝宝的睡眠质量？如何改善宝宝睡眠？

为什么我们总是说“好久没C你了，黄”？背后隐藏的情感与联系如何影响我们的生活？

如何避免“被C上瘾(H)”带来的生活困扰？有哪些有效的方法？

一夜未拔h1v1会对身体造成什么影响？长期这样做是否有害？

爽…躁多水…快…深女女表情包：年轻人社交互动中的幽默与情感表达新方式

18岁女性流白浆的不同类型及其健康隐患，如何判断是否需要就医？

91国产白浆洗澡背后隐藏的疑问：吊死重是什么？有何风险？

一夜未拔h1v风险大吗？如何有效预防一夜未拔后的h1v感染？