阿里云回应李飞飞团队50美元训练出AI模型

发布时间:2025-02-12 13:28 已有: 人阅读

  s1-32B实为基于阿里云通义千问Qwen2.5-32B-Instruct开源模型的微调产物。

   报道称,阿里云证实,该团队以阿里通义千问Qwen2.5-32B-Instruct开源模型为底座,在16块H100GPU上监督微调26分钟,训练出新模型s1-32B,取得了与OpenAI的o1和DeepSeek的R1等尖端推理模型数学及编码能力相当的效果,甚至在竞赛数学问题上的表现比o1-preview高出27%。

   免责

热门推荐
图文推荐
  • 最便宜的Snapdragon 888智能手机iQOO 7将在发
  • 黑客网站上提供了具有Clubhouse用户详细信息
  • 苹果面临即将到来的高端iPad显示器的供应短缺