科大讯飞首推深度推理模型 深度思考成为模型发展决胜关键?

发布时间:2025-01-15 17:34 已有: 人阅读

  X1模型具备3个典型特点。首先,可以化繁为简,将复杂问题拆解成多个步骤进行思考和推理。其次可以进行自我反思和验证,第三是由于人类标注数据难度极大,X1模型会根据答案的正确与否进行强化训练。

  飞研究院的研究员介绍,X1模型训练和推理需要高强度的交互,并且涉及到跨任务的数据传输。这种新的技术路线带来了任务优化目标的转变,从以往追求高在线响应速度,转变为追求高的离线吞吐任务处理能力。

  飞研究院的研究员在1月15日的直播中演示了X1模型如何解答高考题、AIME竞赛题以及高中奥赛题。X1模型不仅准确给出了这些题目的答案,还对解题思路和步骤进行了详细拆解。与通用大模型相比,其解题过程更接近人类的“慢思考”方式,并且用更少的算力,实现了更好的效果,这是推理模型的优势。

  飞方面提供的数据,讯飞星火X1在近期参加的小初高、大学、AIME、MATH 500等多项“考试”中,与OpenAI o1 Preview、OpenAI o1、DS-R1-Lite-Preview、QwQ 32B-Preview、k1-math、InternThinker等测试成绩相比分数排名靠前。

  飞方面称,在o1发布之后,科大讯飞在一个月之内迅速跑通了关键算法。尽管在全国产算力平台上训练深度推理模型遭遇了诸多挑战,但最终攻克了训练推理强交互、高吞吐推理优化以及国产算子优化等一系列难题。

  飞方面称,X1已经在应用领域产生了真实价值。

  飞称,随着相关技术融入,AI学习机学习推荐和诊断将变得更加精准,解题思路和知识链条将更加清晰。医疗领域,X1模型策略可使得专科辅助诊断和复杂病历内涵质控的准确率均达90%。

热门推荐
图文推荐
  • 摩托罗拉下一部Moto G手机可能配备108MP摄像
  • 微软以197亿美元收购Nuance
  • Google正在尝试另一项个人健康记录