发布时间:2025-01-15 17:34 已有: 人阅读
X1模型具备3个典型特点。首先,可以化繁为简,将复杂问题拆解成多个步骤进行思考和推理。其次可以进行自我反思和验证,第三是由于人类标注数据难度极大,X1模型会根据答案的正确与否进行强化训练。 飞研究院的研究员介绍,X1模型训练和推理需要高强度的交互,并且涉及到跨任务的数据传输。这种新的技术路线带来了任务优化目标的转变,从以往追求高在线响应速度,转变为追求高的离线吞吐任务处理能力。 飞研究院的研究员在1月15日的直播中演示了X1模型如何解答高考题、AIME竞赛题以及高中奥赛题。X1模型不仅准确给出了这些题目的答案,还对解题思路和步骤进行了详细拆解。与通用大模型相比,其解题过程更接近人类的“慢思考”方式,并且用更少的算力,实现了更好的效果,这是推理模型的优势。 飞方面提供的数据,讯飞星火X1在近期参加的小初高、大学、AIME、MATH 500等多项“考试”中,与OpenAI o1 Preview、OpenAI o1、DS-R1-Lite-Preview、QwQ 32B-Preview、k1-math、InternThinker等测试成绩相比分数排名靠前。 飞方面称,在o1发布之后,科大讯飞在一个月之内迅速跑通了关键算法。尽管在全国产算力平台上训练深度推理模型遭遇了诸多挑战,但最终攻克了训练推理强交互、高吞吐推理优化以及国产算子优化等一系列难题。 飞方面称,X1已经在应用领域产生了真实价值。 飞称,随着相关技术融入,AI学习机学习推荐和诊断将变得更加精准,解题思路和知识链条将更加清晰。医疗领域,X1模型策略可使得专科辅助诊断和复杂病历内涵质控的准确率均达90%。 |