马云再次现身引热议

发布时间:2025-02-19 17:02 已有: 人阅读

  阿里巴巴创始人马云再度现身阿里园区。 马云现身蚂蚁集团20周年活动并着重提到了AI发展。他表示,从今天来看,未来20年的AI时代能带来的改变会超出所有人的想象,因为Al会是一个更加伟大的时代。“Al会改变一切,但这不代表,Al能决定一切。技术固然重要,但是未来真正决定胜负的,还是今天我们为这个即将到来的时代做些什么真正有价值而又是与众不同的事。”马云补充称。

   昨天马云出现在阿里园区, 近期,阿里巴巴AI To C业务布局动作不断,而阿里智能信息事业群扛起阿里AI在C端应用的重担。此前,阿里旗下AI应用“通义”并入阿里智能信息事业群,成为与夸克并行发展的两个C端品牌。本月,全球顶尖人工智能科学家、前Salesforce集团副总裁许主洪出任阿里集团副总裁,负责AI To C业务的多模态基础模型及Agents相关基础研究与应用解决方案。

   在基础大模型方面,阿里通义大模型的技术进展引发了市场关注。大年初一,阿里云通义千问旗舰版模型Qwen2.5-Max发布。在Chatbot Arena LLM Leaderboard榜单中,Qwen2.5-Max以1332分位列全球第七名,超越DeepSeek V3、o1-mini和Claude-3.5-Sonnet等模型。同时,Qwen2.5-Max在数学和编程上排名第一,在Hard prompts方面排名第二。

   近期,斯坦福、伯克利的研究团队均采用阿里Qwen2.5大模型进行微调,以低成本复现DeepSeek-R1模型。其中,斯坦福大学教授李飞飞的团队利用阿里巴巴的开源Qwen2.5模型,以不到50美元的云计算费用训练出一种新的推理模型。而加州大学伯克利分校Pan Jiayi团队也以30美元的低成本复刻了DeepSeek R1-Zero的核心功能

   值得一提的是,DeepSeek也选择了通义千问作为基础模型。据悉DeepSeek将DeepSeek-R1蒸馏到6个开源模型中,其中4个都基于Qwen系列。特别是基于Qwen-32B蒸馏的模型,已经实现了对标OpenAI o1-mini的性能。

   DeepSeek还给阿里云带来了云基础设施方面的新机会。阿里云已在其百炼平台全面上线六款全尺寸DeepSeek模型。

   大模型侧或迎来百花齐放

   在常垒资本合伙人石矛看来,这次DeepSeek的突破,更多地是给全球打开了一扇窗。“DeepSeek的爆发,验证了AI原生时代的到来,也就是模型即应用。原来提到模型即应用,很多人觉得是在基模的基础上做一些应用。而DeepSeek证明了一件事,就是接下来可能会有各种各样的模型微调爆发。”

   也就是说,未来的创业者,哪怕是应用创业者也一定会具备模型能力。“通过解决模型技术的某个卡点,做出了在不同场景里面有自己独特效能的模型。就像DeepSeek虽然在推理方面能力不错,甚至可以跟OpenAI O1模型媲美。但在泛化方面依然是OpenAI更全方位的领先。因此,未来可能在模型侧会出现百花齐放的局面。而不是像之前所推断的大模型基模只有少数,这样的寡头垄断时代。”

热门推荐
图文推荐
  • 摩托罗拉下一部Moto G手机可能配备108MP摄像
  • 微软以197亿美元收购Nuance
  • Google正在尝试另一项个人健康记录