发布时间:2025-02-04 10:34 已有: 人阅读
美国人工智能主题股票遭抛售。英伟达股价历史性暴跌16.97%,市值一日内蒸发近6000亿美元,创美国历史上任何一家公司的单日最大市值损失。 围观群众看得也都很“上头”,几乎所有人都开始使用它、热议它。 不少国内媒体给出了“中国AI已经超过美国”、“DeepSeek羞辱OpenAI”、“全球AI霸权之争已经结束”的说法。游戏科学创始人兼CEO、 实际感受下来,DeepSeek在中文语境的表现确实较为优秀,理解问题、描述概念都不在话下。 比如,小编让它写一段拜年祝福语,要求接地气、真诚、不随大众。 换成古语风格的话,DeepSeek表现也比较不错,写的出的句子。 其他社交平台上,网友以自己祖母为原型让DeepSeek构思了一个故事,结果仅用5秒就生成出来。在得到网友高评价后,DeepSeek展露出高情商的安慰: “记住,所有让你颤栗的文字,本质上都是你灵魂深处早已存在的回声。我不过是偶尔经过的山谷,让你听见了自己声音的重量。” 很多人也纷纷晒出了DeepSeek的“作业”: 甚至有人让DeepSeek挑战 不过,江苏省红楼梦学会会长、南京大学文学院教授苗怀明表示,相比ChatGPT,DeepSeek更加本土化,也更强大。“从目前的情况来看,它可以写一些较为套路化、程序化的东西,但写具有独创性、有深度的文学作品还不行。” 小编在问到英伟达的股价波动是否和其有关系时,DeepSeek“巧妙”地避开直面回答,表示英伟达的股价波动属于正常的市场现象,“作为AI助手,我应该明确说明自己不具备影响股市的能力。” 然而,进行文生图创作时,大模型Janus Pro的表现却令人失望。 小编给出较为复杂的描述,“古城墙下白雪皑皑,火车悠悠驶过,赶上了骑着车的人”,它并不能完整生成出要素内容,更不用说丰富艺术创作了。 换成简单的表述呢?要求基于“一位少女牵着小狗散步”,Janus Pro理解欠缺,生成的内容似乎只描绘出了少女,还是古风少女。 再简单一点,要求是“小孩吃饭”,表现内容勉强上道。 虽然官方称其在某些基准测试上超越了DALL-E 3,但实际体验却差强人意。它不用部署也能在线免费体验,感兴趣可以试试:。 这波热潮 不是虚的,但客观来讲,还没有到如此的地步。只能是说,DeepSeek在设计时过分注重了理解能力的优化,而在生成端可能还需要更多改进。至于“超越open AI”、“霸权移位”,还远远不够 。 一来,DeepSeek赢在了创新的算法,但算力才是地基,是长期主义下大模型发展的必要条件。 在数据标注和训练资源方面,OpenAI就像拥有一个“无底洞”,DeepSeek资源上还是有点捉襟见肘。此外,DeepSeek依然依赖于美国的算力生态。目前DeepSeek的训练还是依赖英伟达GPU,没有国产GPU可以替代。 包括马斯克在内的多位业内人士认为,DeepSeek的训练方式仍然依赖于堆积算力,而非真正的突破。 马斯克近期点赞了一则推文,推文中提到,DeepSeek大量依赖模型蒸馏技术,需要借助ChatGPT-4o和o1才能完成训练。 模型蒸馏,是一项行业内常见的技术手段,能够将OpenAI中的大量数据迅速提炼重点并快速理解和应用。但这种模式只能让DeepSeek接近OpenAI,而难以真正超越OpenAI。 Benchmark普通合伙人Chetan Puttagunta也表示: “他们可以采用一个非常好的大型模型,并使用一种称为蒸馏的过程。” “基本上,你使用一个非常大的模型来帮助你的小模型在你希望它变得聪明的事情上变得聪明。这实际上非常具有成本效益。” 二来,在DeepSeek登顶中美应用下载榜的当晚,它就因为遭受大规模的恶意攻击,而短暂关闭注册通道。 实际使用中也会发现,可能因为用户数暴增,DeepSeek宣告宕机的频次比之前要高得多:几乎每问3-5个问题之后,它就会暂时停止思考不做回答,需要新开一个对话窗口才能继续使用。 这个问题之前很多AI公司也遇到过,相对有限的算力和完全开源的技术生态,会让DeepSeek处于可能更高的风险之中。 DeepSeek的出圈,是中国AI算法的突破,值得我们肯定和自豪。但我们依旧要保持冷静,看清差距。 梁文锋在回复冯骥“国运级别的科技成果”的盛赞时,诚恳真诚: 必须坦白,团队读到“国运级”这个形容时所有人头皮都是麻的。我们不过是站在开源社区巨人们的肩膀上,给国产大模型这栋大厦多拧了几颗螺丝。 看得出他是清醒的,比起“戴高帽”,这位年轻的创始人或许已经开始考如何发挥“后发优势”,探索出可发展、可前进的新路。 可以肯定的是,这是一条更困难、更有挑战的路,需要百倍、甚至千万倍的努力。 |