发布时间:2025-02-02 16:23 已有: 人阅读
DeepSeek-R1发布,在数学、代码、自然语言推理等任务上,宣称性能对标OpenAI o1正式版。而它的蒸馏小模型,也超越了OpenAI o1-mini。此外,在开源和闭源路线仍有争议的眼下,DeepSeek宣布R1开源,允许用户进行“模型蒸馏”,以促进技术共享。 DeepSeek-R1是一枚重磅炸弹,在性能上为全球业界瞩目之外,更重要的是——它的成本相比竞品大大降低。一周之后,DeepSeek趁热打铁,又推出开源多模态模型,被认为在文生图方面超越OpenAI的DALL-E3。至此,外界对DeepSeek的讨论关注,达到高潮。 与先进大模型保持相近的性能,并在训练成本、运行成本和服务定价上全面大幅下降,这是DeepSeek震撼科技圈的原因。在这样的现象级产品出现之前,过去两年多时间,由于AI业界对高性能显卡的追逐,英伟达被一路推上王座。无论在资本市场还是产业链,这个逻辑似乎已经确立,没料到DeepSeek横空出世,硬生生搅了局。 不过,这场冲击波能持续多久,还是个未知数。DeepSeek的势头固然很猛,但是否弥合了国产大模型与国际先进水平之前的技术代差,正在引发热议。另外,DeepSeek通过算法优化提升效率,是否就意味着对算力需求的明显减弱,下结论也太早。 喧闹之外,降温观察逐渐成为一种声音。“针对最近几天事情的发展,个人觉得还是冷静看待,肯定其取得的成就,但也要避免情绪化。”上述投资人士如此说道。 |