科大讯飞:已关注DeepSeek - V3混合专家架构技术进展,并将持续推动算法迭代

发布时间:2025-01-28 15:02 已有: 人阅读

  有投资者在互动平台向科大讯飞提问:DeepSeek - V3 采用了创新的混合专家架构,总参数达到 6710 亿,成为目前最大的开源模型 。但令人惊叹的是,在实际运行中,每个 token 仅激活 370 亿参数,这一巧妙的设计大大降低了计算资源的需求,提高了资源利用效率。这种架构创新,就好比为模型打造了一个智能的资源分配系统,请问讯飞有这样的技术吗?

   公司回答表示:科大讯飞已经关注到上述技术进展,我们会持续推动算法迭代,让自主可控的星火大模型在自主可控的算力平台上持续进化提升。

热门推荐
图文推荐
  • 摩托罗拉下一部Moto G手机可能配备108MP摄像
  • 微软以197亿美元收购Nuance
  • Google正在尝试另一项个人健康记录