南威软件:通过模型蒸馏技术将DeepSeek大模型知识迁移至轻量化小模型

发布时间:2025-02-12 06:49 已有: 人阅读

  有投资者在互动平台向南威软件提问:deepseek横空出世,请问公司有没有在ai大模型上参考借鉴deepseek的打算,请简述贵公司与deepseek的联系。

   公司回答表示:公司通过模型蒸馏技术,将DeepSeek大模型的知识高效地迁移到轻量化的小模型中,从而在保持高性能的同时,降低计算资源的需求。这种技术使得公司能够在资源受限的环境中,如边缘设备和移动终端上,高效部署人工智能模型,进一步提升在政务服务、自动化审批、数据分析、环境监测、城市治理等领域的智能化水平。目前,公司推出的深海大模型和白泽政务大模型均已接入DeepSeek 相关版本并进行私有化部署,并通过深度融合DeepSeek-R1和DeepSeek-V3等先进模型,利用模型蒸馏技术优化模型性能。

热门推荐
  • 微软推出Windows Terminal 1.0开源 微软推出Windows Terminal 1.0开源 Windows Terminal是一个开源的、基于选项卡UI风格的终端应用程序,最初发布于微软的Build 2019活动。所谓基于选项卡的UI,就是你可以在一个选项卡中打……[详细]
图文推荐
  • 苹果将??于本月晚些时候推出首款采用Mini-LE
  • iPad 2021,我们所知道的一切
  • 尽管Mini-LED面板供应受限,本月仍将推出新的