杭州城市大脑申请基于评分机制的大模型训练专利,提高大模型训练效果

发布时间:2025-01-30 19:05 已有: 人阅读

  国家知识产权局信息显示,杭州城市大脑有限公司申请一项名为“基于评分机制的大模型训练方法、模型、系统及设备”的专利,公开号CN 119357675 A,申请日期为2024年12月。

   专利摘要显示,本发明提供一种基于评分机制的大模型训练方法、模型、系统及设备,该方法包括获取目标领域相关数据以构建初步任务集。将初步任务集内的每一数据按照预设的微调指令格式进行调整以构建初始微调指令数据。将构建初始微调指令数据后的初步任务集输入自监督学习模型内以生成符合微调指令格式的新任务集Task。将新任务集Task输入通用Llama模型,基于每一任务下的新微调指令数据集获取相应任务主题的目标领域数据集;计算每一新微调指令数据和相应目标领域数据集之间的相似度得分并进行筛选以形成每一任务下的精调指令数据集。将精调指令数据集输入至通用Llama模型内进行精调训练以形成基于Llama的目标领域相关数据模型。

   天眼查资料显示,杭州城市大脑有限公司,成立于2019年,位于杭州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本10000万人民币,实缴资本9100万人民币。通过天眼查大数据分析,杭州城市大脑有限公司共对外投资了7家企业,参与招投标项目386次,知识产权方面有商标信息22条,专利信息34条,此外企业还拥有行政许可2个。

热门推荐
图文推荐
  • 罗技(Logitech)停止生产Harmony遥控器
  • 据报道,小米正在使用Snapdragon 8xx SoC开发
  • 小米MIXFOLD液态镜头有什么用 小米MIXFOLD液