Open AI发布实时响应的GPT-4o AI模型国产手机AI语音助手能赶上

发布时间：2024-05-15 13:34 已有：人阅读

　　称，GPT-4o的情感属性使AI聊天机器人比苹果的Siri更加个性化。Siri给人的感觉就像在和一个机器人对话，但OpenAI的演示清楚地表明，GPT-4o具有“人工情感智能”，能够识别用户的情感并与你的情绪相匹配。

　　数量会受到限制，付费用户消息上限更高。预计新模型各项功能会在未来几周逐步推出。

　　AI语音助手重回焦点

　　OpenAI今天更新后，数年前饱受诟病的AI语音助手又重回人们的视线。过去，人跟AI进行语音对话，基本上都经历三步：用户说话后AI进行语音识别，即音频转文本；大模型拿到这段文本，进行回复，产出文本；文本进行语音合成，变成音频。但上述三个阶段会导致较长的延迟以及信息损耗，无法表达情感等。

　　AI语音助手并不是一个新鲜事物，当前几乎各大手机厂商都在其智能手机中内置了自己的AI语音助手，例如苹果的“Siri”、小米的“小爱同学”、华为的“小艺”、荣耀的“YOYO”、OPPO的“小布”。

　　其中，为人熟知的当属Siri。公开资料显示，Siri于2011年问世，当时被誉为AI技术的突破。然而多年来，Siri在某些方面的表现仍不够理想。例如，Siri的语音识别能力还有待提高，在某些情况下，Siri可能会无法准确地识别用户的语音，导致用户无法得到他们想要的信息或服务；其次，Siri的理解能力也有限，它很难理解对话的上下文，并只能执行简单的任务。

　　Siri的联合创始人、前首席执行官达格·基特劳斯甚至曾直言，在被苹果收购后，Siri可能没有充分发挥其潜力，但语音助手仍将是数字技术的未来。

　　相比之下，Google Assistant和OpenAI的ChatGPT具有先进的自然语言处理能力，这使它们能够理解人类语言的细微差别并作出相应的反应。一旦苹果与OpenAI达成协议，苹果不仅可以缩短产品研发周期，还可以利用OpenAI在人工智能领域的积累迅速提升自家产品的智能化水平，带来更加智能、更加互动的Siri。

　　放眼国内手机厂商，近年来国产手机厂商发布的新手机中，部署在手机“端侧”的AI大模型成为重中之重。其中，OPPO推出安第斯大模型，参数量从70亿到1000亿，可以部署在端侧和云端；vivo蓝心大模型的参数量从10亿到1750亿，可以部署在端侧和云端；小米MiLM大模型参数从13亿到60亿，主要部署在端侧；荣耀“魔法大模型”则有70亿参数，主要部署在端侧。

　　在AI落地应用方面，当前国内的AI技术主要集中在自动摄像头控制、人脸识别和身份验证、语音识别和转录等方面。其中，日常生活里，AI可以对语音助手、自动化办公、智能推荐系统等场景进行大幅优化，增强体验减少冗余工作量；在娱乐方面，AI可以处理复杂图像，如图像增强、分辨率增强、图像修复、色彩校正、消除物体以及智能抠像等等。此外，AI还能够从各种格式的长篇内容提取内容，生成简洁的摘要等等。

　　值得关注的是，当前主流手机厂商推出的大模型应用其实并没有太大差异。从长远发展来看，AI助手可以深度集成于操作系统，拥有理解与预测用户需求的能力，进而为实现无缝衔接的跨应用服务提供支持。

　　在回应几年之后荣耀的AI会带来怎样的想象力或者场景时，荣耀CEO赵明曾在今年3月表示：“我们坚信AI可以改变智能手机的未来，今天即使做得最好的苹果实际上操作也非常不方便，未来用AI势能改造的时候，比如说一个电子设备，我需要它的服务，用眼睛一看，就提供相应服务；或者打一个响指，这个服务就会过来。”

　　当谈及国产手机人工智能助手与GPT-4o之间的差距时，一位从业人士对

Open AI发布实时响应的GPT-4o AI模型 国产手机AI语音助手能赶上

Open AI发布实时响应的GPT-4o AI模型国产手机AI语音助手能赶上