在大模型之后,智能体成为AI技术发展下一段的关注点。2025年被认为是智能体元年,近期发布的多款智能穿戴设备、AI PC都加入了“智能体”的概念。特别是耳机的市场,已有多款产品发布,例如科大讯飞在近期发布的TWS耳机。随着智能体的到来,AI耳机行业进入新的发展阶段。
基础NLP大模型能力差距缩小,2037年65%应用将为智能体驱动
当前,国内各企业正在积极展开AI大模型的应用,包括其相关技术落地的场景和方法。如果大模型无法落地,即使我们有再多的算力,再好的模型,其实它本身是带来不了价值。在IDC Directions:ICT市场趋势论坛上,IDC中国副总裁钟振山表示,我们可以看到的是大模型的市场或者是基础模型的市场,正在步入一个整合期。
IDC预测,到2028年,在中国市场超过80%的基于大模型的应用场景将会使用不超过8家的大模型厂商。也就是说整体来看,大家对于基础模型自身来源于哪家厂商的关注度会越来越低,更多的是如何让这项技术,如何让大模型、投资为企业产生实际的价值。
在IDC针对通义千问2.0、文心一言4.0等中国大模型市场主流产品评估中看到,从2024年初到2024年底,每一个大语言模型的基础理解能力都在不断地提升,2024年6月的平均得分率70.8%,到2024年底这个数值上升到78.1%。但一个更有趣的现象是,能力之间的差距在不断地缩小,标准差从3.0下降到1.0。这也意味着基础模型自身的能力在未来不会有非常大的差距。
与此同时,AI智能体(AI Agent)随着大模型能力的提升也展现出更加强大的功能与更广泛的应用前景。
AI智能体是一种软件组件,具备代表(代理)用户或系统执行任务的自主能力。通过感知、推理和行动循环设定目标、做出决策并采取行动。
IDC中国副总裁兼首席分析师武连峰表示,企业智能体演化路径分为:助理 Assistants、顾问 Advisors 、智能体 Agents 。IDC预计到2037年,大约是65%的应用都将是智能体应用。
2025年被广泛认为是AI智能体的爆发元年。尽管如此,AI智能体仍处于相对早期的开发阶段,许多技术挑战和应用场景尚待进一步探索和完善。在这个背景下,产业链上的各家企业正在加速布局,力求在这一波技术浪潮中占据有利位置。
AI智能体的产业链可以分为上游基础层、中游技术转化层、下游应用层。上游基础层包括AI算力基础(AI芯片、智能服务器等)、AI算法、数据资源等。其发展的关键在于通过更智能、更高性能芯片实现算力突破,通过优化深度学习算法等实现AI算法突破,通过不断收集数据实现资源突破。
在下游应用层面上,AI智能体的落地场景广泛涵盖了包括游戏、金融、工业、消费、交通等多个关键领域。特别值得注意的是,在“AI+消费”这一新兴领域,AI智能体的应用已经初见成效,尤其是在可穿戴设备细分市场中。电子发烧友网观察到,随着消费者对个性化和智能化产品需求的增长,AI耳机作为AI技术的一个重要载体,正逐渐成为市场的新宠。
AI耳机竞争进入智能体时代,AI翻译成为聚焦点
当前,国内AI智能体耳机的主要玩家分为三大类,第一类是智能手机厂商,第二类是传统智能音频品牌,第三类是互联网厂商以及数码科技厂商。上述企业中,已有多家产品搭载AI大模型,引入了智能体概念,并增加了相对应的功能,具体包括华为FreeBuds Pro4、讯飞AI会议耳机、字节跳动Ola Friend智能体耳机、WISHEE AI耳机等。
那么,加入智能体的耳机会有什么不同,打开了哪些AI应用场景?
2024年10月,字节跳动豆包发布了首款AI智能体耳机Ola Friend,接入豆包大模型。在AI应用场景方面,通过豆包大模型与APP深度结合,通过关键词唤醒AI耳机,就能进行旅行导航、英语学习等功能。
今年5月,Ola Friend官方宣布,Ola Friend AI耳机智能升级,带来了英语私教朋友Owen功能,并实现语音端到端大模型全新升级,还拥有豆包唤醒词简化、嘈杂环境音量自适应、轻声收音等特点。
同样是在今年5月,科大讯飞旗下未来智能正式发布了viaim大脑,具备端到端的智能感知处理能力、智能Agent的协同推理能力、实时多模态能力、数据安全和隐私保护能力四大核心模块。未来智能还发布了基于viaim大脑的两款讯飞AI会议耳机,分别是讯飞AI会议耳机Pro 3、讯飞开放式AI耳机Air 2。
那么在AI会议场景,智能体耳机能有哪些明显的特点呢?
上述两款耳机支持会议同传、翻译等功能。传统现场同传需要很多准备,未来智能提供了一套快速同传的方案:只需打开viaim APP,扫描会场二维码,即可通过佩戴iFLYBUDS听到同传音频,手机上可以同步出现字幕。最多一次性可以接入300人。
官方介绍,viaim AI助理能够自动分析记录的内容,提供主动式助理服务;还能根据用户的职业特点生成个性化的摘要;此外还可以基于单条/多条记录,准确检索个人关注要点并支持记录外的拓展问询,深度挖掘记录潜藏价值,支持AI深度问询。
当前,AI翻译、AI录音、AI同传等场景已成为办公场景中的聚焦点,尤其是在跨语言沟通、国际会议、远程协作等实际应用场景中,AI翻译通过语音识别、自然语言处理和实时转换等技术,显著扩大了使用场景。
与此同时,AI耳机作为智能穿戴设备的重要分支,正逐步成为AI翻译技术落地的重要载体。它不仅具备传统音频设备的便携性和易用性,还融合了AI的强大能力。
可以看到,AI耳机和智能手表一样,其独立属性越来越强。未来智能CTO王松曾表示,真正的智能耳机必须是一个可独立联网和独立运算的设备,即便脱离了手机也能够使用。
但目前来看,AI耳机离成为真正的独立设备还有一段距离,这是因为AI耳机内部空间有限、承载的算力有限,还需要手机作为辅助,提供额外的功能。
在现阶段,作为智能体落地的最佳场景之一,AI耳机在AI技术的加持下,打开了更大的应用场景。正如前文提到的,AI智能体的发展路径需要经过助理、顾问、智能体的三个递进的阶段。目前,大多数AI耳机乃至其他AI硬件已基本具备“助理”级能力,初步实现了对用户的辅助功能;而未来的演进方向,则是向更高阶的“智能体”阶段迈进,实现更自主、更智能的交互与决策能力。