中新网广东新闻1月8日电 (记者 方伟彬)阿里云通义智能硬件大展8日至11日在深圳举行,超过1000件AI硬件产品亮相。开幕当天,阿里云发布多模态交互开发套件。

该套件集成了“通义千问”“通义万相”“通义百聆”三款基础大模型,并预置了超过十款应用于生活、工作等场景的Agent和MCP工具。据开发方介绍,它能够处理语音、图像等多种信息,并可调用工具与物理世界进行交互,目标应用于AI眼镜、学习机、陪伴机器人等智能硬件。
根据国际权威市场研究机构Gartner于去年末发布的生成式AI(GenAI)相关报告,阿里云在云基础设施、工程、模型及知识管理应用四个维度均被列入“新兴领导者”(Emerging Leader)象限。报告显示,它是亚太地区唯一在此四项均入选该象限的厂商,并比肩谷歌、OpenAI。

阿里云表示,随着多模态大模型的发展,越来越多的硬件厂商开始借助大模型提升交互体验。然而,仅靠基础大模型难以同时满足硬件设备对成本、响应速度和功能丰富性的需求。此次发布的开发套件,旨在为硬件企业提供一个降低开发门槛的集成平台。
在芯片支持方面,该套件称已适配超过30款主流的ARM、RISC-V和MIPS架构芯片。未来,通义大模型计划与阿里旗下“玄铁”系列RISC-V处理器进行软硬件协同优化,以提升在相关设备上的运行效率。
在模型层面,除通义系列模型外,阿里云还针对硬件交互场景优化了专用模型,支持全双工语音、视频等交互方式。据称,其端到端语音交互延迟可降至约1秒,视频交互延迟约1.5秒。现场也展示了面向智能穿戴、陪伴机器人等领域的解决方案。(完)
京公网安备 11010202009201号] [京ICP备2021034286号-7] [互联网宗教信息服务许可证:京(2022)0000118;京(2022)0000119]