科大讯飞发布AIUI多模态交互平台-拓冰建站

科大讯飞在2026年7月2日的智能交互生态发布会上正式发布了AIUI多模态交互平台并同步开放了AIUI多语种交互平台及机器人超脑平台的升级版本以下是具体信息AIUI多模态交互平台升级多模态融合平台融合了语音、视觉、图像生成等能力使智能硬件不仅能听懂语音还能理解图像、感知场景实现更自然的交互。例如用户可通过语音描述画面平台实时生成对应图像或通过图像输入与语音交互联动完成更复杂的任务。语音交互优化在低算力设备上实现稳定运行唤醒率提升至97%多模态降噪能力增强全双工交互效果显著提升聆听误响应降低95%、播报误打断降低93%、交互抢答率降低85%。声音表达升级开放100超拟人音色支持轻笑、停顿、喷嚏等副语言表达结合表情动作生成能力实现语音、情绪与视觉表达的协同让智能设备更具“人格化”交互体验。AIUI多语种交互平台开放覆盖语种支持40语种包括英语、法语、西班牙语、德语、韩语等主流语言以及哈萨克语、乌尔都语、泰米尔语等区域语言英语唤醒率达97%小语种唤醒率95%语音识别端到端全场景准确率达95%。一站式交互能力打通聊天、设备控制、知识问答、多语种翻译、多模态交互五大核心场景支持免切多语种对话、地域文化适配、多语种地道发音人以及通过语音或图像输入完成多模态交互。全球部署与合规在新加坡、东南亚、中东、欧洲、北美等区域完成服务节点部署支持公有云与私有化部署适配GDPR、CCPA、PDPA等不同地区的数据合规要求提供“按台付费”模式及测试资源、开发支持等服务。机器人超脑平台升级多模态感知与交互融合全景摄像头与环形麦克风阵列实现360°全向拾音与视听融合感知能在多人高噪环境下精准锁定对话人。针对“鸡尾酒会”等复杂场景整合人脸识别、人体追踪、手势识别等多模态能力使机器人能自主判断交互时机。行业方案完善围绕陪伴机器人、扫地机器人、康养机器人、四足机器人和人形机器人推出针对性行业方案如陪伴机器人通过专属聊天大模型、教育陪伴技能、情绪识别和高情商对话实现更有温度的陪伴体验扫地机器人融合语音、视觉和人体关键点识别实现“说哪扫哪”“指哪扫哪”和家庭物体识别。硬件集成优化推出麦克风阵列封装和多模态一体机将语音、视觉、感知及交互能力一体化集成帮助开发者快速完成能力接入、部署验证与产品落地缩短机器人开发周期。此次升级标志着科大讯飞在智能交互领域进一步拓展通过多模态交互、全球化部署和机器人场景落地构建起新一代智能交互基础设施为智能硬件和机器人产业的发展提供了更强大的技术支持。

科大讯飞发布AIUI多模态交互平台

相关新闻

工控CTF流量分析实战：Wireshark定位异常与Base64解码技巧

三星固件下载终极指南：Bifrost如何让官方固件获取变得简单快速

FinalBurn Neo：打造完美复古街机游戏体验的终极指南

最新新闻

[ACTF2020 新生赛]Exec 思路及解法

Nigate：重新定义macOS NTFS读写体验的架构革命

2026年苍蓝前线礼包码解析与海战资源快速提升战力体验

switch语句

XGBoost 2.0.3 实战：Python 调参避坑 5 要点，AUC 提升 0.15

Spring JDBC Ultra：凭什么敢说自己是 MyBatis 终结者？

日新闻

中文大模型选型不是比参数，而是做工程化决策

STM32与LENA-R8构建全球定位与通信嵌入式系统

含金量高的EMBA｜2026国内及境外中英双语EMBA综合实力TOP5榜单

周新闻

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

GXDE OS下Wayland兼容性实战：从deepin-mutter原理到VMware Tools修复

企业AI落地困境与AgenticOps实践指南

月新闻

[C++]内存管理：串顺序存储的内存回收

移动端游戏功耗测试实战：电流、功率、亮度和场景对比

足球口袋教练 HarmonyOS 离线应用实战（03/20）：ArkUI 首页仪表盘搭建