腾讯云发布音视频 AI 品牌 WAND:内置六大自研模型与60+项AI能力
2026年6月5日 16:31·AIBase
6月5日,在2026AI产业应用大会上,腾讯云音视频正式发布AI原生能力底座WAND。 依托超过20年的技术积累,腾讯云音视频此次从底层模型、媒体能力到接入方式进行全面升级,音视频媒体AI能力将以Agent-Native模式向行业开放,实现了从提供单点媒体处理能力向面向AI应用与Agent的原生媒体底座的战略升级

WAND架构由模型引擎、能力层和场景方案三层构成,包含编解码、增强、擦除、生成、理解、音频六大自研媒体专用模型,补充了主流生成式大模型在媒体生产流程中的不足

WAND能力架构图
在真实业务中,WAND展现出高适配与高效率优势
此外,面对高并发、极低延迟要求的赛事直播场景,WAND通过自研模型协同调度,将识别、生成、合成、编码整合为全自动化流程,相较传统方案可节省超50%的码率,已累计支撑数千场全球顶级赛事
作为连续11次保持中国及出海市场份额第一的领跑者,腾讯云音视频此举正加速音视频能力成为可被Agent统一调度的生产级工具,全面赋能AI Agent时代的视听应用创新

