腾讯云发布音视频 AI 品牌 WAND：内置六大自研模型与60+项AI能力

2026年6月5日 16:31·AIBase

6月5日，在2026AI产业应用大会上，腾讯云音视频正式发布AI原生能力底座WAND。依托超过20年的技术积累，腾讯云音视频此次从底层模型、媒体能力到接入方式进行全面升级，音视频媒体AI能力将以Agent-Native模式向行业开放，实现了从提供单点媒体处理能力向面向AI应用与Agent的原生媒体底座的战略升级。

WAND架构由模型引擎、能力层和场景方案三层构成，包含编解码、增强、擦除、生成、理解、音频六大自研媒体专用模型，补充了主流生成式大模型在媒体生产流程中的不足。能力层则将60+项媒体AI能力按生成、理解、处理、编码重新组织，通过API、Agent预编排工作流（Agentic Workflow）和Skills三种模式开放，支持Agent端到端自动跑通整条链路，无需切换工具。

WAND能力架构图

在真实业务中，WAND展现出高适配与高效率优势。在电商应用中，WAND生成模型可针对不同品类定制处理策略，有效降低报错率并提升图片可用率。在短漫剧创作中，WAND将剧本生成、角色一致性保持等环节串联为自动链路，使平均生产效率提升90%，已服务国内80%以上的头部漫剧平台，其AI增强与无痕擦除技术更是双双荣获NAB Show2026年度产品奖。

此外，面对高并发、极低延迟要求的赛事直播场景，WAND通过自研模型协同调度，将识别、生成、合成、编码整合为全自动化流程，相较传统方案可节省超50%的码率，已累计支撑数千场全球顶级赛事。

作为连续11次保持中国及出海市场份额第一的领跑者，腾讯云音视频此举正加速音视频能力成为可被Agent统一调度的生产级工具，全面赋能AI Agent时代的视听应用创新。