元宇宙概念大火,网络媒体的发展也绕不开这一话题。在11月24日上午的2021中国网络媒体论坛技术论坛上,华为云首席战略官黄璟对一些关键技术进行了阐释,并介绍了华为在虚拟数字世界基础设施方面的技术探索。
在赋能业界产生更好的媒体内上,黄璟表示,首先是要在全球构建一张低时延、体验好的媒体网络来作为基础,并在非常多的技术、非常多的能力赋能媒体创作过程;最终在媒体高效生产之后,将媒体的体验逐渐落到各个场景里。
据了解,2020年全球网络的流量里面73%以上是视频,而华为通过在云上的Spark-RTC的音视频实时服务,已经可以做到全球覆盖同时实现时延在200毫秒以内。在现场,他展示了华为在不久前做的一个全球云上合奏,请世界各地的音乐家在不同地方进行云上表演,时延几乎很难在现场进行分辨。
在目前火爆的元宇宙概念中,黄璟也提到了其中的多项关键技术,可以贯穿到媒体引擎的每个环节,包括:图形处理、音频处理、媒体渲染、媒体转码、协议传输、媒体AI等。比如:AI在图形处理中,可以实现智能识别目标,实现全程实时遮挡;AI 音频处理中,可以实现智能音效,支持多音色AI配音能力,将文字合成为可与人声自然表达媲美的朗读语音。媒体AI中的数字人则可以实现更多的能力,基于预训练语言大模型、机器翻译算法、多模态数字人动作生成算法,同时融合手语语言学专家知识,可以把语音和文字,实时转换成为连贯自然的手语身体姿态、手势动作和表情。例如全球有4.66亿人患有听力障碍,云上实时自动翻译成手语视频的能力,可以让听障人士共享智能世界的美好。
花粉社群VIP加油站
猜你喜欢