“新闻主播的语速通常是每分钟两百多不到三百字 , 手语表达达不到那么快的语速 , 但必须要能在正常合理的时间内把主要意思表达出来 。 这样 , 由语音播报转手语时 , 不能完完整整的逐字逐句的去翻译 , 需要动态去精简一些内容 。 ”张鹏表示 , 这是一个难题 , 需要算法反复地去学习、调优 。
为构建能够理解、翻译语音和手语的智能数字大脑 , “冬奥手语播报数字人”系统以超大规模预训练模型为核心技术 , 通过语义蒸馏及手语翻译快编模型 , 实现新闻播报语音蒸馏成语义高度接近的手语文字 , 并翻译成符合手语习惯的语序 。 最终 , 手语数字脑可以通过计算机模仿听障人士的大脑 , 进行手语播报驱动 。
此外 , 要让数字人展现出高精度、高自然度的人物形象和手语动作姿态 , 也是一件难事 。
为此 , 研发团队自主搭建了多模态肢体动作、表情、手指同步采集系统 。 通过采集多模态动作捕捉数据 , 运用跨模态拟人生成算法对超写实数字人进行自然、流畅的驱动和渲染 , 实现对文本内容的手语播报 。
其中 , 通过肌肉绑定技术驱动实现面部采集 , 结合业内领先的语音识别及高清视频合成等技术 , 呈现给听障人群亲切自然的冬奥手语播报服务 。
文章图片
“冬奥手语播报数字人” 。 项目研发方供图
与“虚拟AI主播”有何不同?
新亮相的“冬奥手语播报数字人”与常见的“AI虚拟主播”有何不同?
中科院计算机所所务委员、泛在中心主任陈益强向澎湃新闻采访人员表示 , “虚拟主播”与“冬奥手语播报数字人” , 身上都用到了虚拟人相关的技术 , 都追求形象的流畅性 。
双方最大的区别在于: 一般而言 , AI主播动作比较自然即可;手语播报数字人则需要通过手势动作来实现表意的准确性和可懂度 。
另外 , 传统的AI模型主要是进行语音播报 , 基本不存在可懂度的问题;但AI手语人存在手语打得是否可懂的问题 , 它需要用丰富的、夸张的表情来提高手语的可懂度 。
张鹏表示 , 手语播报数字人的应用场景广泛 , 可以为新闻媒体提供全流程智能化的数字人手语生成服务 , 也可将声音广播内容转化为手语 , 以便听障人士可及时获取冬奥会赛事相关信息 。
此外 , 推广手语播报数字人可加速国家通用手语推广落地 , 推动国家通用手语标准普及 , 为残疾人平等参与社会生活创造无障碍环境 。
以上关于本文的内容,仅作参考!温馨提示:如遇健康、疾病相关的问题,请您及时就医或请专业人士给予相关指导!
「四川龙网」www.sichuanlong.com小编还为您精选了以下内容,希望对您有所帮助:- 运动员|首都体育学院和汉朗联合自研越野滑雪裁判辅助系统
- 中国队|54岁“老将”获年轻灵敏“触感”智能化系统全方位守护首体
- 指挥部|揭秘冬奥有线电视专网前端系统,实时监测保障专网运转
- 见证中国队冬奥首金!智能化系统全方位守护首都体育馆
- 数据系统|支付宝公布中国女足夺冠奖金:1000万奖励球员,300万奖励教练
- 足球系统不改,国足永无出头之日
- 哈兰德|自动失格?大鳄直言巴萨已无缘哈兰德 免签大将却反成皇马利好
- 自动失格?大鳄直言巴萨已无缘哈兰德免签大将却反成皇马利好
- 巴塞罗那|自动失格?大鳄直言巴萨已无缘哈兰德 免签大将却反成皇马利好
- 自动失格?大鳄直言巴萨已无缘哈兰德免签大将却反成皇马利好