英国科研团队建立新数据集可用于开发行为生物识别和语音合成系统

2023-12-26  英国 来源:其他 作者:戴吉 领域:生物

关键词:

据Biometric官网12月21日消息,英国格拉斯哥大学科研团队开发出一个基于射频、视觉、文本、音频、激光和唇部特征点信息的新型多模态数据集RVTALL,可用于开发语音识别系统。该团队要求20名参与者读5个元音、15个单词和16个句子,并利用无线电超宽带和调频连续波雷达和带有高速摄像头的激光散斑检测系统记录了嘴唇和声音的标志,获得了约400分钟的带注释的语音配置文件。经验证该数据集具有研究唇语和多模态语音识别的潜力。该研究有助于非接触式传感的发展,未来或可实现利用智能手机等语音控制设备读取用户唇语、提高嘈杂环境中通话质量等功能。相关研究成果均发表于《自然》期刊。

消息来源:https://www.biometricupdate.com/202312/new-dataset-could-aid-development-of-behavioral-biometric-synthetic-voices