当前位置:首页 > 科技文档 > 电信技术 > 正文

多模型融合的VoxSRC22说话人日志系统

计算机工程与应用 页数: 9 2023-03-28
摘要: 为有效解决“谁在什么时候说话”的问题,提出一种说话人日志方法。该方法由六个模块组成,包括语音活动检测(voice activity detection,VAD)、语音增强、说话人嵌入提取器、说话人聚类、重叠语音检测(overlapping speech detection,OSD)和结果融合。利用语音增强技术可以改善语音活动检测的性能。有效地结合不同的说话人嵌入提取器和聚类算法... (共9页)

开通会员,享受整站包年服务立即开通 >