当前位置:首页 > 科技文档 > 电信技术 > 正文

采用多视角注意力的声音事件定位与检测

信号处理 页数: 11 2023-07-26
摘要: 近年来,基于深度学习的方法有效改进了声音事件定位与检测的性能,但当场景中存在多声源重叠时,准确的声源时空信息估计依然较为困难,声音事件定位与检测的性能存在较大提升空间。为充分挖掘多通道深层表示所包含的关键信息,本文提出了一种多视角注意力网络模型MVANet(Multi-View Attention Network)。首先,引入软参数共享网络架构实现不同任务之间的交互学习,计算多... (共11页)

开通会员,享受整站包年服务立即开通 >