arXiv reaDer
DeepVQE: 共同音響エコー キャンセリング、ノイズ抑制、および残響除去のためのリアルタイムのディープ ボイス品質強化
DeepVQE: Real Time Deep Voice Quality Enhancement for Joint Acoustic Echo Cancellation, Noise Suppression and Dereverberation
音響エコー キャンセレーション (AEC)、ノイズ抑制 (NS)、および残響除去 (DR) は、最新の全二重通信システムに不可欠な部分です。テレビ会議システムの需要が高まるにつれ、効果的かつ効率的なオンライン会議エクスペリエンスを実現するには、これらのタスクに対処することが必要になります。これまでの研究のほとんどは、これらのタスクをデジタル信号処理 (DSP) ベースのコンポーネントと組み合わせて個別にソリューションを提案しており、その結果、複雑なパイプラインが作成され、現実世界のアプリケーションに展開するのは非現実的であることがよくあります。この論文では、AEC、NS、DR に同時に対処する、残差畳み込みニューラル ネットワーク (CNN) とリカレント ニューラル ネットワーク (RNN) に基づく、DeepVQE という名前のリアルタイム クロスアテンション ディープ モデルを提案します。当社では、モデルのさまざまなコンポーネントが全体的なパフォーマンスに与える影響を分析するために、いくつかのアブレーション研究を実施しています。 DeepVQE は、ICASSP 2023 音響エコー キャンセリング チャレンジおよび ICASSP 2023 ディープ ノイズ抑制チャレンジ テスト セットの非パーソナライズされたトラックで最先端のパフォーマンスを達成し、単一のモデルが優れたパフォーマンスで複数のタスクを処理できることを示しています。さらに、モデルはリアルタイムで実行され、Microsoft Teams プラットフォームでのテストに成功しています。
Acoustic echo cancellation (AEC), noise suppression (NS) and dereverberation (DR) are an integral part of modern full-duplex communication systems. As the demand for teleconferencing systems increases, addressing these tasks is required for an effective and efficient online meeting experience. Most prior research proposes solutions for these tasks separately, combining them with digital signal processing (DSP) based components, resulting in complex pipelines that are often impractical to deploy in real-world applications. This paper proposes a real-time cross-attention deep model, named DeepVQE, based on residual convolutional neural networks (CNNs) and recurrent neural networks (RNNs) to simultaneously address AEC, NS, and DR. We conduct several ablation studies to analyze the contributions of different components of our model to the overall performance. DeepVQE achieves state-of-the-art performance on non-personalized tracks from the ICASSP 2023 Acoustic Echo Cancellation Challenge and ICASSP 2023 Deep Noise Suppression Challenge test sets, showing that a single model can handle multiple tasks with excellent performance. Moreover, the model runs in real-time and has been successfully tested for the Microsoft Teams platform.
updated: Mon Jun 05 2023 18:37:05 GMT+0000 (UTC)
published: Mon Jun 05 2023 18:37:05 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト