arXiv reaDer
赤ちゃんの泣き声の弱教師あり検出
Weakly Supervised Detection of Baby Cry
赤ちゃんの泣き声を検出することは、赤ちゃんのモニタリングとヘルスケアの重要な部分です。ほとんどすべての既存の方法は、教師あり SVM、CNN、またはそれらのバリエーションを使用します。この作業では、弱教師付き異常検出を使用して赤ちゃんの泣き声を検出することを提案します。この弱い監督では、音声ファイルに泣き声がある場合にのみ弱い注釈が必要です。事前にトレーニングされた VGGish 特徴抽出器と長いトリミングされていないオーディオ ファイルの異常検出ネットワークを使用して、データ マイニング手法を設計します。取得したデータセットを使用して、泣く/泣かない分類のための単純な CNN 機能ネットワークをトレーニングします。この CNN は、異常検出フレームワークで特徴抽出器として使用され、より優れた泣き声検出パフォーマンスを実現します。
Detection of baby cries is an important part of baby monitoring and health care. Almost all existing methods use supervised SVM, CNN, or their varieties. In this work, we propose to use weakly supervised anomaly detection to detect a baby cry. In this weak supervision, we only need weak annotation if there is a cry in an audio file. We design a data mining technique using the pre-trained VGGish feature extractor and an anomaly detection network on long untrimmed audio files. The obtained datasets are used to train a simple CNN feature network for cry/non-cry classification. This CNN is then used as a feature extractor in an anomaly detection framework to achieve better cry detection performance.
updated: Wed Nov 01 2023 03:00:54 GMT+0000 (UTC)
published: Wed Apr 19 2023 22:38:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト