arXiv reaDer
音楽タグ付けに関するディープニューラルネットワークのオーディオ信号前処理方法の比較
A Comparison of Audio Signal Preprocessing Methods for Deep Neural Networks on Music Tagging
この論文では、ディープニューラルネットワークによる音楽のタグ付けに対するオーディオ前処理の影響を経験的に調査します。さまざまな時間周波数表現、対数振幅圧縮、周波数重み付け、およびスケーリングを使用したオーディオ前処理を含む包括的な実験を実行します。マグニチュード圧縮を除いて、一般的に使用される多くの入力前処理技術が冗長であることを示します。
In this paper, we empirically investigate the effect of audio preprocessing on music tagging with deep neural networks. We perform comprehensive experiments involving audio preprocessing using different time-frequency representations, logarithmic magnitude compression, frequency weighting, and scaling. We show that many commonly used input preprocessing techniques are redundant except magnitude compression.
updated: Mon Feb 22 2021 13:21:38 GMT+0000 (UTC)
published: Wed Sep 06 2017 12:44:01 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト