arXiv reaDer
Understanding Optical Music Recognition
50年以上にわたって、研究者たちは光学式音楽認識(OMR)と呼ばれる楽譜を読むようにコンピューターに教えようとしてきました。しかし、この分野は、特に重要な音楽的背景のない新規研究者がアクセスするのは依然として困難です。導入資料はほとんどありません。さらに、この分野はそれ自体を定義し、共通の用語を構築することに苦労しています。このチュートリアルでは、これらの欠点に対処するために、(1)OMRとその関連フィールドとの関係の堅牢な定義を提供し、(2)OMRが音楽エンコーディングプロセスを反転させて、ドキュメントから音符と音楽セマンティクスを復元する方法を分析します(3 )OMRの分類法を提案します。特に、アプリケーションの新しい分類法を使用します。さらに、従来のパイプラインとは対照的に、深層学習が現代のOMR研究にどのように影響するかについても説明します。この研究に基づいて、読者はOMRの基本的な理解を得ることができます。OMRの目的、固有の構造、他の分野との関係、最新技術、およびそれがもたらす研究の機会です。
For over 50 years, researchers have been trying to teach computers to read music notation, referred to as Optical Music Recognition (OMR). However, this field is still difficult to access for new researchers, especially those without a significant musical background: few introductory materials are available, and furthermore the field has struggled with defining itself and building a shared terminology. In this tutorial, we address these shortcomings by (1) providing a robust definition of OMR and its relationship to related fields, (2) analyzing how OMR inverts the music encoding process to recover the musical notation and the musical semantics from documents, (3) proposing a taxonomy of OMR, with most notably a novel taxonomy of applications. Additionally, we discuss how deep learning affects modern OMR research, as opposed to the traditional pipeline. Based on this work, the reader should be able to attain a basic understanding of OMR: its objectives, its inherent structure, its relationship to other fields, the state of the art, and the research opportunities it affords.
updated: Wed Jul 29 2020 08:59:52 GMT+0000 (UTC)
published: Wed Aug 07 2019 08:37:16 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト