arXiv reaDer
BankNote-Net:支援的な普遍的な通貨認識のためのオープンデータセット
BankNote-Net: Open dataset for assistive universal currency recognition
世界中の何百万人もの人々が視力が低いか、まったくありません。支援ソフトウェアアプリケーションは、光学式文字認識、シーン識別、人物認識、通貨認識など、さまざまな日常業務用に開発されています。この最後のタスクである、さまざまな金種の紙幣の認識は、画像認識にコンピュータービジョンモデルを使用することで対処されています。ただし、このタスクで使用できるデータセットとモデルは、データセットのサイズと対象となるさまざまな通貨の両方の点で制限されています。この作業では、17の通貨と112の金種にまたがる、さまざまな支援設定の紙幣の合計24,826枚の画像を収集します。監視された対照学習を使用して、ユニバーサル通貨認識のための機械学習モデルを開発します。このモデルは、さまざまなコンテキストで紙幣画像の準拠した埋め込みを学習します。これは、(圧縮されたベクトル表現として)公に共有でき、データセットでカバーされていないものを含む、任意の通貨の特殊なダウンストリームモデルをトレーニングおよびテストするために使用できます。金種ごとに数枚の実像しか利用できません(数ショットの学習)。 Microsoftが開発したSeeingAIアプリの最後のバージョンで、このモデルのバリエーションを公開用にデプロイします。 BankNote-Netリポジトリで、エンコーダモデルと埋め込みをオープンデータセットとして共有します。
Millions of people around the world have low or no vision. Assistive software applications have been developed for a variety of day-to-day tasks, including optical character recognition, scene identification, person recognition, and currency recognition. This last task, the recognition of banknotes from different denominations, has been addressed by the use of computer vision models for image recognition. However, the datasets and models available for this task are limited, both in terms of dataset size and in variety of currencies covered. In this work, we collect a total of 24,826 images of banknotes in variety of assistive settings, spanning 17 currencies and 112 denominations. Using supervised contrastive learning, we develop a machine learning model for universal currency recognition. This model learns compliant embeddings of banknote images in a variety of contexts, which can be shared publicly (as a compressed vector representation), and can be used to train and test specialized downstream models for any currency, including those not covered by our dataset or for which only a few real images per denomination are available (few-shot learning). We deploy a variation of this model for public use in the last version of the Seeing AI app developed by Microsoft. We share our encoder model and the embeddings as an open dataset in our BankNote-Net repository.
updated: Thu Apr 07 2022 21:16:54 GMT+0000 (UTC)
published: Thu Apr 07 2022 21:16:54 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト