arXiv reaDer
invivoおよびinsilicoでの超高速画像分類
Ultra-fast image categorization in vivo and in silico
人間は画像をしっかりと分類することができ、たとえば、わずか120ミリ秒で短時間点滅した画像から動物の存在を検出できます。当初は神経科学に触発され、深層学習アルゴリズムは過去10年間に文字通り開花し、現在、機械の精度は視覚認識タスクにおいて人間よりも優れています。ただし、これらの人工ニューラルネットワークは通常、非常に特定のタスク、たとえばImageNetの1000の個別のカテゴリでトレーニングおよび評価されます。その点で、生物学的視覚システムは、一般的な生態学的タスクの人工システムと比較して、より柔軟で効率的です。この比較を深めるために、標準のVGG畳み込みニューラルネットワーク(CNN)を、人間に生態学的に関連する2つの独立したタスクで再トレーニングしました。1つは動物の存在を検出することとして定義され、もう1つは動物の存在を検出することとして定義されます。アーティファクト。ネットワークを再トレーニングすると、精神物理学的タスクで報告される人間のようなパフォーマンスレベルが達成されることを示します。また、画像ごとに検出の精度を比較します。これは特に、2つのモデルの出力を組み合わせるとパフォーマンスが向上することを示しています。実際、動物(ライオンなど)は、アーティファクト(建物など)を含む写真にはあまり存在しない傾向があります。これらの再訓練されたモデルは、回転(たとえば、逆さままたは傾斜した画像)またはグレースケール変換に対するロバスト性など、人間の精神物理学からの予期しない行動観察を再現する可能性があります。
Humans are able to robustly categorize images and can, for instance, detect the presence of an animal in a briefly flashed image in as little as 120 ms. Initially inspired by neuroscience, deep-learning algorithms literally bloomed up in the last decade such that the accuracy of machines is at present superior to humans for visual recognition tasks. However, these artificial networks are usually trained and evaluated on very specific tasks, for instance on the 1000 separate categories of ImageNet. In that regard, biological visual systems are more flexible and efficient compared to artificial systems on generic ecological tasks. In order to deepen this comparison, we re-trained the standard VGG Convolutional Neural Network (CNN) on two independent tasks which are ecologically relevant for humans: one task defined as detecting the presence of an animal and the other as detecting the presence of an artifact. We show that retraining the network achieves human-like performance level which is reported in psychophysical tasks. We also compare the accuracy of the detection on an image-by-image basis. This showed in particular that the two models perform better when combining their outputs. Indeed, animals (e.g. lions) tend to be less present in photographs containing artifacts (e.g. buildings). These re-trained models could reproduce some unexpected behavioral observations from humans psychophysics such as the robustness to rotations (e.g. upside-down or slanted image) or to a grayscale transformation.
updated: Sat May 07 2022 11:19:40 GMT+0000 (UTC)
published: Sat May 07 2022 11:19:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト