arXiv reaDer
支援技術としての画像キャプション:VizWiz2020チャレンジから学んだ教訓
Image Captioning as an Assistive Technology: Lessons Learned from VizWiz 2020 Challenge
画像のキャプションは、主にMS-COCOのような厳選されたデータセットでトレーニングされたニューラルネットワークアルゴリズムの導入により、最近目覚ましい進歩を示しました。多くの場合、この分野での作業は、実際のアプリケーションでのキャプションシステムの展開の約束によって動機付けられています。ただし、多くの競合データセットのデータとコンテキストが不足しているため、これらのデータセットでトレーニングされたシステムの有用性は、視覚障害者が日常のタスクをナビゲートして達成するのを支援するなど、現実の環境での支援技術として制限されています。このギャップが、視覚障害者が撮影した画像と、有用なタスク指向の情報を含むキャプションで構成される、新しいVizWizデータセットの導入の動機となりました。機械学習のコンピュータービジョン分野が、社会にプラスの影響を与えるテクノロジーを生み出すという約束を実現するのを支援するために、VizWizデータセットのキュレーターは、画像のキャプションを含むいくつかのコンテストを主催しています。この作品では、受賞作品から2020年のキャプションコンテストまでの理論とエンジニアリングについて詳しく説明しています。私たちの仕事は、改善された補助画像キャプションシステムに向けた一歩を提供します。
Image captioning has recently demonstrated impressive progress largely owing to the introduction of neural network algorithms trained on curated dataset like MS-COCO. Often work in this field is motivated by the promise of deployment of captioning systems in practical applications. However, the scarcity of data and contexts in many competition datasets renders the utility of systems trained on these datasets limited as an assistive technology in real-world settings, such as helping visually impaired people navigate and accomplish everyday tasks. This gap motivated the introduction of the novel VizWiz dataset, which consists of images taken by the visually impaired and captions that have useful, task-oriented information. In an attempt to help the machine learning computer vision field realize its promise of producing technologies that have positive social impact, the curators of the VizWiz dataset host several competitions, including one for image captioning. This work details the theory and engineering from our winning submission to the 2020 captioning competition. Our work provides a step towards improved assistive image captioning systems.
updated: Sat Jun 19 2021 00:16:56 GMT+0000 (UTC)
published: Mon Dec 21 2020 21:48:18 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト