arXiv reaDer
視覚的な質問応答アーキテクチャの最近の急速な進歩:レビュー
Recent, rapid advancement in visual question answering architecture: a review
視覚的な質問応答を理解することは、多くの人間の活動にとって非常に重要になります。ただし、人工知能の取り組みの中心には大きな課題があります。このペーパーでは、過去2年間に発生した画像を使用した、視覚的な質問応答の急速な進歩に関する最新情報を紹介します。視覚的な質問応答システムアーキテクチャの改善に関する研究の驚異的な成長が最近発表され、マルチモーダルアーキテクチャの重要性が示されています。視覚的な質問応答の利点に関するいくつかのポイントは、Manmadhanetalによるレビューペーパーに記載されています。 (2020)、この記事は、フィールドでのその後の更新を含めて構築されています。
Understanding visual question answering is going to be crucial for numerous human activities. However, it presents major challenges at the heart of the artificial intelligence endeavor. This paper presents an update on the rapid advancements in visual question answering using images that have occurred in the last couple of years. Tremendous growth in research on improving visual question answering system architecture has been published recently, showing the importance of multimodal architectures. Several points on the benefits of visual question answering are mentioned in the review paper by Manmadhan et al. (2020), on which the present article builds, including subsequent updates in the field.
updated: Sat Jul 09 2022 23:19:58 GMT+0000 (UTC)
published: Wed Mar 02 2022 03:39:53 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト