arXiv reaDer
コンテキスト自己回帰を使用した完全注意ベースのニューラルアーキテクチャ検索
Full-attention based Neural Architecture Search using Context Auto-regression
自己注意アーキテクチャは、視覚タスクのパフォーマンスを改善するための最近の進歩として浮上しています。自己注意ネットワークのアーキテクチャを手動で決定することは、専門家の経験に依存しており、さまざまなシナリオに自動的に適応することはできません。一方、ニューラルアーキテクチャ検索(NAS)は、ニューラルアーキテクチャの自動設計を大幅に進歩させました。したがって、NASメソッドを使用して、より優れた自己注意アーキテクチャを自動的に発見することを検討するのが適切です。ただし、セルベースの検索スペースが均一であり、コンテンツへの長期的な依存関係がないため、既存のNASメソッドを直接使用してアテンションネットワークを検索することは困難です。この問題に対処するために、フルアテンションベースのNASメソッドを提案します。より具体的には、ネットワークの異なる層に様々な注意操作を採用することを可能にする段階的探索空間が構築される。グローバルな特徴を抽出するために、コンテキストの自己回帰を使用して完全な注意のアーキテクチャを発見する自己監視検索アルゴリズムが提案されています。提案手法の有効性を検証するために、画像分類、きめ細かい画像認識、ゼロショット画像検索など、さまざまな学習タスクについて広範な実験を行いました。経験的結果は、私たちの方法が必要な検索効率を保証しながら、高性能で完全な注意のアーキテクチャを発見できるという強力な証拠を示しています。
Self-attention architectures have emerged as a recent advancement for improving the performance of vision tasks. Manual determination of the architecture for self-attention networks relies on the experience of experts and cannot automatically adapt to various scenarios. Meanwhile, neural architecture search (NAS) has significantly advanced the automatic design of neural architectures. Thus, it is appropriate to consider using NAS methods to discover a better self-attention architecture automatically. However, it is challenging to directly use existing NAS methods to search attention networks because of the uniform cell-based search space and the lack of long-term content dependencies. To address this issue, we propose a full-attention based NAS method. More specifically, a stage-wise search space is constructed that allows various attention operations to be adopted for different layers of a network. To extract global features, a self-supervised search algorithm is proposed that uses context auto-regression to discover the full-attention architecture. To verify the efficacy of the proposed methods, we conducted extensive experiments on various learning tasks, including image classification, fine-grained image recognition, and zero-shot image retrieval. The empirical results show strong evidence that our method is capable of discovering high-performance, full-attention architectures while guaranteeing the required search efficiency.
updated: Sat Nov 13 2021 16:07:37 GMT+0000 (UTC)
published: Sat Nov 13 2021 16:07:37 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト