画像表現は、コンピューター ビジョン アプリケーションの重要な構成要素です。このホワイト ペーパーでは、ECCV2022 インスタンス レベル認識ワークショップの一部である Google Universal Image Embedding Competition の第 2 位のソリューションを紹介します。インスタンスレベルのきめの細かい画像分類方法を使用して、このコンテストを完了します。私たちは、データの構築と処理、モデル構造、およびトレーニング戦略に焦点を当てています。最後に、このソリューションは、パブリック リーダーボードで 0.713、プライベート リーダーボードで 0.709 のスコアを獲得しました。
Image representations are a critical building block of computer vision applications. This paper presents the 2nd place solution to the Google Universal Image Embedding Competition, which is part of the ECCV2022 instance-level recognition workshops. We use the instance-level fine-grained image classification method to complete this competition. We focus on data building and processing, model structure, and training strategies. Finally, the solution scored 0.713 on the public leaderboard and 0.709 on the private leaderboard.