動画内のロゴの頻度と長さを見積もることは、広告購入の影響を見積もる方法として重要であり、広告業界では困難です。ロゴはビデオの小さな領域しか占めないため、一般的な画像検索方法は失敗する可能性があります。このペーパーでは、ビデオロゴ検索(VLR)と呼ばれるアルゴリズムを開発します。これは、クエリ画像(ロゴ)とビデオ画像のコレクション間の距離を測定するローカル画像記述子の空間分布に基づく画像からビデオへの検索アルゴリズムです。 。 VLRはローカル機能を使用して、畳み込みニューラルネットワーク(CNN)などのグローバル機能ベースのモデルの弱点を克服します。その間、VLRは柔軟性があり、いくつかのハイパーパラメーターを設定した後にトレーニングを必要としません。 VLRのパフォーマンスは、2つの挑戦的なオープンベンチマークタスク(SoccerNetおよびStandford I2V)で評価され、他の最先端のロゴ取得または検出アルゴリズムと比較されます。全体として、VLRは既存の方法と比較して大幅に高い精度を示します。
Estimation of the frequency and duration of logos in videos is important and challenging in the advertisement industry as a way of estimating the impact of ad purchases. Since logos occupy only a small area in the videos, the popular methods of image retrieval could fail. This paper develops an algorithm called Video Logo Retrieval (VLR), which is an image-to-video retrieval algorithm based on the spatial distribution of local image descriptors that measure the distance between the query image (the logo) and a collection of video images. VLR uses local features to overcome the weakness of global feature-based models such as convolutional neural networks (CNN). Meanwhile, VLR is flexible and does not require training after setting some hyper-parameters. The performance of VLR is evaluated on two challenging open benchmark tasks (SoccerNet and Standford I2V), and compared with other state-of-the-art logo retrieval or detection algorithms. Overall, VLR shows significantly higher accuracy compared with the existing methods.