VisualTextRank: Unsupervised Graph-based Content Extraction for Automating Ad Text to Image Search
多数のオンラインストック画像ライブラリが、マーケティングキャンペーンで使用するための高品質でありながら著作権のない画像を提供しています。広告主がそのようなサードパーティのライブラリをナビゲートするのを支援するために、広告テキストが与えられた場合に関連する広告画像を自動的にフェッチする問題を調査します(画像の短いテキストクエリを介して)。広告画像検索クエリ(与えられた広告テキスト)のログデータの観察に動機付けられて、広告テキスト(またはその拡張バージョン)から抽出されたキーワードが広告画像クエリとして機能するキーワード抽出問題を定式化します。これに関連して、VisualTextRankを提案します。これは、(i)意味的に類似した広告を使用して入力広告テキストを拡張し、(ii)拡張された広告テキストから画像クエリを抽出する教師なし方法です。 VisualTextRankは、類似の広告のテキストと画像の両方を活用してキーワード抽出を改善し、センテンスBERT埋め込みで広告主カテゴリ固有のバイアスを使用することにより、グラフベースのコンテキスト抽出(特にバイアスされたTextRank)に関する以前の作業に基づいています。オンボーディング広告主向けのVerizonMedia Native(Yahoo Gemini)広告プラットフォームのストック画像検索機能から収集されたデータを使用して、競合するキーワード抽出ベースラインと比較したVisualTextRankの優位性を示します(バイアスされたTextRankよりも11%高い精度の向上を含む)。ストックイメージライブラリが英語のクエリに制限されている場合、意味的に類似した英語の広告を活用しながら、多言語広告(英語に翻訳)に対するVisualTextRankの有効性を示します。 VisualTextRankの簡易バージョンを使用したオンラインテストでは、ストック画像検索の使用量が28.7%増加し、Verizon Media Native広告プラットフォームでの広告主のオンボーディング率が41.6%増加しました。
Numerous online stock image libraries offer high quality yet copyright free images for use in marketing campaigns. To assist advertisers in navigating such third party libraries, we study the problem of automatically fetching relevant ad images given the ad text (via a short textual query for images). Motivated by our observations in logged data on ad image search queries (given ad text), we formulate a keyword extraction problem, where a keyword extracted from the ad text (or its augmented version) serves as the ad image query. In this context, we propose VisualTextRank: an unsupervised method to (i) augment input ad text using semantically similar ads, and (ii) extract the image query from the augmented ad text. VisualTextRank builds on prior work on graph based context extraction (biased TextRank in particular) by leveraging both the text and image of similar ads for better keyword extraction, and using advertiser category specific biasing with sentence-BERT embeddings. Using data collected from the Verizon Media Native (Yahoo Gemini) ad platform's stock image search feature for onboarding advertisers, we demonstrate the superiority of VisualTextRank compared to competitive keyword extraction baselines (including an 11% accuracy lift over biased TextRank). For the case when the stock image library is restricted to English queries, we show the effectiveness of VisualTextRank on multilingual ads (translated to English) while leveraging semantically similar English ads. Online tests with a simplified version of VisualTextRank led to a 28.7% increase in the usage of stock image search, and a 41.6% increase in the advertiser onboarding rate in the Verizon Media Native ad platform.
updated: Thu Aug 05 2021 16:47:21 GMT+0000 (UTC)
published: Thu Aug 05 2021 16:47:21 GMT+0000 (UTC)
