arXiv reaDer
ユーザーレビューウェブサイトからクラウドソーシングされた写真をマイニングすることによるレストランスタイルの推測
Inferring Restaurant Styles by Mining Crowd Sourced Photos from User-Review Websites
オンラインでレストランを探すとき、ユーザーがアップロードした写真は、多くの場合、レストランについて即座に具体的な印象を与えます。その有益性により、そのようなユーザーが投稿した写真は、レストランのレビューWebサイトで活用され、ユーザーに直感的で効果的な検索エクスペリエンスを提供します。この論文では、ユーザーレビューWebサイトにユーザーがアップロードした写真から、レストランのタイプまたはスタイル(雰囲気、料理のスタイル、さまざまな機会への適合性)を推測するための新しいアプローチを紹介します。そのために、まず、ユーザーが投稿した写真をTripAdviorのレストランスタイルに関連付ける新しいレストラン写真データセットを収集します。次に、レストランスタイル分類タスクの固有の問題設定に対処するためのディープマルチインスタンスマルチラベル学習(MIML)フレームワークを提案します。マルチラベル畳み込みニューラルネットワーク(CNN)をトレーニングするために、2段階のブートストラップ戦略を採用しています。次に、マルチラベルCNNを使用して、レストランに関連付けられたすべての画像のレストランスタイルの信頼スコアを計算します。計算された信頼スコアは、各レストランスタイルタグの最終的なバイナリ分類子をトレーニングするためにさらに使用されます。トレーニング時に、トレーニング済みのマルチラベルCNNおよびSVMモデルを使用してレストランの写真を分析することにより、レストランのスタイルをプロファイリングできます。実験的評価により、クラウドソーシングベースのアプローチでは、特定のレストランに十分な数のユーザーがアップロードした写真がある場合に、レストランのスタイルを効果的に推測できることが実証されています。
When looking for a restaurant online, user uploaded photos often give people an immediate and tangible impression about a restaurant. Due to their informativeness, such user contributed photos are leveraged by restaurant review websites to provide their users an intuitive and effective search experience. In this paper, we present a novel approach to inferring restaurant types or styles (ambiance, dish styles, suitability for different occasions) from user uploaded photos on user-review websites. To that end, we first collect a novel restaurant photo dataset associating the user contributed photos with the restaurant styles from TripAdvior. We then propose a deep multi-instance multi-label learning (MIML) framework to deal with the unique problem setting of the restaurant style classification task. We employ a two-step bootstrap strategy to train a multi-label convolutional neural network (CNN). The multi-label CNN is then used to compute the confidence scores of restaurant styles for all the images associated with a restaurant. The computed confidence scores are further used to train a final binary classifier for each restaurant style tag. Upon training, the styles of a restaurant can be profiled by analyzing restaurant photos with the trained multi-label CNN and SVM models. Experimental evaluation has demonstrated that our crowd sourcing-based approach can effectively infer the restaurant style when there are a sufficient number of user uploaded photos for a given restaurant.
updated: Wed Mar 23 2022 16:27:31 GMT+0000 (UTC)
published: Sat Nov 19 2016 04:27:28 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト