arXiv reaDer
CNNの最適な機能を介した食品検出のための新しいマルチカラムカーネルエクストリームラーニングマシン
Novel Multicolumn Kernel Extreme Learning Machine for Food Detection via Optimal Features from CNN
自動食品検出は、ソーシャルメディアプラットフォームでの食品画像の検出から、食事評価アプリでのユーザーからの非食品写真のフィルタリングに至るまで、幅広いアプリケーションで注目を集めています。最近、COVID-19のパンデミックの際に、公共の場所でカメラから食事活動を自動的に検出することにより、食事禁止の実施を容易にしました。したがって、食品画像を高精度で認識するという課題に取り組むために、効率的なニューラルネットワークから最適な特徴を抽出して選択するためのハイブリッドフレームワークのアイデアを提案しました。その上で、非線形分類器を使用して、線形に分離できない特徴ベクトルを非常に正確に区別します。このアイデアに沿って、私たちの方法はMobileNetV3から特徴を抽出し、Shapley Additive exPlanations(SHAP)値を使用して属性の最適なサブセットを選択し、その非線形決定境界と優れた一般化能力によりカーネルエクストリームラーニングマシン(KELM)を活用します。ただし、KELMは、多数の隠れノードを持つカーネル行列の複雑な計算のために、大きなデータセットの「次元の呪いの問題」に悩まされています。この問題は、kdツリーアルゴリズムを利用してデータをN個のサブセットに分割し、データのサブセットごとに個別のKELMをトレーニングする新しいマルチカラムカーネルエクストリームラーニングマシン(MCKELM)を提案することで解決しました。次に、このメソッドはKELM分類器を並列構造に組み込み、ネットワーク全体ではなく入力を分類するためにkdツリー検索を使用して、テスト中に上位k個の最も近いサブセットを選択します。提案されたフレームワークを評価するために、9つの公的に利用可能なデータセットを使用して大規模な食品/非食品データセットが準備されます。実験結果は、大規模なデータセットのKELMにおける次元の呪いの問題を解決しながら、統合された一連の測定値に対する私たちの方法の優位性を示しました。
Automatic food detection is an emerging topic of interest due to its wide array of applications ranging from detecting food images on social media platforms to filtering non-food photos from the users in dietary assessment apps. Recently, during the COVID-19 pandemic, it has facilitated enforcing an eating ban by automatically detecting eating activities from cameras in public places. Therefore, to tackle the challenge of recognizing food images with high accuracy, we proposed the idea of a hybrid framework for extracting and selecting optimal features from an efficient neural network. There on, a nonlinear classifier is employed to discriminate between linearly inseparable feature vectors with great precision. In line with this idea, our method extracts features from MobileNetV3, selects an optimal subset of attributes by using Shapley Additive exPlanations (SHAP) values, and exploits kernel extreme learning machine (KELM) due to its nonlinear decision boundary and good generalization ability. However, KELM suffers from the 'curse of dimensionality problem' for large datasets due to the complex computation of kernel matrix with large numbers of hidden nodes. We solved this problem by proposing a novel multicolumn kernel extreme learning machine (MCKELM) which exploited the k-d tree algorithm to divide data into N subsets and trains separate KELM on each subset of data. Then, the method incorporates KELM classifiers into parallel structures and selects the top k nearest subsets during testing by using the k-d tree search for classifying input instead of the whole network. For evaluating a proposed framework large food/non-food dataset is prepared using nine publically available datasets. Experimental results showed the superiority of our method on an integrated set of measures while solving the problem of 'curse of dimensionality in KELM for large datasets.
updated: Sun May 15 2022 18:07:43 GMT+0000 (UTC)
published: Sun May 15 2022 18:07:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト