Approaches of large-scale images recognition with more than 50,000 categoris
現在のCVモデルは、数百または数千のカテゴリを持つ小規模な画像分類データセットで高レベルの精度を達成できましたが、50,000を超えるカテゴリを持つ大規模なデータセットの場合、多くのモデルは計算またはスペース消費が不可能になります。この論文では、特徴抽出と処理、BOVW(視覚単語のバッグ)、ミニバッチK平均、SVMなどの統計学習技術などの従来のCV手法を使用して、大規模な種のデータセットを分類するための実行可能なソリューションを提供します。私たちの作品で使用されています。そして、ニューラルネットワークモデルと混合します。これらの手法を適用する際には、時間とメモリの消費量をある程度最適化しているため、大規模なデータセットでも実現可能です。また、いくつかの技術を使用して、データの誤表示の影響を軽減しています。私たちは50,000を超えるカテゴリのデータセットを使用し、すべての操作は、6 GBのRAMと3. OGHzのCPUを備えた一般的なコンピュータで行われます。私たちの貢献は次のとおりです。1)トレーニングプロセスで遭遇する可能性のある問題を分析し、これらの問題を解決するためのいくつかの実行可能な方法を提示します。 2)ニューラルネットワークモデルと組み合わせた従来のCVモデルが、時間と空間リソースの制約内で大規模な分類済みデータセットをトレーニングするためのいくつかの実行可能なシナリオを提供するようにします。
Though current CV models have been able to achieve high levels of accuracy on small-scale images classification dataset with hundreds or thousands of categories, many models become infeasible in computational or space consumption when it comes to large-scale dataset with more than 50,000 categories. In this paper, we provide a viable solution for classifying large-scale species datasets using traditional CV techniques such as.features extraction and processing, BOVW(Bag of Visual Words) and some statistical learning technics like Mini-Batch K-Means,SVM which are used in our works. And then mixed with a neural network model. When applying these techniques, we have done some optimization in time and memory consumption, so that it can be feasible for large-scale dataset. And we also use some technics to reduce the impact of mislabeling data. We use a dataset with more than 50, 000 categories, and all operations are done on common computer with l 6GB RAM and a CPU of 3. OGHz. Our contributions are: 1) analysis what problems may meet in the training processes, and presents several feasible ways to solve these problems. 2) Make traditional CV models combined with neural network models provide some feasible scenarios for training large-scale classified datasets within the constraints of time and spatial resources.
updated: Tue Jul 09 2024 16:36:23 GMT+0000 (UTC)
published: Sun Jul 26 2020 07:33:22 GMT+0000 (UTC)
