arXiv reaDer
スマートフォンでの高速で正確なカメラシーンの検出
Fast and Accurate Camera Scene Detection on Smartphones
AIを利用した自動カメラシーン検出モードは、現在ほとんどすべての最新のスマートフォンで利用できますが、正確なシーン予測の問題はまだ研究コミュニティによって対処されていません。この論文では、初めてこの問題を注意深く定義し、30の異なるシーンカテゴリに属する11Kを超える手動でクロールされた画像を含む新しいカメラシーン検出データセット(CamSDD)を提案します。このタスクに対して効率的でNPUに適したCNNモデルを提案します。これは、このデータセットで99.5%のトップ3精度を示し、最近のモバイルSoCで200FPS以上を達成します。得られたソリューションの追加の実地評価を実行して、実際のシナリオでのパフォーマンスと制限を分析します。このホワイトペーパーで使用されているデータセットと事前トレーニング済みモデルは、プロジェクトのWebサイトで入手できます。
AI-powered automatic camera scene detection mode is nowadays available in nearly any modern smartphone, though the problem of accurate scene prediction has not yet been addressed by the research community. This paper for the first time carefully defines this problem and proposes a novel Camera Scene Detection Dataset (CamSDD) containing more than 11K manually crawled images belonging to 30 different scene categories. We propose an efficient and NPU-friendly CNN model for this task that demonstrates a top-3 accuracy of 99.5% on this dataset and achieves more than 200 FPS on the recent mobile SoCs. An additional in-the-wild evaluation of the obtained solution is performed to analyze its performance and limitation in the real-world scenarios. The dataset and pre-trained models used in this paper are available on the project website.
updated: Mon May 17 2021 14:06:21 GMT+0000 (UTC)
published: Mon May 17 2021 14:06:21 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト