CNN based Extraction of Panels/Characters from Bengali Comic Book Page Images
  最近の人々は、ドキュメントをキャプチャするためにカメラや携帯電話などのデジタルガジェットを使用することを好みます。コミックドキュメントの画像からのパネル/キャラクターの自動抽出は、ライターが採用する多種多様な描画スタイルのために困難であり、読者がモバイルデバイスでいつでも読むことができ、自動デジタル化に役立ちます。パネル/キャラクターのローカライズの方法のほとんどは、連結成分分析またはページ背景マスクに依存しており、限られたコミックデータセットにのみ適用できます。この作品では、漫画の画像からパネルとキャラクターの両方を抽出するために、YOLOとCNNの機能に基づいたパネル/キャラクターのローカリゼーションアーキテクチャを提案しています。この方法は、当社が開発した合計$ 4130 $の画像で構成されるベンガリコミックブックイメージデータセット(BCBId)と、eBDtheque、Manga 109、DCMデータセットなど、他の言語で公開されているさまざまなコミックデータセットで顕著な結果を達成しました。
Peoples nowadays prefer to use digital gadgets like cameras or mobile phones for capturing documents. Automatic extraction of panels/characters from the images of a comic document is challenging due to the wide variety of drawing styles adopted by writers, beneficial for readers to read them on mobile devices at any time and useful for automatic digitization. Most of the methods for localization of panel/character rely on the connected component analysis or page background mask and are applicable only for a limited comic dataset. This work proposes a panel/character localization architecture based on the features of YOLO and CNN for extraction of both panels and characters from comic book images. The method achieved remarkable results on Bengali Comic Book Image dataset (BCBId) consisting of total $4130$ images, developed by us as well as on a variety of publicly available comic datasets in other languages, i.e. eBDtheque, Manga 109 and DCM dataset.
