オブジェクト検出は、特に人間の認識と歩行者の検出に関するコンピュータービジョンの流行の分野です。人の全身を認識することは、常に難しい問題でした。長年にわたり、研究者はさまざまな方法を提案し、最近では、マスクR-CNNがインスタンスのセグメンテーションにブレークスルーをもたらしました。 Faster R-CNNに基づいて、Mask R-CNNは各インスタンスのセグメンテーションマスクを生成できました。 QOL(Quality Of Life)のために、家族や友人などの人々の幸せな瞬間をグループ化するために、楽しいライフシーンの画像とビデオから複数の人物を抽出するアプリケーションを提案します。同様に、抽出された人物の画像を新しい背景に入れる方法を提案します。これにより、ユーザーは自分の人生における家族や友人の幸せな表情や行動の楽しいコレクションを作成できます。マスクR-CNNは、画像からすべてのタイプのオブジェクトマスクを検出します。次に、アルゴリズムは対象の人物のみを考慮し、人物の前にいる犬などの障害物のない人物のみを抽出します。また、ユーザーは期待どおりに複数の人物を選択することもできます。このアルゴリズムは、画像の長さに関係なく、画像とビデオの両方に有効です。このアルゴリズムは、5 fpsで実行されるMask R-CNNにオーバーヘッドを追加しません。ヨガの人の例を画像で、ダンサーをダンスビデオのフレームで示します。シンプルで効果的なアプローチが、画像の背景を置き換えるためのベースラインとして機能し、将来の研究を容易にすることを願っています。
Object detection is a trendy branch of computer vision, especially on human recognition and pedestrian detection. Recognizing the complete body of a person has always been a difficult problem. Over the years, researchers proposed various methods, and recently, Mask R-CNN has made a breakthrough for instance segmentation. Based on Faster R-CNN, Mask R-CNN has been able to generate a segmentation mask for each instance. We propose an application to extracts multiple persons from images and videos for pleasant life scenes to grouping happy moments of people such as family or friends and a community for QOL (Quality Of Life). We likewise propose a methodology to put extracted images of persons into the new background. This enables a user to make a pleasant collection of happy facial expressions and actions of his/her family and friends in his/her life. Mask R-CNN detects all types of object masks from images. Then our algorithm considers only the target person and extracts a person only without obstacles, such as dogs in front of the person, and the user also can select multiple persons as their expectations. Our algorithm is effective for both an image and a video irrespective of the length of it. Our algorithm does not add any overhead to Mask R-CNN, running at 5 fps. We show examples of yoga-person in an image and a dancer in a dance-video frame. We hope our simple and effective approach would serve as a baseline for replacing the image background and help ease future research.