このホワイトペーパーでは、リアルタイム推論のハードウェア制限を実行できるマルチクラスのアイセグメンテーション手法を紹介します。このアプローチには、入力からグレースケール画像を取得し、深いネットワークで3つの異なる目の領域をセグメント化し、ヒューリスティックフィルターで誤った領域を削除する3つの主要な段階が含まれます。キーを持つエンコーダーデコーダー構造に基づくモデルは、計算コストを削減するための深さ方向の畳み込み演算です。 OpenEDSで実験を行います。OpenEDSは、2つの同期した目を向けるカメラを備えたヘッドマウントディスプレイによってキャプチャされた目画像の大規模データセットです。サイズ0.4メガバイトのモデルで、94.85%の平均ユニオン交差(mIoU)を達成しました。ソースコードはhttps://github.com/th2l/Eye_VR_Segmentationで入手可能です
In this paper, we present a multi-class eye segmentation method that can run the hardware limitations for real-time inference. Our approach includes three major stages: get a grayscale image from the input, segment three distinct eye region with a deep network, and remove incorrect areas with heuristic filters. Our model based on the encoder decoder structure with the key is the depthwise convolution operation to reduce the computation cost. We experiment on OpenEDS, a large scale dataset of eye images captured by a head-mounted display with two synchronized eye facing cameras. We achieved the mean intersection over union (mIoU) of 94.85% with a model of size 0.4 megabytes. The source code are available https://github.com/th2l/Eye_VR_Segmentation