正確な眼のセグメンテーションは、視線推定を改善し、視覚的注意に基づくインタラクティブなコンピューティングをサポートできます。ただし、既存の目のセグメンテーション方法には、人に依存する精度、堅牢性の欠如、リアルタイムでの実行不能などの問題があります。ここでは、U-NetとDenseNetを組み合わせたディープニューラルネットワークであるRITnetモデルを紹介します。 RITnetは1 MB未満であり、2019 OpenEDSセマンティックセグメンテーションチャレンジで95.3 \%の精度を達成しています。 GeForce GTX 1080 Tiを使用して、RITnetは$> $ 300Hzで追跡し、リアルタイムの注視追跡アプリケーションを可能にします。事前トレーニング済みのモデルとソースコードは、https://bitbucket.org/eye-ush/ritnet/で入手できます。
Accurate eye segmentation can improve eye-gaze estimation and support interactive computing based on visual attention; however, existing eye segmentation methods suffer from issues such as person-dependent accuracy, lack of robustness, and an inability to be run in real-time. Here, we present the RITnet model, which is a deep neural network that combines U-Net and DenseNet. RITnet is under 1 MB and achieves 95.3\% accuracy on the 2019 OpenEDS Semantic Segmentation challenge. Using a GeForce GTX 1080 Ti, RITnet tracks at $>$ 300Hz, enabling real-time gaze tracking applications. Pre-trained models and source code are available https://bitbucket.org/eye-ush/ritnet/.