arXiv reaDer
YolactEdge: エッジ上でのリアルタイムインスタンスセグメンテーション (Jetson AGX Xavier: 30 FPS, RTX 2080 Ti: 170 FPS)
YolactEdge: Real-time Instance Segmentation on the Edge (Jetson AGX Xavier: 30 FPS, RTX 2080 Ti: 170 FPS)
小型のエッジデバイス上でリアルタイムに動作し、初めて競争力のあるインスタンス・セグメンテーション・アプローチである YolactEdge を提案する。具体的には、YolactEdgeは、Jetson AGX Xavierで最大30.8 FPS(RTX 2080 Tiでは172.7 FPS)、ResNet-101バックボーンを搭載した550x550の解像度の画像上で動作する。これを実現するために、最先端の画像ベースのリアルタイム手法であるYOLACTに、(1)速度と精度を慎重にトレードオフしながらTensorRTの最適化を行うこと、(2)動画の時間的冗長性を利用するための新しい特徴歪曲モジュールの2つの改良を行っている。YouTube VISとMS COCOのデータセットを用いた実験では、YolactEdgeが既存のリアルタイム手法と比較して3〜5倍のスピードアップを実現しながら、競争力のマスクやボックスの検出精度を実現していることが実証された。また、設計の選択とモジュールを解剖するためのアブレーション研究も行っている。コードとモデルは https://github.com/haotian-liu/yolact_edge から入手可能。
We propose YolactEdge, the first competitive instance segmentation approach that runs on small edge devices at real-time speeds. Specifically, YolactEdge runs at up to 30.8 FPS on a Jetson AGX Xavier (and 172.7 FPS on an RTX 2080 Ti) with a ResNet-101 backbone on 550x550 resolution images. To achieve this, we make two improvements to the state-of-the-art image-based real-time method YOLACT: (1) TensorRT optimization while carefully trading off speed and accuracy, and (2) a novel feature warping module to exploit temporal redundancy in videos. Experiments on the YouTube VIS and MS COCO datasets demonstrate that YolactEdge produces a 3-5x speed up over existing real-time methods while producing competitive mask and box detection accuracy. We also conduct ablation studies to dissect our design choices and modules. Code and models are available at https://github.com/haotian-liu/yolact_edge.
updated: Tue Dec 22 2020 18:58:18 GMT+0000 (UTC)
published: Tue Dec 22 2020 18:58:18 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト