異なるカメラビューで人々を再識別することを目的とする個人の再識別(re-ID)は、特に畳み込みニューラルネットワーク(CNN)を使用した近年のディープラーニングによって大幅に進歩しています。このホワイトペーパーでは、PyTorch上に構築されたソフトウェアライブラリであるTorchreidを紹介します。これにより、深いre-IDモデルの迅速な開発とエンドツーエンドのトレーニングと評価が可能になります。個人のre-ID調査の汎用フレームワークとして、Torchreidは(1)画像とビデオの両方のドメインをカバーする15の一般的に使用されるre-IDベンチマークデータセットをサポートする統合データローダー、(2) re-IDモデル、および(3)最新のre-ID CNNアーキテクチャの実装とその事前トレーニングモデルを使用して、再現性と将来の研究を促進します。設計に高レベルのモジュール性を備えたTorchreidは、新しいデータセット、CNNモデル、および損失関数に簡単に拡張できる柔軟性を提供します。
Person re-identification (re-ID), which aims to re-identify people across different camera views, has been significantly advanced by deep learning in recent years, particularly with convolutional neural networks (CNNs). In this paper, we present Torchreid, a software library built on PyTorch that allows fast development and end-to-end training and evaluation of deep re-ID models. As a general-purpose framework for person re-ID research, Torchreid provides (1) unified data loaders that support 15 commonly used re-ID benchmark datasets covering both image and video domains, (2) streamlined pipelines for quick development and benchmarking of deep re-ID models, and (3) implementations of the latest re-ID CNN architectures along with their pre-trained models to facilitate reproducibility as well as future research. With a high-level modularity in its design, Torchreid offers a great flexibility to allow easy extension to new datasets, CNN models and loss functions.