AutoVideo: An Automated Video Action Recognition System
アクション認識は、ビデオを理解するための重要なタスクです。この論文では、自動ビデオアクション認識のためのPythonシステムであるAutoVideoを紹介します。現在、7つのアクション認識アルゴリズムとさまざまな前処理モジュールをサポートしています。モデル動物園のみを提供する既存のライブラリとは異なり、AutoVideoは標準のパイプライン言語で構築されています。基本的な構成要素はプリミティブであり、前処理モジュールまたはアルゴリズムをいくつかのハイパーパラメーターでラップします。 AutoVideoは高度にモジュール化されており、拡張可能です。 AutoMLサーチャーと簡単に組み合わせることができます。パイプライン言語は非常に一般的であるため、将来、他のさまざまなビデオ関連タスクのアルゴリズムでAutoVideoを簡単に強化できます。 AutoVideoは、MITライセンスの下ででリリースされています。
Action recognition is a crucial task for video understanding. In this paper, we present AutoVideo, a Python system for automated video action recognition. It currently supports seven action recognition algorithms and various pre-processing modules. Unlike the existing libraries that only provide model zoos, AutoVideo is built with the standard pipeline language. The basic building block is primitive, which wraps a pre-processing module or an algorithm with some hyperparameters. AutoVideo is highly modular and extendable. It can be easily combined with AutoML searchers. The pipeline language is quite general so that we can easily enrich AutoVideo with algorithms for various other video-related tasks in the future. AutoVideo is released under MIT license at
updated: Mon Aug 09 2021 17:53:32 GMT+0000 (UTC)
published: Mon Aug 09 2021 17:53:32 GMT+0000 (UTC)
