arXiv reaDer
ViTASD: 自閉症スペクトラム障害の顔面診断のためのロバスト ビジョン トランスフォーマー ベースライン
ViTASD: Robust Vision Transformer Baselines for Autism Spectrum Disorder Facial Diagnosis
自閉症スペクトラム障害 (ASD) は、世界中で有病率が非常に高い生涯にわたる神経発達障害です。小児患者の ASD 顔分析の分野における研究の進歩は、十分に確立されたベースラインがないために妨げられてきました。本稿では、小児 ASD の計算解析のためのビジョン トランスフォーマー (ViT) の使用を提案します。 ViTASD として知られる提示されたモデルは、大規模な表情データセットから知識を抽出し、モデル構造の転送可能性を提供します。具体的には、ViTASD はバニラ ViT を使用して患者の顔画像から特徴を抽出し、Gaussian Process レイヤーを備えた軽量のデコーダーを採用して ASD 分析の堅牢性を高めます。標準の ASD 顔分析ベンチマークで実施された広範な実験は、ViTASD-L が新しい最先端技術を達成する一方で、当社の方法が ASD 顔分析の代表的なアプローチのすべてよりも優れていることを示しています。コードと事前トレーニング済みのモデルは、https://github.com/IrohXu/ViTASD で入手できます。
Autism spectrum disorder (ASD) is a lifelong neurodevelopmental disorder with very high prevalence around the world. Research progress in the field of ASD facial analysis in pediatric patients has been hindered due to a lack of well-established baselines. In this paper, we propose the use of the Vision Transformer (ViT) for the computational analysis of pediatric ASD. The presented model, known as ViTASD, distills knowledge from large facial expression datasets and offers model structure transferability. Specifically, ViTASD employs a vanilla ViT to extract features from patients' face images and adopts a lightweight decoder with a Gaussian Process layer to enhance the robustness for ASD analysis. Extensive experiments conducted on standard ASD facial analysis benchmarks show that our method outperforms all of the representative approaches in ASD facial analysis, while the ViTASD-L achieves a new state-of-the-art. Our code and pretrained models are available at https://github.com/IrohXu/ViTASD.
updated: Sat Mar 11 2023 05:22:12 GMT+0000 (UTC)
published: Sun Oct 30 2022 20:38:56 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト