最近の研究では、うつ病は人間の顔の属性から部分的に反映される可能性があることが示されています。顔の属性にはさまざまなデータ構造があり、さまざまな情報が含まれているため、既存のアプローチでは、それぞれからうつ病関連の特徴を抽出する最適な方法を具体的に検討することはできず、最良の融合戦略を調査することもできません。この論文では、複数の顔属性ベースのうつ病認識のための最適なモデルを設計するためのニューラルアーキテクチャ検索(NAS)技術を拡張することを提案します。これは、小さなデータセットに効率的かつ堅牢に実装できます。私たちのアプローチは、最初に各顔属性の特徴抽出器へのウォームアップステップを実行し、検索スペースを大幅に削減し、カスタマイズされたアーキテクチャを提供することを目的としています。各特徴抽出器は、畳み込みニューラルネットワーク(CNN)またはグラフニューラルネットワーク(GNN)のいずれかです。 。次に、すべての特徴抽出器と融合ネットワークに対してエンドツーエンドのアーキテクチャ検索を実行し、補完的なうつ病の手がかりをより少ない冗長性で最適に組み合わせることができるようにします。 AVEC 2016データセットの実験結果は、私たちのアプローチによって調査されたモデルが、既存の最先端技術に比べて27%および30%のRMSEおよびMAEの改善により、画期的なパフォーマンスを達成することを示しています。これらの調査結果に照らして、このペーパーは、NASを時系列のデータベースのメンタルヘルス分析に適用するための確かな証拠と強力なベースラインを提供します。
Recent studies show that depression can be partially reflected from human facial attributes. Since facial attributes have various data structure and carry different information, existing approaches fail to specifically consider the optimal way to extract depression-related features from each of them, as well as investigates the best fusion strategy. In this paper, we propose to extend Neural Architecture Search (NAS) technique for designing an optimal model for multiple facial attributes-based depression recognition, which can be efficiently and robustly implemented in a small dataset. Our approach first conducts a warmer up step to the feature extractor of each facial attribute, aiming to largely reduce the search space and providing customized architecture, where each feature extractor can be either a Convolution Neural Networks (CNN) or Graph Neural Networks (GNN). Then, we conduct an end-to-end architecture search for all feature extractors and the fusion network, allowing the complementary depression cues to be optimally combined with less redundancy. The experimental results on AVEC 2016 dataset show that the model explored by our approach achieves breakthrough performance with 27% and 30% RMSE and MAE improvements over the existing state-of-the-art. In light of these findings, this paper provides solid evidences and a strong baseline for applying NAS to time-series data-based mental health analysis.