arXiv reaDer
軽量の All-ConvNet と転移学習を活用した表面 EMG ベースのセッション間/被験者間のジェスチャ認識
Surface EMG-Based Inter-Session/Inter-Subject Gesture Recognition by Leveraging Lightweight All-ConvNet and Transfer Learning
低解像度の瞬間的な HD-sEMG 画像を使用したジェスチャ認識は、より滑らかで自然な筋肉とコンピューターのインターフェイスの開発に新たな道を開きます。ただし、セッション間シナリオと被験者間シナリオ間のデータのばらつきが大きな課題となります。既存のアプローチでは、非常に大規模で複雑なディープ ConvNet または 2SRNN ベースのドメイン適応手法を使用して、セッション間および被験者間のデータ変動によって引き起こされる分布シフトを近似しました。したがって、これらの方法では、事前トレーニング段階と適応段階の両方で、数百万を超えるトレーニング パラメーターと、事前トレーニングされたターゲット ドメインの大規模なデータセットを学習する必要もあります。その結果、ハイエンドのリソースは制限され、リアルタイム アプリケーションでの展開には計算コストが非常に高くなります。この問題を解決するために、軽量の All-ConvNet と転移学習 (TL) を活用して、セッション間および被験者間のジェスチャ認識パフォーマンスを強化する軽量の All-ConvNet+TL モデルを提案します。 All-ConvNet+TL モデルは、畳み込み層のみで構成されます。これは、セッション間および被験者間のデータ変動によって引き起こされる分布の変化に対処するために、不変表現と識別表現を学習するためのシンプルかつ効率的なフレームワークです。 4 つのデータセットでの実験は、私たちが提案した方法が最も複雑な既存のアプローチを大幅に上回り、セッション間および被験者間のシナリオで最先端の結果を達成し、セッション内のジェスチャ認識で同等または競合するパフォーマンスを発揮することを示しています。 。これらのパフォーマンス ギャップは、ターゲット ドメインで適応のために利用できるデータが少量 (たとえば、1 回のトライアル) である場合にはさらに大きくなります。これらの優れた実験結果は、現在の最先端モデルが、sEMG ベースのセッション間および被験者間のジェスチャ認識タスクに対して過剰パラメータ化されている可能性があるという証拠を提供します。
Gesture recognition using low-resolution instantaneous HD-sEMG images opens up new avenues for the development of more fluid and natural muscle-computer interfaces. However, the data variability between inter-session and inter-subject scenarios presents a great challenge. The existing approaches employed very large and complex deep ConvNet or 2SRNN-based domain adaptation methods to approximate the distribution shift caused by these inter-session and inter-subject data variability. Hence, these methods also require learning over millions of training parameters and a large pre-trained and target domain dataset in both the pre-training and adaptation stages. As a result, it makes high-end resource-bounded and computationally very expensive for deployment in real-time applications. To overcome this problem, we propose a lightweight All-ConvNet+TL model that leverages lightweight All-ConvNet and transfer learning (TL) for the enhancement of inter-session and inter-subject gesture recognition performance. The All-ConvNet+TL model consists solely of convolutional layers, a simple yet efficient framework for learning invariant and discriminative representations to address the distribution shifts caused by inter-session and inter-subject data variability. Experiments on four datasets demonstrate that our proposed methods outperform the most complex existing approaches by a large margin and achieve state-of-the-art results on inter-session and inter-subject scenarios and perform on par or competitively on intra-session gesture recognition. These performance gaps increase even more when a tiny amount (e.g., a single trial) of data is available on the target domain for adaptation. These outstanding experimental results provide evidence that the current state-of-the-art models may be overparameterized for sEMG-based inter-session and inter-subject gesture recognition tasks.
updated: Mon Feb 19 2024 23:24:32 GMT+0000 (UTC)
published: Sat May 13 2023 21:47:55 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト