arXiv reaDer
GazeGNN: 胸部 X 線分類のための視線誘導グラフ ニューラル ネットワーク
GazeGNN: A Gaze-Guided Graph Neural Network for Chest X-ray Classification
アイトラッキングの研究は、人間が視覚世界とどのように対話するかを理解するのに役立つため、コンピュータビジョンにおいて重要です。特に医療画像処理などの高リスクの用途では、視線追跡は、放射線科医やその他の医療専門家が診断や臨床の目的で画像をどのように検索、分析、解釈するかを理解するのに役立ちます。したがって、疾患分類における視線追跡技術の応用は、近年ますます人気が高まっています。現代の作品は通常、視線追跡デバイスによって収集された視線情報を視覚的注意マップ (VAM) に変換して、学習プロセスを監視します。ただし、これは時間のかかる前処理ステップであるため、放射線科医の日常業務に視線追跡を適用することができなくなります。この問題を解決するために、VAM に変換せずに生の視線データを活用する新しい視線誘導グラフ ニューラル ネットワーク (GNN)、GazeGNN を提案します。 GazeGNN では、視線を画像分類に直接統合するために、画像と視線パターン情報の両方をモデル化する統一表現グラフを作成します。この利点により、私たちは文献で初めて、リアルタイムで現実世界のエンドツーエンドの疾患分類アルゴリズムを開発しました。この成果は、リアルタイム視線追跡技術を放射線科医の日常業務に統合することの実用性と実現可能性を実証しています。私たちの知る限り、GazeGNN は、画像と視線データを統合するために GNN を採用した最初の作品です。公開胸部 X 線データセットに対する私たちの実験では、私たちが提案した方法が既存の方法と比較して最高の分類パフォーマンスを示すことがわかりました。コードは利用可能です。
Eye tracking research is important in computer vision because it can help us understand how humans interact with the visual world. Specifically for high-risk applications, such as in medical imaging, eye tracking can help us to comprehend how radiologists and other medical professionals search, analyze, and interpret images for diagnostic and clinical purposes. Hence, the application of eye tracking techniques in disease classification has become increasingly popular in recent years. Contemporary works usually transform gaze information collected by eye tracking devices into visual attention maps (VAMs) to supervise the learning process. However, this is a time-consuming preprocessing step, which stops us from applying eye tracking to radiologists' daily work. To solve this problem, we propose a novel gaze-guided graph neural network (GNN), GazeGNN, to leverage raw eye-gaze data without being converted into VAMs. In GazeGNN, to directly integrate eye gaze into image classification, we create a unified representation graph that models both images and gaze pattern information. With this benefit, we develop a real-time, real-world, end-to-end disease classification algorithm for the first time in the literature. This achievement demonstrates the practicality and feasibility of integrating real-time eye tracking techniques into the daily work of radiologists. To our best knowledge, GazeGNN is the first work that adopts GNN to integrate image and eye-gaze data. Our experiments on the public chest X-ray dataset show that our proposed method exhibits the best classification performance compared to existing methods. The code is available.
updated: Thu Jun 29 2023 01:03:20 GMT+0000 (UTC)
published: Mon May 29 2023 17:01:54 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト