arXiv reaDer
胸部X線ラジオグラフィーにおけるマルチタスク臓器セグメンテーションと骨抑制のための画像から画像への変換
Image to Images Translation for Multi-Task Organ Segmentation and Bone Suppression in Chest X-Ray Radiography
 胸部X線撮影は、最も初期の医療画像技術の1つであり、肺と心臓に関連する疾患の診断、スクリーニング、および治療のフォローアップに最も広く使用されているものの1つです。この研究分野の文献は、骨抑制と臓器セグメンテーションの困難なタスクを扱っているが、別々に実行され、両方のプロセスを最適化できるパラメータの統合に伴う学習を制限する多くの興味深い研究を報告しています。この研究は、初めて、骨抑制画像と臓器セグメント画像を同時に生成するマルチタスクディープラーニングモデルを導入し、タスクの精度を高め、モデルに必要なパラメーターの数を最小限に抑え、処理時間を最適化します、すべてネットワークタスク間の相互作用を利用して、両方のタスクのパフォーマンスを向上させます。条件付きの生成的敵対ネットワークに依存するこのモデルのアーキテクチャ設計は、確立されたpix2pixネットワーク(image-to-imageネットワーク)がマルチタスクの必要性に合わせてどのように変更され、新しいイメージに拡張されるかに関するプロセスを明らかにします-to-imagesアーキテクチャ。このマルチタスクモデルの開発されたソースコードは、2タスクpix2pix拡張機能を提供するための最初の試みとしてGithubで公開されています。これは、多くのマルチタスクアプリケーションで役立つ監視/ペア/整列/登録済みの画像から画像への変換です。拡張された畳み込みは、より効果的な受容野の評価を通じて結果を改善するためにも使用されます。有効性を評価し、提案されたアプローチのメリットを評価するために、最新のアルゴリズムとアブレーション研究およびデモンストレーションビデオとの比較が提供されています。
Chest X-ray radiography is one of the earliest medical imaging technologies and remains one of the most widely-used for diagnosis, screening, and treatment follow up of diseases related to lungs and heart. The literature in this field of research reports many interesting studies dealing with the challenging tasks of bone suppression and organ segmentation but performed separately, limiting any learning that comes with the consolidation of parameters that could optimize both processes. This study, and for the first time, introduces a multitask deep learning model that generates simultaneously the bone-suppressed image and the organ-segmented image, enhancing the accuracy of tasks, minimizing the number of parameters needed by the model and optimizing the processing time, all by exploiting the interplay between the network parameters to benefit the performance of both tasks. The architectural design of this model, which relies on a conditional generative adversarial network, reveals the process on how the well-established pix2pix network (image-to-image network) is modified to fit the need for multitasking and extending it to the new image-to-images architecture. The developed source code of this multitask model is shared publicly on Github as the first attempt for providing the two-task pix2pix extension, a supervised/paired/aligned/registered image-to-images translation which would be useful in many multitask applications. Dilated convolutions are also used to improve the results through a more effective receptive field assessment. The comparison with state-of-the-art algorithms along with ablation study and a demonstration video are provided to evaluate efficacy and gauge the merits of the proposed approach.
updated: Tue Dec 31 2019 18:59:21 GMT+0000 (UTC)
published: Mon Jun 24 2019 17:12:31 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト