arXiv reaDer
Icentia11K:不整脈サブタイプ発見のための教師なし表現学習データセット
Icentia11K: An Unsupervised Representation Learning Dataset for Arrhythmia Subtype Discovery
  11,000人の患者と20億のラベル付きビートを含む表現学習用の連続生信号の最大の公開ECGデータセットをリリースします。私たちの目標は、半監視されたECGモデルを作成できるようにすることと、不整脈および異常なECG信号イベントの未知のサブタイプを発見することです。この目的のために、半教師ありで評価される教師なし表現学習タスクを提案します。構築可能なさまざまな機能抽出ツールのベースラインのセットを提供します。さらに、不整脈サブタイプの発見における表現学習の可能性を示す既知のサブタイプのクラスタリングを特定する、PCA埋め込みからの結果の定性評価を実行します。
We release the largest public ECG dataset of continuous raw signals for representation learning containing 11 thousand patients and 2 billion labelled beats. Our goal is to enable semi-supervised ECG models to be made as well as to discover unknown subtypes of arrhythmia and anomalous ECG signal events. To this end, we propose an unsupervised representation learning task, evaluated in a semi-supervised fashion. We provide a set of baselines for different feature extractors that can be built upon. Additionally, we perform qualitative evaluations on results from PCA embeddings, where we identify some clustering of known subtypes indicating the potential for representation learning in arrhythmia sub-type discovery.
updated: Mon Oct 21 2019 18:02:36 GMT+0000 (UTC)
published: Mon Oct 21 2019 18:02:36 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト