arXiv reaDer
項目応答理論を用いて設計された顔認識能力テスト
Face Identification Proficiency Test Designed Using Item Response Theory
適用シナリオで顔識別タスクを実行するプロの法医学的顔検査官やその他の人々が正確で一貫したパフォーマンスを確保するには、顔識別能力の測定が不可欠です。現在の習熟度テストは刺激項目の静的なセットに依存しているため、同じ個人に複数回有効に実施することはできません。習熟度テストを作成するには、「既知の」難易度の多数の項目を組み立てる必要があります。アイテムのサブセットを使用して、同じ難易度の複数のテストを作成できます。 Triad Identity Matching (TIM) テストを導入し、項目応答理論 (IRT) を使用して評価します。参加者は、顔画像の「トライアド」(N=225) (1 つのアイデンティティの 2 つの画像、別のアイデンティティの 1 つの画像) を表示し、別のアイデンティティを選択します。実験 1 では、大学生 (N=197) が TIM テストで幅広い精度を示し、IRT モデリングは、TIM 項目がさまざまな難易度レベルにまたがることを示しました。実験 2 では、IRT ベースのアイテム メトリクスを使用して、テストを特定の問題のサブセットに分割しました。シミュレーションは、TIM アイテムのサブセットが被験者の能力の信頼できる推定値をもたらすことを示しました。実験 3a と 3b では、学生由来の IRT モデルが学生以外の参加者の能力を確実に評価し、その能力がさまざまなテスト セッションで一般化されていることがわかりました。実験 3c では、TIM テストのパフォーマンスが他の一般的な顔認識テストと相関することを示しています。要約すると、TIM テストは、さまざまな能力レベル (専門家または顔処理障害のある集団など) の習熟度を測定するために柔軟で調整されたフレームワークを開発するための出発点を提供します。
Measures of face-identification proficiency are essential to ensure accurate and consistent performance by professional forensic face examiners and others who perform face-identification tasks in applied scenarios. Current proficiency tests rely on static sets of stimulus items, and so, cannot be administered validly to the same individual multiple times. To create a proficiency test, a large number of items of "known" difficulty must be assembled. Multiple tests of equal difficulty can be constructed then using subsets of items. We introduce the Triad Identity Matching (TIM) test and evaluate it using Item Response Theory (IRT). Participants view face-image "triads" (N=225) (two images of one identity, one image of a different identity) and select the different identity. In Experiment 1, university students (N=197) showed wide-ranging accuracy on the TIM test, and IRT modeling demonstrated that the TIM items span various difficulty levels. In Experiment 2, we used IRT-based item metrics to partition the test into subsets of specific difficulties. Simulations showed that subsets of the TIM items yielded reliable estimates of subject ability. In Experiments 3a and 3b, we found that the student-derived IRT model reliably evaluated the ability of non-student participants and that ability generalized across different test sessions. In Experiment 3c, we show that TIM test performance correlates with other common face-recognition tests. In summary, the TIM test provides a starting point for developing a framework that is flexible and calibrated to measure proficiency across various ability levels (e.g., professionals or populations with face-processing deficits).
updated: Tue Aug 09 2022 22:03:01 GMT+0000 (UTC)
published: Tue Jun 22 2021 22:37:32 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト