機械学習モデルのトレーニングと評価を繰り返すことは、パフォーマンスを向上させるための重要なプロセスです。ただし、教育可能なインターフェイスにより、目の不自由なユーザーは、視覚障害のあるユーザーが独自の環境で撮影した写真を使用してオブジェクト認識エンジンをトレーニングおよびテストできますが、トレーニングの反復および評価手順のアクセシビリティはほとんど注目されていません。反復は、目の不自由なユーザーにはアクセスできないトレーニング写真の目視検査を前提としています。 MyCam は、ユーザーのトレーニング セット内の写真への非視覚的アクセス用に自動的に推定される記述子を組み込んだモバイル アプリです。盲目の参加者 (N = 12) が自宅での評価研究を通じて、MyCam および記述子とどのように対話するかを調べます。リアルタイムの写真レベル記述子により、目の不自由なユーザーがトリミングされたオブジェクトを含む写真を減らすことができること、および参加者がトレーニングセットの品質を反復してアクセスすることにより、さらにバリエーションを追加できることを示します。また、参加者はアプリが使いやすく、効果的にトレーニングでき、記述子が有用であることを示していると感じました。ただし、主観的な反応はモデルのパフォーマンスに反映されませんでした。これは、部分的にトレーニングのバリエーションが少なく、背景が雑然としているためです。
Iteration of training and evaluating a machine learning model is an important process to improve its performance. However, while teachable interfaces enable blind users to train and test an object recognizer with photos taken in their distinctive environment, accessibility of training iteration and evaluation steps has received little attention. Iteration assumes visual inspection of the training photos, which is inaccessible for blind users. We explore this challenge through MyCam, a mobile app that incorporates automatically estimated descriptors for non-visual access to the photos in the users' training sets. We explore how blind participants (N=12) interact with MyCam and the descriptors through an evaluation study in their homes. We demonstrate that the real-time photo-level descriptors enabled blind users to reduce photos with cropped objects, and that participants could add more variations by iterating through and accessing the quality of their training sets. Also, Participants found the app simple to use indicating that they could effectively train it and that the descriptors were useful. However, subjective responses were not reflected in the performance of their models, partially due to little variation in training and cluttered backgrounds.