arXiv reaDer
プライベートアイ:ビデオ会議での眼鏡反射によるテキスト画面のピークの限界について
Private Eye: On the Limits of Textual Screen Peeking via Eyeglass Reflections in Video Conferencing
COVID-19が、対面式の会議や電話から、日常のコミュニケーションや機密性の高いビジネスのためのビデオ会議へと大きく変化した後、個人的なビデオ会議は新しい標準になりました。眼鏡やその他の反射物が無意識のうちに画面の一部のコンテンツを公開するため、ビデオは参加者の画面上の情報を漏らします。数学的モデリングと人間の被験者の実験を使用して、この研究では、新しいWebカメラがWebカメラによってキャプチャされた眼鏡の反射から光る認識可能なテキスト情報をリークする可能性がある範囲を調査します。私たちの仕事の主な目標は、ウェブカメラテクノロジーが将来進化するにつれて、認識可能性の要因、制限、およびしきい値を測定、計算、および予測することです。私たちの仕事は、ビデオフレームのシーケンスでマルチフレーム超解像技術を使用して、光攻撃に基づいて実行可能な脅威モデルを調査し、特徴づけます。私たちの実験結果とモデルは、720p Webカメラを使用して、高さが10mm程度の画面上のテキストを再構築して認識することができることを示しています。さらに、この脅威モデルをさまざまな攻撃者機能を備えたWebテキストコンテンツに適用して、テキストが認識可能になるしきい値を見つけます。 20人の参加者を対象としたユーザー調査によると、攻撃者がビッグフォントのWebサイトでテキストコンテンツを再構築するには、現在の720pWebカメラで十分であることがわかります。私たちのモデルはさらに、4Kカメラへの進化により、人気のあるWebサイトのほとんどのヘッダーテキストの再構築にテキスト漏洩のしきい値が下がることを示しています。私たちの調査は、短期的な緩和策を提案し、この攻撃に対する長期的な防御のための最小特権の原則に従うことの重要性を正当化します。プライバシーに敏感なシナリオでは、デフォルトですべてのオブジェクトをぼかすテクノロジーを開発し、自然に見える会話を容易にするために絶対に必要なものだけをぼかさないようにすることをさらにお勧めします。
Personal video conferencing has become the new norm after COVID-19 caused a seismic shift from in-person meetings and phone calls to video conferencing for daily communications and sensitive business. Video leaks participants' on-screen information because eyeglasses and other reflective objects unwittingly expose partial screen contents. Using mathematical modeling and human subjects experiments, this research explores the extent to which emerging webcams might leak recognizable textual information gleamed from eyeglass reflections captured by webcams. The primary goal of our work is to measure, compute, and predict the factors, limits, and thresholds of recognizability as webcam technology evolves in the future. Our work explores and characterizes the viable threat models based on optical attacks using multi-frame super resolution techniques on sequences of video frames. Our experimental results and models show it is possible to reconstruct and recognize on-screen text with a height as small as 10 mm with a 720p webcam. We further apply this threat model to web textual content with varying attacker capabilities to find thresholds at which text becomes recognizable. Our user study with 20 participants suggests present-day 720p webcams are sufficient for adversaries to reconstruct textual content on big-font websites. Our models further show that the evolution toward 4K cameras will tip the threshold of text leakage to reconstruction of most header texts on popular websites. Our research proposes near-term mitigations, and justifies the importance of following the principle of least privilege for long-term defense against this attack. For privacy-sensitive scenarios, it's further recommended to develop technologies that blur all objects by default, then only unblur what is absolutely necessary to facilitate natural-looking conversations.
updated: Sun May 08 2022 23:29:13 GMT+0000 (UTC)
published: Sun May 08 2022 23:29:13 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト