音響振動を利用して中身のイメージを再現するラジカセをご紹介します。オブジェクトがコンテナと相互作用すると、小さな音響振動が発生します。正確な振動特性は、ボックスとオブジェクトの物理的特性によって異なります。視覚構造を予測するために、この偶発的な信号を使用する方法を示します。学習後、カメラが箱の中を見ることができない場合でも、私たちのアプローチは効果的です。低コストで低電力のコンタクトマイクを使用して振動を検出していますが、結果は、マルチモーダルデータから学習することで、安価な音響センサーを豊富な視覚センサーに変換できることを示しています。コンテナは広く普及しているため、知覚機能をコンテナに統合することで、人間とコンピュータの相互作用やロボット工学における新しいアプリケーションが可能になると考えています。私たちのプロジェクトのウェブサイトは次のとおりです:boombox.cs.columbia.edu
We introduce The Boombox, a container that uses acoustic vibrations to reconstruct an image of its inside contents. When an object interacts with the container, they produce small acoustic vibrations. The exact vibration characteristics depend on the physical properties of the box and the object. We demonstrate how to use this incidental signal in order to predict visual structure. After learning, our approach remains effective even when a camera cannot view inside the box. Although we use low-cost and low-power contact microphones to detect the vibrations, our results show that learning from multi-modal data enables us to transform cheap acoustic sensors into rich visual sensors. Due to the ubiquity of containers, we believe integrating perception capabilities into them will enable new applications in human-computer interaction and robotics. Our project website is at: boombox.cs.columbia.edu