arXiv reaDer
動的、まばらな、部分的に観測された環境における情報獲得のためのセンサー制御
Sensor Control for Information Gain in Dynamic, Sparse and Partially Observed Environments
我々は、その空間に存在するエンティティに関する情報を最大化する、部分的に観察可能な動的かつまばらにサンプリングされた環境下で情報を収集するための自律センサー制御のアプローチを提案します。無線周波数 (RF) スペクトル監視のタスクに対するアプローチについて説明します。その目的は、環境内の未知の動的信号を検索して追跡することです。この目的を達成するために、私たちは、(1) 新しい情報獲得報酬を使用して、まばらな非定常環境での探索を改善し、(2) 制御空間をスケールアップして、ハイブリッド畳み込み再帰型ニューラル層を使用した、複雑で動的なアクティビティ パターンのモニタリング。また、この問題を、意図した RF スペクトル/フィールドからのサンプリングが制限されている状況にも拡張し、制限されたフィールド サンプリングから反復的に改善されたモデルを介してコントローラーを微調整する、元の RL アルゴリズムのモデルベース バージョンを提案します。さまざまな複雑さの RF 環境をシミュレートした結果は、当社のシステムが標準の DAN アーキテクチャよりも優れており、ベースラインの専門家が設計したエージェントよりも柔軟で堅牢であることを示しています。また、非定常排出環境にも適応できることを示します。
We present an approach for autonomous sensor control for information gathering under partially observable, dynamic and sparsely sampled environments that maximizes information about entities present in that space. We describe our approach for the task of Radio-Frequency (RF) spectrum monitoring, where the goal is to search for and track unknown, dynamic signals in the environment. To this end, we extend the Deep Anticipatory Network (DAN) Reinforcement Learning (RL) framework by (1) improving exploration in sparse, non-stationary environments using a novel information gain reward, and (2) scaling up the control space and enabling the monitoring of complex, dynamic activity patterns using hybrid convolutional-recurrent neural layers. We also extend this problem to situations in which sampling from the intended RF spectrum/field is limited and propose a model-based version of the original RL algorithm that fine-tunes the controller via a model that is iteratively improved from the limited field sampling. Results in simulated RF environments of differing complexity show that our system outperforms the standard DAN architecture and is more flexible and robust than baseline expert-designed agents. We also show that it is adaptable to non-stationary emission environments.
updated: Mon May 22 2023 19:53:33 GMT+0000 (UTC)
published: Thu Nov 03 2022 00:03:14 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト