エンドツーエンドの学習システムの新しいプリミティブ操作として、Limited Multi-Label(LML)プロジェクションレイヤーを提案します。 LMLレイヤーは、正確にk個のラベルを持つことに限定されたマルチラベル予測をモデル化する確率的な方法を提供します。このレイヤーの効率的なフォワードパスとバックワードパスを導出し、不完全なラベル情報を持つマルチラベルタスクのtop-kリコールを最適化するためにレイヤーを使用する方法を示します。 top-k CIFAR-100分類およびシーングラフ生成でLMLレイヤーを評価します。 LMLレイヤーが無視できる量の計算オーバーヘッドを追加し、モデルの表現能力を厳密に改善し、精度を改善することを示します。また、top-k分類の競合ベースラインとして切り捨てられたtop-kエントロピー法を再検討します。
We propose the Limited Multi-Label (LML) projection layer as a new primitive operation for end-to-end learning systems. The LML layer provides a probabilistic way of modeling multi-label predictions limited to having exactly k labels. We derive efficient forward and backward passes for this layer and show how the layer can be used to optimize the top-k recall for multi-label tasks with incomplete label information. We evaluate LML layers on top-k CIFAR-100 classification and scene graph generation. We show that LML layers add a negligible amount of computational overhead, strictly improve the model's representational capacity, and improve accuracy. We also revisit the truncated top-k entropy method as a competitive baseline for top-k classification.