マルチモーダル機能を利用したAndroidマルウェア検出用の階層型PerceiverモデルであるMalceiverを提案します。主な入力は、特定のAndroidAPKファイルのオペコードシーケンスと要求された権限です。マルウェア分類の決定に到達するために、モデルは、オペコードシーケンスから抽出された階層的特徴と要求された権限を組み合わせます。モデルのアーキテクチャは、非常に長いオペコードシーケンスを効率的に処理できるようにするPerceiver/PerceiverIOに基づいています。提案されたモデルは、マルチモーダル機能を使用するように簡単に拡張できます。このモデルが、オペコードシーケンスベースのマルウェア検出に関して従来のCNNアーキテクチャよりも優れていることを実験的に示します。次に、追加のモダリティを使用するとパフォーマンスが向上することを示します。私たちが提案するアーキテクチャは、マルウェア研究でTransformerスタイルのネットワークを使用するための新しい道を開きます。
We propose the Malceiver, a hierarchical Perceiver model for Android malware detection that makes use of multi-modal features. The primary inputs are the opcode sequence and the requested permissions of a given Android APK file. To reach a malware classification decision the model combines hierarchical features extracted from the opcode sequence together with the requested permissions. The model's architecture is based on the Perceiver/PerceiverIO which allows for very long opcode sequences to be processed efficiently. Our proposed model can be easily extended to use multi-modal features. We show experimentally that this model outperforms a conventional CNN architecture for opcode sequence based malware detection. We then show that using additional modalities improves performance. Our proposed architecture opens new avenues for the use of Transformer-style networks in malware research.