マルチモーダルな事実検証は、ニュース コンテンツの誤報におけるテキストと画像の不一致により、ソーシャル メディアで重要かつ困難な問題になりました。近年、ニュースの真実性を特定するためにクロス モダリティを考慮することで対処されています。 .このホワイトペーパーでは、軽量化パラメーターを使用した細粒度テキストと入力埋め込みをモデル化するための新しいパラメーター効率の高い基盤モデル、同じおよび異なるモダリティの関係をキャプチャするだけでなく、また、さまざまなタイプ (つまり、クレームとドキュメント)、および各サンプルのメタデータを明示的に提供するための機能表現。さらに、トレーニングされた各モデルの重要度を重みだけでなくパワーで調整することにより、モデルのパフォーマンスを向上させる統一アンサンブル法を導入します。広範な実験により、Pre-CoFactv2 は Pre-CoFact よりも大幅に優れており、AAAI 2023 の Factify チャレンジで新しい最先端の結果を達成したことが示されています。モデルのバリエーションをさらに示して、さまざまなコンポーネントの相対的な寄与を検証します。私たちのチームが優勝し (F1 スコア: 81.82%)、コードを https://github.com/wwweiwei/Pre-CoFactv2-AAAI-2023 で公開しました。
Multi-modal fact verification has become an important but challenging issue on social media due to the mismatch between the text and images in the misinformation of news content, which has been addressed by considering cross-modalities to identify the veracity of the news in recent years. In this paper, we propose the Pre-CoFactv2 framework with new parameter-efficient foundation models for modeling fine-grained text and input embeddings with lightening parameters, multi-modal multi-type fusion for not only capturing relations for the same and different modalities but also for different types (i.e., claim and document), and feature representations for explicitly providing metadata for each sample. In addition, we introduce a unified ensemble method to boost model performance by adjusting the importance of each trained model with not only the weights but also the powers. Extensive experiments show that Pre-CoFactv2 outperforms Pre-CoFact by a large margin and achieved new state-of-the-art results at the Factify challenge at AAAI 2023. We further illustrate model variations to verify the relative contributions of different components. Our team won the first prize (F1-score: 81.82%) and we made our code publicly available at https://github.com/wwweiwei/Pre-CoFactv2-AAAI-2023.