短いビデオ プラットフォームがニュース共有の重要なチャネルの 1 つになりつつある中、中国の主要な短いビデオ プラットフォームは徐々にフェイク ニュースの新たな繁殖地になっています。しかし、短いビデオに含まれる大量の情報と特徴、およびビデオ間の特徴の均質化と類似性が深刻であるため、短いビデオの噂を区別することは容易ではありません。短いビデオの噂の拡散を軽減するために、私たちのグループは、マルチモーダルな機能融合を構築し、各アルゴリズムの長所と短所を考慮した後、外部の知識を導入することにより、短いビデオの噂を検出することにしました。検出の考え方は次のとおりです。(1) データセットの作成: 複数の機能を備えた短いビデオ データセットを構築します。 (2) マルチモーダル噂検出モデル: まず、TSN (Temporal Segment Networks) ビデオ コーディング モデルを使用してビデオの特徴を抽出します。次に、OCR (光学式文字認識) と ASR (自動文字認識) を使用してビデオの特徴を抽出します。 Recognition) と ASR (Automatic Speech Recognition) を融合してテキストを抽出し、BERT モデルを使用してテキストの特徴とビデオの特徴を融合します (3) 最後に、コントラスト学習を使用して識別を実現します。まず外部知識をクロールし、次にベクトル データベースを使用して外部知識の導入と分類出力の最終的な構造を達成します。私たちの研究プロセスは常に実用的なニーズに向けられており、関連する知識の結果は、短いビデオの噂の特定や社会的意見のコントロールなど、多くの実用的なシナリオで重要な役割を果たします。
With short video platforms becoming one of the important channels for news sharing, major short video platforms in China have gradually become new breeding grounds for fake news. However, it is not easy to distinguish short video rumors due to the great amount of information and features contained in short videos, as well as the serious homogenization and similarity of features among videos. In order to mitigate the spread of short video rumors, our group decides to detect short video rumors by constructing multimodal feature fusion and introducing external knowledge after considering the advantages and disadvantages of each algorithm. The ideas of detection are as follows: (1) dataset creation: to build a short video dataset with multiple features; (2) multimodal rumor detection model: firstly, we use TSN (Temporal Segment Networks) video coding model to extract video features; then, we use OCR (Optical Character Recognition) and ASR (Automatic Character Recognition) to extract video features. Recognition) and ASR (Automatic Speech Recognition) fusion to extract text, and then use the BERT model to fuse text features with video features (3) Finally, use contrast learning to achieve distinction: first crawl external knowledge, then use the vector database to achieve the introduction of external knowledge and the final structure of the classification output. Our research process is always oriented to practical needs, and the related knowledge results will play an important role in many practical scenarios such as short video rumor identification and social opinion control.