科学出版物での画像の操作と再利用は、現在スケーラブルなソリューションを欠いている懸念される問題です。学習ベースのアプローチのための圧倒的なターゲットデータセットの可用性にもかかわらず、画像の重複を検出するための現在のツールは、ほとんど手動または半自動です。このホワイトペーパーでは、2つの画像が与えられた場合、一方がコピー、回転、平行移動、スケール、透視変換、ヒストグラム調整、または部分消去によって他方の操作バージョンであるかどうかを判断する問題に対処します。 3分岐シャム畳み込みニューラルネットワークに基づくデータ駆動型ソリューションを提案します。 ConvNetモデルは、重複する画像間のユークリッド距離が1以下であり、一意の画像間の距離が1より大きい128次元空間に画像をマッピングするようにトレーニングされています。このようなアプローチには、画像操作に関する公開済みおよび査読済みの文献の監視を改善する可能性。
Manipulation and re-use of images in scientific publications is a concerning problem that currently lacks a scalable solution. Current tools for detecting image duplication are mostly manual or semi-automated, despite the availability of an overwhelming target dataset for a learning-based approach. This paper addresses the problem of determining if, given two images, one is a manipulated version of the other by means of copy, rotation, translation, scale, perspective transform, histogram adjustment, or partial erasing. We propose a data-driven solution based on a 3-branch Siamese Convolutional Neural Network. The ConvNet model is trained to map images into a 128-dimensional space, where the Euclidean distance between duplicate images is smaller than or equal to 1, and the distance between unique images is greater than 1. Our results suggest that such an approach has the potential to improve surveillance of the published and in-peer-review literature for image manipulation.