Anti-Twin ... und der kleine Unterschied

Ähnliche Datei-Inhalte
Bildvergleich nach Pixeln

Ähnliche Datei-Inhalte (binär)

Wenn Anti-Twin nicht nur Vollduplikate, sondern auch sich ähnelnde Dateien finden soll, kann die gewünschte Mindest-Übereinstimmung von standardmäßig 100% auf bis zu 60% herabgesetzt werden. Diese Funktion ist speziell dafür gedacht, nahezu gleiche Dateien zu finden, bei denen vielleicht nur eine Kleinigkeit geändert wurde.
Die Ähnlichkeitssuche wird von Anti-Twin angewendet, sobald man einen Wert unter 100% eingibt. Die Suche mit dem Ähnlichkeitsvergleich dauert sehr viel länger als die 100%-Vollduplikat-Suche!

Leider ist der Ähnlichkeitssuche beim Byte-für-Byte-Vergleich nur bei einigen wenigen Dateitypen sinnvoll. Eine Ähnlichkeit kann nämlich nur bei unkomprimierten und unverschlüsselten Dateien festgestellt werden. Unkomprimierte Dateien sind z.B. unformatierte Texte (.TXT) und HTML.

Bei MP3s (komprimiert!) macht der Ähnlichkeitsvergleich nur Sinn, wenn man in einer identischen Dateikopie nur den MP3-ID-Tag (interner Songtitel und Künstler) geändert hat. Aber für MP3s mit dem gleichen Lied, in denen z.B. die Samplingrate, Lautstärke oder Länge unterschiedlich sind, funktioniert die Ähnlichkeitssuche leider gar nicht.

Auch Office-Dokumente, wie z.B. Word/Writer oder Excel/Calc, ändern sofort großflächig ihren binären Inhalt, sobald im Dokument auch nur ein Buchstabe geändert wurde. Auch hier hat Anti-Twin in der Regel leider kaum eine Chance eine Ähnlichkeit zu erkennen.

Warnung (speziell zum Ähnlichkeitsvergleich)
Bitte prüfen Sie ähnliche Dateien vor dem Löschen noch sorgfältiger, als Sie es ohnehin schon tun sollten. Denn nach der Ähnlichkeitssuche werden Dateien aufgelistet, die nicht vollständig identisch sind, also keine echten Duplikate/Kopien sind.


Bildvergleich nach Pixeln

   
 
Aktivieren Sie die Option „Bilder vergleichen“, um nach ähnlichen Fotos zu suchen. Anti-Twin öffnet/dekomprimiert dann jedes Bild und vergleicht die enthaltenen Pixel (Bildpunkte) aller Bilder miteinander.

Dahingegen werden beim herkömmlichen Byte-für-Byte-Vergleich die Dateien nicht wie Bilder, sondern völlig ohne Interpretation als nichtssagende binäre Folge von Bytes angesehen. Dann ist es Anti-Twin nicht möglich ein Foto als ähnlich zu erkennen, wenn es z.B. in zwei Dateien mit unterschiedlicher Kompressionsrate (Bildqualität) oder in unterschiedlichen Dateiformaten (JPG, GIF, BMP, TIFF etc.) gespeichert ist. Aber mit dem Pixelvergleich funktioniert das!

Systemvoraussetzung: Damit Anti-Twin Bilder aus verschiedenen Grafikformaten lesen kann, wird Microsofts Funktionsbibliothek GDI+ benötigt, die standardmäßig ab Windows XP enthalten ist. Für ältere Windows-Versionen läßt sich GDI+ nachträglich installieren.

Vergleichstechnik: Es war technisch nötig den Bildervergleich in Anti-Twin so zu programmieren, dass nur eine unscharfe Ähnlichkeit erkannt wird. Denn durch verschiedene Bildformate und Kompressionen unterscheiden sich die Pixel immer etwas, selbst wenn dies eigentlich gar nicht gewollt ist (z.B. durch Farbreduktion oder Kompressionsartefakte). Anti-Twin ist beim Pixelvergleich deshalb extra ungenau und sogar farbenblind. Zudem ignoriert Anti-Twin bei Grafikdateien die Größe - sowohl die Dateigröße als auch die Breite und Höhe in Pixeln. Daraus folgt leider eine gewisse Unzuverlässigkeit im Ergebnis.

Warnung (zur Bildersuche)
Aufgrund des o.g. unscharfen Vergleichs und der daraus folgenden Unzuverlässigkeit, sollten Sie beim Löschen von ähnlichen Grafiken extrem vorsichtig sein. Bitte prüfen Sie die gefundenen Ergebnisse immer auch noch manuell, d.h. durch einzelnes Öffnen der aufgelisteten Bilder.




AIDeX Twins