27. August 2011

Was suche ich, und warum so viel?

Sie heißen nicht umsonst Suchmaschinen, denn würde man etwas finden, würden sie wohl Findemaschinen heißen. Die Suche ist ihr Metier, ob man etwas findet ist nebensächlich. Suchet, so werdet ihr finden, gilt auch bei ihnen, aber möglicherweise wird etwas ganz anderes gefunden, als dem Suchenden in den Sinn kam. So erging es mir, als ich eine Datei cables.csv nebst sehr leicht zu findenden Paßwort (Der Freitag) suchte. Ich wollte schlichtweg einen Beleg für diese kühn behauptete journalistische These. Beweisen kann ich es nicht, auch wenn mittlerweile die TAZ die gleiche Behauptung aufstellt. Reiner Metzger nimmt im bevorzugten Medienpartner von Openleaks Stellung zu der großen Sicherheitslücke bei wikileaks (Der Freitag). Metzger macht es sich einfach, schreibt schlichtweg beim Freitag ab und dichtete einige Dinge so hinzu, daß auch TAZ-Leser nichts verstehen.

Es handelt sich um eine 1,73 Gigabyte große Datei mit Namen "cables.csv". Darin sind verschlüsselt 250.000 an Wikileaks übergebene Depeschen des US-Außenministeriums enthalten.

Ob eine Blick in die Kugel oder die Bingo-Suche, der Blick in die geheimen Kabel bleibt mir versperrt, weil sie nicht gefunden werden, diese 1,73 Gigabyte.

Nunja, möglicherweise gibt es sie, möglicherweise auch nicht. Das kann nur der Erdfinder der These selber schlüssig beantworten. Ich kann allerdings ein klein wenig Wissen aus meinem Computerleben preisgeben. Dieses Wissen begrenze ich mal auf Dateiendungen und Verschlüsselungsverfahren, immerhin begleiten mich die seit genau 20 Jahren und 2 Monaten. Im Juni 1991 hatte ich meinen letzten Fehlkauf in Computerhardware. Das war ein 286er für 2.500 DM, obwohl es bereits 386er ohne Coprozessor für 3.000 Ocken gab. Ein halbes Jahr später steckte dann ein 486er Board im Gehäuse, dessen SX-Prozessor mittels eines bei Conrad erworbenen Quartzes von 25 auf 30 MHz beschleunigt wurde, was ihn zu einer raketengetriebenen Verschlüsselungsmaschine für CSV-Dateien machte. Seitedem schraube ich mir meine Rechenknechte lieber selber zusammen. da weiß ich was ich habe. Und, was ich falsch gemacht habe. Meistens nur die Grafikkarte, da ist die billigste für mich ausreichend. Im übrigen, als es noch keine Grafikkarten gab, z.B. 1972, da konnte ich die Verarbeitungsschritte des Computers an der binären Lichtorgel ablesen. So schnell war der nicht.

Ja, csv ist nichts weiter als eine Dateiendung, die angibt, daß mit einem hohen Grad an Wahrscheinlichkeit der Dateiinhalt kommaseparierte Werte sind. Mehr nicht. Diese CSV-Datei kann dann mit einem Textlister, Schreibprogramm, Tabellenkalkulation oder Datenbank geöffnet werden. Je nach Funktionsumfang und Leistungsfähigkeit sind dann sicherlich Optionen möglich, wie die Werte dargestellt oder sogar verarbeitet werden können. Für gewöhnlich stecken in einer CSV-Daten, die tabellarisch dargestellt werden können. Prinzipiell könnte man jede Datei in CSV umbenennen, dann handelt man sich allerdings große Probleme ein. Wenn ich mich recht entsinne, dann war dies bei OS/2 etwas anders, denn dort handelte es sich um Dateiobjekte, eine Dateiendung war der Bequemlichkeit halber auch möglich, allerdings nicht zwingend. Aber ich schweife ab.

Wenn ich also Text und Zahlen in einer kommaseparierten Datei mit der Endung CSV habe und diese verschlüsseln möchte, dann habe ich mehrere Möglichkeiten. Ich kann ein Archivprogramm mit integrierter Verschlüsselung benutzen, ein Archivprogramm mit anschließender Verschlüsselung, Ein Verschlüsselungsprogramm mit anschließender Komprimierung usw. Je nach Beleben und Fähigkeiten.

Greife ich mir als Beipiele RAR und ZIP, die beide Verschlüsselung bieten. Die Daten werden komprimiert und anschließend auch noch verschlüsselt, alles in einem Rutsch und mit einem journalistischen Nachteil. Die Dateiendungen lauten anschließend in so ziemlich allen Betriebssystemem RAR oder ZIP. Ähnliche Effekte haben ähnliche Werkzeuge unter Linux, ob tar, bzip oder gzip, das ist wurscht. Am Ende der Datenbehandlung steht keinesfalls eine CSV-Datei.

Nun gut, dann ebend ein originäres Verschlüsselungsprogramm. Da ist der Sachverhalt ähnlich. Die Dateiendungen werden so gewählt, daß darauf geschlossen werden kann, der Dateiinhalt sei verschlüsselt. Mir ist in den vergangen 20 Jahren nicht untergekommen, daß eine der o.g. Dateioperationen eine wellknown Dateiendung wie CSV fabrizierte. Es sei denn die folgende

Eingabe cables_original.csv --> Verschlüsselung --> Ausgabe cables.csv

Wer sowas macht ist doof.

Also Herr Metzger, da sie ihren Beitrag mit dem oben erwähnten Zitat begannen, habe ich mir erlaubt, das Lesen an dieser Stelle abzubrechen, da diese Aussage fundamentale Unkenntnis über die simpelsten Computersachverhalte offenbart. Sie können versichert sein, für solchen Datenmüll der Taz zahl ich nicht, habe ich nie gezahlt und werde auch nie zahlen. Verarschen sie ruhig weiter ihre Kundschaft. Ich bin außen vor.

[update 28.08.]

Da hilft die Sicht auf wesentliche Details auch nicht weiter, wenn das große und Ganze den bach runtergegangen ist.

[/update]