5. März 2023

Hitlertagebücher NDR download (chrome headless)

Laszlo Buring: Sweet Child o' Mine, if it were written by Dire Straits
-----
Vorweg eines, zur Einordnung, wie es sich heute gehört, wenn man das Datenbank-Interface des NDR mit den Hitlertagebüchern aufruft.

Alles was man über Louis Klamroth wissen muß.

Ein Großmaul, das sich darüber aufregt, dass man „Lügenpresse“ sagt, aber selbst nicht weiß, dass er nicht zur Presse gehört. Man hätte ihm sagen müssen „Nein, sondern des Lügenrundfunks“. Wie im Rundfunk gelogen wird, wurde oft beschrieben, auch, dass die da fast alle politisch einseitig sind und den Rundfunk zur Propaganda einsetzen.

Der NDR ist Lügenfunk und mit der korrupten Tagesschau als wichtigstes Produkt des Senders keine zuverlässige Informationsquelle, sondern grundsätzlich erst mal in den Papierkorb zu werfen. Rausholen kann man's ja später nochmal, falls man es braucht. Wenn ich mal einen guten Tag erwische, wäre der NDR Interessenfunk. Das ist von objektiv und repräsentativ aber immer noch Lichtjahre entfernt.

Es wäre ja auch zu einfach gewesen, den von Konrad Kujau angefertigten Schriftsatz als reine Textdatei zum Download anzubieten. Dann könnte jeder auf die beigefügten Waschanleitung verzichten und das Textkonvolut wesentlich einfacher nach lustigen Kalendersprüchen durchsuchen, um unter deren Zuhilfenahme den einen oder anderen Blogspost aufzuhübschen.

So muß sich der Leser mit beigelegten Werbeshoweinlagen rumquälen, z.B. so einer:

Hajo Funke, Politikwissenschaftler

Politik ist keine Wissenschaft. Die Draufschau auf die Politik ist auch keine Wissenschaft, sondern schauen, was passiert oder passiert ist.

Noch grotesker ist aber der hier, von einem Dietmar Schiffermüller.

"'Tagebücher' ein Ausdruck von Holocaust-Leugnung"

Waaas? Hitler hätte den Holocaust geleugnet, wäre das Tagebuchkonvolut echt gewesen? Hilter hätte den Holocaust geleugnet. Unfaßbar.

Das hat bestimmt der NDR herausgefunden. Der findet ja alles raus. Alles findet der raus! (Original by Fefe*)

Da ich diesen vom NDR gequirlten Unfug nicht brauche, brauche ich nur den Text von Kujau. Genau darum soll es im folgenden Beitrag gehen. Wie bekommt man die Hitlerzeit in einfacher Sprache (also im Kujau Original statt Funke-Gewäsch) am elegantesten auf den PC gelutscht, wenn der NDR den Download zwar anbietet, aber nur in der Form, jede Datei in den Browser zu laden und diese dann händisch abzuspeichern?

Genauso.

Wget, Curl, Lynx, Links und wie sie noch alle heißen, scheitern schlichtweg an der fehlenden Scriptunterstützung, denn die wird zwingend benötigt, wenn die Datenbankabfrage im Brwoser dargestellt werden soll.

Ergo bleibt nur der Browser übrig. Automatisiert, das wäre schon schön. Das funktioniert auch nicht so gut, da der NDR ab und zu einen Fehler auswirft, so daß am Schluß liebevolle Handarbeit gefragt ist, diese Fehler wettzumachen.

Chrome und andere Engines, sind eh alle die gleichen, haben die Möglichkeit, denn Browser headless, also ohne Anzeigen am Bildschirm zu nutzen, für genau solche automatisierten Abläufe, denn der URL schreit geradezu danach. Sprich, es werden nur Magen und Darm des Browsers benötigt. In den Magen geht alles rein. Der Darm scheißt am Ende das Ergebnis aus.

hitlertagebuecherdatenbank102.html#6/1932
oder z.B.
hitlertagebuecherdatenbank102.html#12/1940

Am Ende rotieren nur Monat und Jahr, der Rest der Adresse bleibt immer gleich.

Das ist für curl ein Routinejob, geht aber fehl, da curl kein Javascript kann. Also bastelt man sich eine Dateiliste mit allen möglichen URLs zusammen, was in einer Tabellenkalkulation und mit csv-Datei schnell erledigt ist.

Mit dem Browser Chrome gibt es zwei Möglichkeiten des Speicherns. Einmal als Screenshot der Seite, was auch fehl schlägt, da da nur ein Standarbildschirm angenommen wird. Man müßte für jede einzelne Seite einen anderen Bildschirm definieren, da Kujau unter dem Namen Hitlers nicht jeden Tag die gleiche Textmenge gedichtet hat. Die Datei hitlertagebuecherdatenbank102.html#6/1940 umfaßt z.B. 22 PDF-Seiten. Das will man nicht wirklich als Screenshot haben.

Die Kommandozeilenparamter in der Übersicht. Benötigt wird nur --print-to-pdf.

Eine Zeile einer Batchdatei für Windows, es werden insgesamt 140 Zeilen, sieht dann so aus.

"C:\Program Files\Google\Chrome\Application\chrome.exe" --headless --disable-gpu --print-to-pdf="path\to\download\htb\1932_10.pdf" https://[bitte selber ausfüllen],hitlertagebuecherdatenbank102.html#10/1932

Wenn chrome headless Dateien lokal speichern soll, muß hinter den beiden Möglichkeiten des Speicherns (pdf oder screenshot) immer der lokale Pfad zur Datei angeben werden, sonst furzt Chrome nur und die Datei hat sich verflüchtigt. Dieser Hinweis fehlt im oben verlinkten headless. Es hat mich einiges an Zeit gekostet, diesem Fehler nachzulaufen.

Nach der Fehlerkontrolle sollte man die relevanten Tagebucheinträge im Schober haben. Ausdrucken, zum Buchbinder Wanninger bringen und anschließend an repräsentativer Stelle im heimischen Bücherschrank archivieren.

Abschließend noch ein kecker Kalenderspruch vom Führer made by Konrad Kujau für den Hausgebrauch.

Muß mich etwas mehr um Eva kümmern ...
Quelle:

NDR...hitlertagebuecherdatenbank102.html#4/1939

* Die CIA ist Singular (Einzahl). Ergo muß es findet und nicht finden heißen.