27. Mai 2024

Der Schurke - eine Recherche 3/3

Stilübung Denzel Washington

Symbolbild für alles mit teuflichem Schurken

Auf Zeno.org ist es schwierig, sich einfach mal so mit freien Büchern als Munition für's Tablet oder Telefon oder den Elektrobuchleser zu bevorraten. Davor stehen die Restriktionen des Webservers und Software aus der Steinzeit.

Der massenhafte Download wird von der robots.txt eingeschränkt, also verhindert.

Setzt man wget drauf an, bricht das Teil aus zwei Gründen in sich zusammen. Es kann nicht mit Unicode umgehen. Das hat man erst wget2 beigebracht. Ergo muß das wget2 ran, was aber auch scheitert, weil ja robots.txt greift und diese Software nicht auf den Zeno-Server raufläßt.

Abhilfe schafft die Konfiguration und die Nutzung von wget2.

wget2.exe -np -r -l2 -k -e robots=off --user-agent="Netscape 2.0" -i liste.txt

Man läßt das wget einen user-agent übermitteln, der nicht in der robots.txt enthalten ist. Dann klappts auch mit dem Schnorcheln bei Zeno.org. Am Ende ist das Netz voll, so man will. In der liste.txt stehen die ersten Links, die man vorgeben sollte. Der Rest flutscht dann wie der Flaschenpfandbon aus dem Automaten.