Star Trek Phaser (aber in echt jetzt)
19. Januar 2010Wenn man ein Trekkie-Spielzeug mit einem Laser ausstattet, bekommt man etwas … das nicht in Kinderhände gehört
Details hier
Wenn man ein Trekkie-Spielzeug mit einem Laser ausstattet, bekommt man etwas … das nicht in Kinderhände gehört
Details hier
Kam kürzlich ein Anruf meiner Hosterin: Ob mit meiner Website soweit alles in Ordnung sei, der Traffic würde sich in so relativ astronomischen Regionen bewegen (und in meinem “Asbach Uralt”-Tarif sei ja nun einmal nicht soviel Inklusiv-Bandbreite enthalten)?
Angeregt durch den freundlichen Hinweis suchte ich dann die gute alte Logfile-Statistik auf und staunte Bauklötze: Namentlich die beiden Baby-Einschlafhilfen “Fön” und “Wasserhahn” brachten es im Oktober gemeinsam auf satte 50GB Transfervolumen. Und über 8.700 Downloads. Irre.
Da sind wir doch auf die Logfile-Einträge gespannt – halt, was ist das? Der Großteil der Zugriffe auf die Dateien kommt von iPhones??
Startet da etwa jemand mit einem hochgezüchteten iPhone eine Denial of Service-Attacke auf mein Blog? Zu Hilfe!
Des Rätsels Lösung: Das iPhone kann direkt im Browser MP3-Dateien abspielen. In diesem Fall ruft das Gerät aber nicht sofort die komplette Datei ab, sondern nur das jeweils benötigte Häppchen. Das ist z.B. von Vorteil, wenn man gleich bis kurz vor das Ende der Datei skippen möchte – es muss dann nicht erst gewartet werden, bis die vorher kommenden 90% der Datei durch die dünne Funkanbindung gekleckert sind. Das Telefon fragt beim Webserver mit einem sogenannten “Range Request” direkt nach einem bestimmten Teil der Datei. Ebenso arbeiten auch Download-Beschleuniger, welche mehrere Teile einer Datei parallel herunterladen (nicht immer sehr ressourcenfreundlich). Wird ein Range-Request vom Webserver unterstützt, schlägt sich die Antwort im Logfile vermutlich mit dem HTTP-Statuscode “206 partial content” nieder. Im Screenshot direkt neben der Spalte mit der 206 steht die übertragene Datenmenge – du liebe Güte, das sind immer über 16MB! Die Frage ist: Ist das auch wirklich immer durch die Leitung gewandert?
Wie die Gegenprobe mit dem Servermodul mod_logio ans Licht bringt, verlässt tatsächlich nur ein Bruchteil der Datenmenge bei den iPhone-Anfragen den Server (die letzten beiden Spalten stehen für eingehenden und ausgehenden Verkehr):
Das die Logfiles derart daneben liegen können, muss einem ja erst einmal gesagt werden. Meine 50GB Traffic sehen jedenfalls auf einmal ganz schön klein aus.
Da mod_logio dem Server zusätzlichen Aufwand beschert, wird aber sicherlich kaum ein Shared Hosting-Anbieter das Modul im normalen Betrieb ständig mitlaufen lassen.
Wir lernen:
Das ist zunächst mal ein ganz netter Mechanismus, mit dem es möglich wird, den Browser "vorausschauend" mit dem Laden von Dateien zu beauftragen, die er demnächst brauchen könnte.
Bei einer Website, auf der die Pfade der Besucher leicht voraussehbar sind (z.B. wenn nur die Wahl zwischen "vorige Seite" und "nächste Seite" besteht), ließe sich sagen: gut, dann kann der Browser auch schon mal anfangen die nächste Seite zu saugen, wenn er schon sonst nichts zu tun hat. Realisiert wird das über das rel-Attribut in <link>-Tag, Metatag oder HTTP-Header. Beispiel:
Das ist ja schön und gut, sofern ich selbst meinen Besuchern das Prefetching meiner Seiten nahelege. Benutzt wird Prefetching aber z.B. auch vom Suchriesen Google, der gerne mal die vordersten Suchergebnisse von den Browsern seiner Besucher saugen lässt (Herrjeh! Es könnte ja sein, dass da jemand draufklickt!).
Websites in den vorderen Rängen der Suchergebnisse kann auf diese Art durchaus eine Menge "ins blaue" verusachter Datenverkehr blühen, der nicht mehr im gesunden Verhältnis zu den Besucherzahlen steht. Und wenn das großen Portalen noch egal sein mag – Otto Normalwebmaster rauft sich vielleicht die Haare.
Auch Proxies oder Tools wie der Google Web Accelerator arbeiten zur "gefühlten" Beschleunigung des Surfens mit Prefetching
Gegenwärtig wird Prefetching von iCab (*staun*), dem Mozilla Firefox und seinen Brüdern sowie dem Google Web Accelerator unterstützt. Führen diese Prefetching-Anfragen aus, wird der folgende Header mitgesendet:
Möchte ich nicht, dass mein Server seine (Rechen-)Zeit mit solchen Anfragen vergeudet, kann ich die Anfrage abfangen und verwerfen, indem ich meine .htaccess-Datei ein wenig tune:
Man beachte: statt dem Client einfach ein "Forbidden" vorzusetzen, ist der HTTP-Status "503 Service Temporarily Unavailable" angebracht – kommt der Zugriff von einem Suchmaschinen-Robot, wirft der uns am Ende sonst noch die Seite aus dem Index! Deswegen verpassen wir ihm eine "höfliche" Abfuhr in gestalt des Robot-sicheren 503-Status' und geben ihm mit auf den Heimweg, dass er die Seite demnächst hier wieder abholen darf
Allein mit mod_rewrite ist das leider nicht möglich, deswegen behelfen wir uns einfach mit einem kurzen PHP-Script. Der Inhalt von 503.php kann z.B. so aussehen:
Und das war's schon! Anhand der im Logfile notierten 503-Codes kann man sich in absehbarer Zeit anschauen, wieviele Zugriffe gespart wurden, jedenfalls sofern der Server keine anderen schwerwiegenden Probleme hat
Dieser kleine Trick ist nicht nur für Geizkragen geeignet: habe ich tatsächlich einen Webserver der zwischendrin wirklich mit starken Auslastungen zu kämpfen hat, kann ich die Prefetching-Sperre auch als dynamisch an- und ausschaltbares Feature implementieren.
Siehe auch:
Nix für ungut!