Seitenschneider

Was immer Websurfer aus dem Internet laden - stets sammelt der Anbieter im Gegenzug Informationen über sie. Spezielle Proxy-Server stutzen nicht nur die grafischen Inhalte auf die Wünsche des Anwenders zurecht, sondern kontrollieren auch den Rückfluss persönlicher Daten an die Inhaltsanbieter und deren Werbepartner.

In Pocket speichern vorlesen Druckansicht 17 Kommentare lesen
Lesezeit: 15 Min.
Von
  • Bert Ungerer
Inhaltsverzeichnis

Kaum gab es das World Wide Web, entstand der erste Werbefilter: 1995 ersann Axel Boldt (Uni Paderborn) mit dem WebFilter - damals unter dem prägnanten Namen ‘NoShit’ - eine Erweiterung des CERN-HTTP-Proxy, die man auf persönliche Vorlieben und Abneigungen trimmen konnte, um unverlangter Werbung zu entgehen und schneller an die gewünschten Informationen zu gelangen. Ein solcher HTTP-Säuberer verringert per Filterung von nicht als informativ empfundenen Grafiken den Datenverkehr und beruhigt das Auge des Anwenders. Zudem sorgt er durch Kontrolle des ausgehenden Datenverkehrs dafür, dass der Websurfer nicht unbemerkt mehr über sich preisgibt, als ihm lieb ist.

Aus den schlichten WWW-Proxy-Ergänzungen sind eigenständige Lösungen geworden. Heute gibt es Dutzende; einen gut gepflegten Überblick gibt http://www.flourish.org/adremove/. Zu den prominenten darunter gehören die Open-Source-Lösung Junkbuster und der kommerzielle, für den Privatgebrauch kostenlose WebWasher.

Dass die meisten Filter als HTTP-Proxy arbeiten, hat einen einfachen Grund: Es ist sinnvoller, als für jeden Browser eine Erweiterung (Plugin) zu entwickeln und zu pflegen. Auf diese Weise muss der Anwender lediglich den Browser so einstellen, dass er auf dem Weg ins Internet einen entsprechenden HTTP-Proxy verwendet, statt den direkten Weg über Port 80 zu gehen.

Web-Filter wie Junkbuster oder WebWasher arbeiten wie gewöhnliche HTTP-Proxies. Sie können wahlweise auf dem Client selbst laufen und von dort aus entweder direkt oder wiederum über einen nicht filternden Proxy mit dem Internet gekoppelt sein (Abb. 1).

Für die Filterung von Inhalten ist nicht unbedingt ein Zusatz-Proxy erforderlich. Eine konsequente Lösung in Unternehmensnetzen besteht im (Um-)Konfigurieren des ohnehin eingesetzten Proxy, zum Beispiel Squid. Doch entweder gehört es nicht zur Firmenpolitik, bestimmte Sites für alle Anwender auszuschließen, oder die Netzabteilung hat einfach Besseres zu tun, als regelmäßig eine Liste unerwünschter Sites zu pflegen. Die Anwender selbst können besser selbst Einfluss auf die ein- und ausgehenden Daten nehmen - auch ohne speziellen Filter, siehe Kasten ‘Bordmittel ...’.

Wer sich für den Einsatz eines Filter-Proxy entscheidet, muss sich zunächst klar darüber sein, was er zulassen will und was nicht. In ‘Blocklisten’ lassen sich URLs (oder Bestandteile davon) von unerwünschten Inhalten angeben. Das Gegenstück sind ‘Trusted-‘ beziehungsweise ‘White Lists’: Was sie enthalten, lässt der Filter auf jeden Fall durch.

Oftmals ist der Anlass für die Einrichtung eines Filters der Wunsch nach mehr Schutz der Privatsphäre. Die bekannteste ‘Bedrohung’ geht von ‘Cookies’ aus, kleinen Datenfragmenten, die der Browser auf Geheiß eines Webservers für die spätere Verwendung lokal speichert und die persönliche Daten enthalten können [1]. Mit Filter-Proxies lassen sich Listen von Sites anlegen, die Cookies hinterlassen dürfen.

Wer Grafiken aus dem Web lädt, hat sich mit Sicherheit auch schon ‘Web Bugs’ eingefangen, kleine, transparente 1-Pixel-Grafiken, die keine andere Aufgabe haben, als einen Eintrag in einer Log-Datei zu verursachen. Insbesondere der Weg von E-Mails mit HTML-Inhalten lässt sich mit diesen kleinen Wanzen seitens des Absenders optimal verfolgen. Auch gegen diese Art der Persönlichkeitsverletzung können Filter-Proxies helfen, wenn sie entweder direkt nach Grafikformaten filtern können oder zumindest in ihren Blocklisten die URLs bekannter Web-Bug-Anbieter enthalten.

Eine weitere Möglichkeit für Content-Anbieter, mehr über Vorlieben und Verhaltensweisen von Websurfern herauszufinden als denen lieb ist, stellen die ‘HTTP-Referrer’ dar, die ein Browser normalerweise mit jeder Anforderung an den Webserver schickt. Mit der Information, welches die jeweils zuletzt aufgerufene Seite war, kann der Anbieter Nutzungs- und damit Nutzerprofile erstellen. Entsprechend können die Filterprogramme den Referrer aus dem HTTP-Request entfernen. Prinzipiell können sie auf diese Weise auch Informationen über den Browser verändern oder auf Wunsch den Request mit ihrem eigenen Namen markieren, damit die Sitebetreiber zumindest darüber Informationen erhalten, welcher Anteil der Zugriffe über einen Filter erfolgt.

Siemens-Mitarbeiter brachten den WebWasher vor gut zwei Jahren unter großer Beachtung auf den Markt; er sorgte für eine breite Diskussion um Sinn und Unsinn von Werbung im Internet. Das Produkt sollte sich bald als derart erfolgreich erweisen, dass mit Unterstützung von Siemens für die Weiterentwicklung die webwasher.com AG entstand. Kommerzielle Anwender zahlen für den WebWasher 29 Euro pro Client, bei größerer Zahl von Clients auch weniger (Preise auf Anfrage).

Ausgereift und übersichtlich zeigt sich die WebWasher-Oberfläche unter Windows. Ein Webinterface ist für Windows nicht vorgesehen (Abb. 2).

Die derzeit lizenzfreie Linux-Version bietet eingeschränkte Funktionen. So ist die Zahl der externen Clients auf zwei (inklusive Localhost drei) und diejenige der simultanen HTTP-Verbindungen auf 20 beschränkt. Sicherheitsfunktionen bezüglich aktiver Inhalte (Java, JavaScript, ActiveX) sind abgeschaltet. Für die kostenpflichtige Windows-Unternehmensversion WebWasher EE (Enterprise Edition) bietet der Hersteller zudem den Service einer laufenden Blocklisten-Aktualisierung namens ‘DynaBLocator’ an.

Unter Linux ist der WebWasher dank Webinterface kaum weniger komfortabel zu bedienen als unter Windows (Abb. 3).

DynaBLocator soll einen Schritt weiter gehen als reine Werbefilter und Anwendern möglichst jeden Inhalt vorenthalten, der nichts mit ihrer Arbeit zu tun hat. Nach Zugriffszeiten, Anwendergruppen und 58 inhaltlichen Kategorien sortiert, lassen sich detaillierte Surf-Berechtigungen vergeben. Als Zulieferer anstößiger Links betätigt sich die Cobion AG, die laufend über eine halbe Milliarde URLs mit Hilfe automatischer Bilderkennung prüft. Wenn sich Mitarbeiter nicht auf andere Weise motivieren lassen, richtet es vielleicht solches ‘Internet Access Management’.

Gerade noch rechtzeitig zur CeBIT erschien der WebWasher für Linux, jedoch noch nicht als kommerzielle Ausführung. Unter Windows verfügt der WebWasher über ein eigenständiges Konfigurationsprogramm; unter Linux lässt er sich nicht minder bequem per Webbrowser einrichten. Das Umkonfigurieren des Webbrowsers hinsichtlich der Verwendung des Filter-Proxy kann das Windows-Programm sogar gleich mit übernehmen.

Für eine vollkommen gleichwertige Linux-Portierung hatte die Zeit vor der CeBIT offenbar nicht ganz gereicht; so fehlen an einigen Stellen Hilfetexte oder sie passen nicht in den Kontext. Auch fehlt dem Linux-WebWasher der ‘Präfix-Filter’, der es erlaubt, eine Anwenderverfolgung mit Links wie http://www.ad.de/http://www.ix.de/ auszuschließen - den Teil vor der eigentlich wichtigen URL reicht der WebWasher unter Windows einfach nicht weiter, wenn er entsprechend konfiguriert ist. Beides wird laut webwasher.com AG in der nächsten Linux-Version nachgearbeitet sein.

Der Einsatz des WebWasher erfordert nicht unbedingt eine Liste von zu filternden URLs. Es genügen die oftmals standardisierten Maße der in der Regel besonders unerwünschten Werbebanner; etliche - auch die jüngst vom Internet Advertising Bureau (IAB) verabschiedeten, deutlich gewachsenen - sind dem WebWasher bereits ab Werk bekannt. Neuentwicklungen lassen sich wie URLs jederzeit nachtragen. Damit ist der WebWasher ohne einen einzigen URL-Eintrag überraschend wirkungsvoll. Die Fantasie der Werbetreibenden ist offenbar an dieser Stelle noch ausbaufähig.

Etwas streng geht der WebWasher mit ausgefilterten Grafiken um, indem er den HTML-Quellcode der abgerufenen Seite so verändert, dass sie spurlos verschwinden. Weder der ursprünglich dafür vorgesehene Platz noch die Beschreibung (in der HTML-Quelle mit ‘alt=...’ angegeben) bleiben sichtbar. Oftmals ist es aber hilfreich, wenn eben doch Spuren der Banner sichtbar bleiben, etwa wenn es sich gar nicht um unverlangte Werbung, sondern um Navigationshilfen handelt. Nervig in der kostenlosen Windows-Version: Sie fragt gelegentlich nach, ob man nicht allmählich doch den Lizenzschlüssel erwerben möchte.

Ein anderes Geschäftskonzept als die webwasher.com AG realisiert die von Jason Catlett gegründete Junkbusters Corporation. Catlett hat den Junkbuster unter die GPL (GNU General Public License) gestellt, das heißt, jeder kann den Werbefilter frei einsetzen, weiterverteilen und -entwickeln. Das eigentliche Geschäft von Catlett ist seine Beratungstätigkeit. Mit der Veröffentlichung von Version 2.02 vor rund zwei Jahren hat er die Weiterentwicklung von Junkbuster vorerst eingestellt. Immerhin gab er gegenüber iX an, dass noch 2001 mit einer neuen Version zu rechnen sei - allerdings nicht mit ‘größeren neuen Funktionen’. Vielmehr geht es voraussichtlich um Anpassungen an einige HTTP-Unterfunktionen, HTTP 1.1 und IPv6.

Catlett empfiehlt Upgrade-Suchenden offiziell den Einsatz von ‘Guidescope’, einer zu Junkbuster rückwärtskompatiblen Software, die sich nach Angaben der Firma Guidescope, Inc., derzeit in einem ‘frühen Betastadium’ befindet. Das Konzept ist viel versprechend: Statt auf eine zentral von einem Hersteller wie WebWasher gepflegte Blockliste setzt Guidescope auf die Mitarbeit der Anwender; wer eine bisher nicht berücksichtigte Quelle von Werbung findet, kann sie der ‘Community Filtering Blocklist’ hinzufügen.

Einfacher gehts nicht: Der Junkbuster präsentiert sich unter Windows als DOS-Fenster (Abb. 4).

Immerhin ist Junkbuster 2.0.2 ebenfalls als Windows-Version verfügbar, doch die Zielgruppe ist wohl zu verwöhnt, um dieses Programm ernsthaft in Erwägung zu ziehen. Eine Konfiguration per Texteditor und der Start eines DOS-Programms wirken unter Windows steinzeitlich. Abgesehen davon funktioniert das Fossil gut. Wer bereits einen Linux-Junkbuster konfiguriert hat, fühlt sich hier gleich zu Hause und kann die Konfigurationsdateien weiterverwenden. Über ein verbessertes Interface mit Integration in den Statusbereich der Taskleiste (‘SysTray’) und einem ‘richtigen’ Windows-Ausgabefenster verfügt die Version 2.0.2-6 von Stefan Waldherr.

Unter Linux verrichtet der Junkbuster heutzutage fast standardmäßig als lokaler Proxy seinen Dienst; er gehört bei vielen Distributionen zum Lieferumfang - mitsamt ansehnlicher, laufend gepflegter Blocklisten (zum Beispiel ebenfalls von Stefan Waldherr). Die Konfiguration der Textdateien ist zwar nicht so schick wie über eine Weboberfläche, aber dafür lassen sich längere Filterlisten bequemer bearbeiten. Dank regulärer Ausdrücke (deren Interpretation ist abschaltbar) sind bereits mit wenigen Zeilen viele unerwünschte Webobjekte auszuschließen.

Rigoros geht der Junkbuster in der Standardeinstellung gegen Cookies vor: Er erlaubt lediglich explizit freigegebenen Webservern, derlei Informationen beim Anwender zu hinterlegen. Auf diese Weise kann es des Öfteren passieren, dass Warenkörbe oder andere Anwendungen nicht mehr funktionieren. Cookies lassen sich aber auch kontrollieren, ohne dass es zu solchen Nebenwirkungen kommt (siehe ‘Bordmittel ...’).

Der Junkbuster hat einige Schwächen im Interface und in der Dokumentation. Doch dem steht eine große Fangemeinde gegenüber, die ständig Verbesserungen liefert; als weiteres Beispiel sei die Popup-Fenster-Unterdrückung von Steve Kemp genannt. Ein formatbezogener Filter gegen Banner und Web Bugs wie beim WebWasher fehlt dem Junkbuster. Dies und andere sichtbare Altersspuren werden seine Fans nicht davon abhalten, noch eine ganze Weile lang ihren HTTP-Verkehr damit zu säubern.

Ein wachsendes Interesse an Produkten wie WebWasher und Junkbuster zeigt, dass sich die Internetanwenderschaft ungerne ausforschen oder von unverlangten Werbebotschaften berieseln lässt. Ein absurdes Wettrennen der Filterprogramme gegen neue Werbe- und Tracking-Techniken ist im Gange. Langfristig dürften potenzielle Kunden diejenigen Anbieter bevorzugen, die den besten Datenschutz bieten. Die Industrie ist gefordert, den Schutz der Privatsphäre als neuartige Dienstleistung zu begreifen.

[1] Rolf Haas, Holger Ziegelbauer; WWW-Datenschutz; Auf den Keks; Webbrowser gefährden Intimsphäre

Mehr Infos

iX-TRACT

  • HTTP-Filterproxies wirken in zwei Richtungen: Einerseits blenden sie unerwünschte Webgrafiken aus, andererseits kontrollieren sie die Preisgabe von Anwenderdaten.
  • Der unter Linux weit verbreitete Junkbuster beschränkt sich auf die Untersuchung und Filterung von URLs und damit von Hostadressen.
  • Von Siemens stammt der WebWasher, der neben URLs auch Inhalte von Webseiten, etwa Grafikformate, als Filterkriterium heranzieht.
  • Da die Inhaltskontrolle eine individuelle Angelegenheit ist, arbeiten die Filter-Proxies in der Regel lokal. Die webwasher.com AG zielt zusätzlich auf den arbeitgeberseitigen, zentralen Einsatz.
Mehr Infos

iX-WERTUNG

Junkbuster 2.02

[+] Standard-Filter unter Linux

[+] freier Quellcode, auf viele Betriebssysteme portiert

[+] Unterstützung regulärer Ausdrücke für URL-Filter

[-] unvollständige Dokumentation

[-] rudimentäre Konfiguration und Bedienung

WebWasher 3.0

[+] komfortable Installation, Konfiguration und Bedienung

[+] URL-unabhängige Formatfilter, auch gegen ‘Web Bugs’

[+] Unterstützung regulärer Ausdrücke für URL-Filter

[-] unvollständige Dokumentation (Linux-Version)

[-] störende Lizenzierungsaufforderungen (Windows-Version)

Daten und Preise
Junkbuster 2.02
HTTP-Filter-Proxy (filtert nach URLs) für diverse Unix-Varianten, Linux, Windows und OS/2 (BeOS-Version von Jens Kilian)
Hersteller Junkbusters Corporation, Green Brook (USA)
Preis Freie Software unter der GNU General Public License (GPL)
Quelle www.junkbusters.com/ijb.html; Erweiterungen und Weiterentwicklungen unter anderem verfügbar unter www.waldherr.org/junkbuster/
WebWasher 3.0
HTTP-Filter-Proxy (filtert nach URLs und Inhalten) für Linux und Windows, Version 2.1.1 auch für Mac OS
Hersteller webwasher.com AG, Paderborn
Preis Nach 30 Tagen lizenzpflichtig für 29 Euro pro Client (zurzeit nur Windows-Version); Enterprise-Version auf Anfrage; kostenlose, eingeschränkte Version für private Zwecke und Bildungseinrichtungen