Google Analytics verliert Aussagekraft
Emil, Donnerstag, 27. Mai 2010, 11:31
Abgelegt unter: Datenschutz, Suchmaschinen | Tags: , ,

Mittels Google Analytics lassen sich die Besuche einer Webseite auswerten. Dazu bindet der Seitenbetreiber ein Skript auf der Seite ein, das beim Aufruf der Seite ausgeführt wird. Mittels des Skripts werden die für eine Auswertung relevanten Angaben, z.B. die IP, an Google gesendet und dort ausgewertet. Der Seitenbetreiber kann sich dann die aufbereiten Daten zu seinen Besuchern auf einer speziellen Seite von Analytics anschauen.

Selbstverständlich wird auch schon der Aufruf der Startseite bzw. der Landing-Page dokumentiert und dabei die Daten des Besuchers erfasst. Doch vor dem Besuch einer Webseite kann ein Besucher nicht erkennen, ob auf dieser Seite Analytics eingesetzt wird oder nicht. Um also eine Dokumentation der Besucherdaten durch Analytics zu verhindern, müsste er also vor jedem Besuch einer ihm fremden Seite technisch verhindern, dass das Skript von Analytics gestartet werden kann. Dies könnte z.B. durch generelles Abschalten von JavaScript geschehen.

Das wäre jedoch äußerst unpraktisch, da somit auch alle anderen Features verunmöglicht werden, die JavaScript erfordern, wie beispielsweise die Lightbox zur vergrößerten Darstellung von Grafiken, oder die Autocomplete-Funktion in Sucheingabefeldern. Da dies für die Nutzer unzumutbar wäre, gab es immer mehr Kritik an Google-Analytics und einer fehlenden und praktikablen Möglichkeit, die möglicherweise ungewollte Datenerfassung durch einen externen Konzern (also Google) zu unterbinden. Insbesondere da Google ohnehin in der Kritik steht, wenn es um den Umgang mit Daten geht (siehe Street-View) und auch andere Firmen wie Facebook gerne Daten sammeln und dies dann zeitgemäßen Umgang mit der Privatsphäre nennen, mehrten sich die kritischen Stimmen.

Nun also hielt es Google für geboten, zu reagieren. Es wird nun ein Tool (Plugin) zur Verfügung gestellt, mit dem die Dokumentation der eigenen Besucherdaten auf von Analytics ausgewerteten Seiten verhindert wird. Noch ist das Tool in der Beta-Phase und leider unterstützt es nicht alle gängigen Browser, z.B. fehlt Opera. Aber es ist ein Schritt in die richtige Richtung, wenn es um die Eindämmung des ungezügelten Umgangs mit Daten geht.

Für Shop-Betreiber wird sich aber nun einiges ändern. Es ist zu erwarten, dass der Link zu diesem Tool die Runde machen wird, auch dieser Blog trägt ja dazu bei. Mit wenigen Klicks ist das Plugin dann installiert. So wird wohl bald in bestimmten Verbrauchergruppen ein beträchtlicher Teil diese Analyse-Möglichkeit unterbunden haben, so dass eine verlässliche Aussage zur Besucherstruktur immer ungenauer werden wird.

Da es bei einem solchen Tool nur darum geht, die Weitergabe der Daten an externe Firmen zu verhindern, hier speziell an Google, sollte sich jeder Shopbetreiber darum kümmern, die Daten auch ohne eine solche Weitergabe zu analysieren. Dabei ist durchaus möglich, Daten mit der gleichen Aussagekraft wie die Google-Daten zu generieren, jedoch erfordert die Einrichtung solcher Werkzeuge einen wesentlich höheren Arbeitsaufwand. Doch jeder der den Online-Verkauf ernsthaft betreibt, weiß um die Wichtigkeit der Analyse-Daten. Man sollte sich also beizeiten darum kümmern, sich selbst die Analyse-Werkzeuge zu erstellen.

Link zum Tool: http://tools.google.com/dlpage/gaoptout



Google und die mitgelesenen E-Mails
Emil, Montag, 17. Mai 2010, 22:11
Abgelegt unter: Allgemein, Datenschutz, Suchmaschinen | Tags: ,

Wie wir vor einigen Tagen hörten, hat Google wohl jahrelang und weltweit mit den Streetview-Autos nicht nur Bilder geknipst sondern auch die Daten zu und aus öffentlichen WLAN-Netzen gespeichert. Das sind Netze wie sie z.B. in Kneipen oder Bibliotheken zur Verfügung gestellt, damit man auch von dort ins Internet gehen kann. In einer solchen Kneipe schreibe ich viele meiner Texte und versende von dort aus naturgemäß dann auch E-Mails. Wenn denn während der Vorbeifahrt des Streetview-Autos eine Webseite angesehen oder ein E-Mail versendet wurde, dann wurde dies auch seitens Google gespeichert.

Angeblich sind es 600 Gigabyte, also 600.000.000.000 Byte (also etwa 300.000.000 (=300-Millionen) DIN-A-4-Seiten an Text), die da gespeichert wurden, ohne dass Google dies nach eigener Aussage bemerkte. Der sprichwörtliche Schelm würde jetzt ja vielleicht jetzt Böses denken, also dass da vielleicht doch irgendwas gewollt war oder so, aber das würde der Emil ja niemals laut sagen.

Egal wie, es wirft ein seltsames Licht auf den Google-Konzern. Hat man den Überblick verloren, welche Daten man überhaupt an welchen Stellen sammelt? Oder ist man sich dessen durchaus bewusst, und sammelt fröhlich, Datenschutz hin, Datenschutz her, vor sich hin, und zwar solange bis sich mal jemand aufregt und dies öffentlich macht?

Auch Street-View sehe ich jetzt durchaus anders als vor diesem Vorfall. Bisher konnte ich zwar die Bedenken durchaus verstehen, aber ich fühlte mich nicht direkt betroffen. Das Haus in dem ich wohne gehört mir nicht sondern meinem Vermieter. Und einmal zufällig draußen von einem Streetview-Auto fotografiert zu werden ist doch schon ein recht großer Zufall, und da die Autos ja recht einfach zu erkennen sind, kann man sich ja auch umdrehen. Tatsächlich habe ich erst einmal ein solches Auto hier in Berlin in natura gesehen. Doch solche Vorfälle führen dazu, sich über das Ganze einmal etwas tiefere Gedanken zu machen.

Wenn ein Tourist nach Berlin kommt, dort einige Fotos schießt, und diese dann nach dem Motto ‘meine schönsten Berlin-Fotos’ ins Netz stellt, käme ich wohl kaum auf die Idee, mich zu beschweren, wenn ich auf einem der Bilder zu sehen wäre. Bei lediglich oberflächlicher Betrachtung ist Google-Streetview nichts anderes: In Phase 1 werden Bilder von allen Straßen gemacht, die dann (ähnlich wie Google-Map) in Phase 2 in Netz gestellt werden.

Doch Google-Map hat auch eine Phase X, und zwar dann, wenn mit der Karte Werbung verbunden ist, ob von Google selbst oder von Seitenbetreibern, die Google-Maps zur Bewerbung des eigenen Projektes einsetzen. Und diese Phase X wird es auch bei Google-Streetview geben. Da sieht man dann ein Bild einer Straße, und an einem bestimmten Haus ist dann ein Werbetext eingeblendet, etwa in der Art ‘Fischrestaurant Nautilus’ oder ‘Fahrschule ‘Meyer’. Spätestens dann wird ein solches Foto zum Werbebild und die darauf abgebildeten Menschen dienen dazu, das Foto lebendig wirken zu lassen. Ich bin nicht damit einverstanden, für solche Werbefotos kostenlos Modell zu stehen. Und daher wünsche ich auch, nicht auf den Streetview-Bildern zu sehen zu sein. Und da die Google-Bots sich ja auch diesen Text ansehen, hat Google ja nun auch Kenntnis davon.



Spuren beseitigen
Emil, Montag, 11. Januar 2010, 19:46
Abgelegt unter: Datenschutz, Suchmaschinen | Tags: , ,

Natürlich möchte jeder, der einen Online-Shop, einen Blog oder überhaupt irgendeine Webseite betreibt, dass die Seite möglichst viele Besucher hat. Dazu wird dann ein meist nicht unerheblicher Aufwand betrieben, um die Seite bekannt zu machen. Suchmaschinenoptimierung, Internetmarketing und Werbung sind beispielhafte Stichworte hierbei. Jedoch gibt es auch Informationen zur Seite, deren Veröffentlichung uns keinerlei Vorteil bringt und die wir eventuell sogar verhindern möchten. Dazu zählen beispielsweise das Internet-Archiv und der Cache in der Ergebnisanzeige bei Suchmaschinen.

Im Internetarchiv (auch Wayback-Machine genannt) http://www.archive.org/ werden seit 1996 Abbilder sämtlicher im Internet auffindbarer Webseiten archiviert. So ist bis heute ein Bestand von etwa 150 Milliarden Seiten zusammengekommen. Da das Archiv öffentlich ist, kann dort jeder nachschauen, wie eine Seite zu einem früheren Zeitpunkt ausgesehen hat. Allerdings sind dort nur archivierte Momentaufnahmen einsehbar, die mindestens 6 Monate alt sind. Da dies bestenfalls für Konkurrenten interessant ist, oder für Leute, die nachschauen wollen, was ein Produkt früher einmal gekostet hat, möchte man diesen Einblick sicher gerne verhindern. Dies geht über folgenden Eintrag in der Datei robots.txt:
User-agent: ia_archiver
Disallow: /
Sobald der einlesende Spider des Archivs das nächste mal vorbeischaut, wird die Einstellung wirksam. Fortan werden dann keine alten Aufnahmen der Webseite mehr veröffentlicht. Sobald aber diese Anweisung aus der Datei robots.txt entfernt wird, werden alle Einträge (also auch ältere) wieder veröffentlicht. So könnte es beispielsweise sein, dass man wie oben den Einblick verhindert, dann jedoch die Domain nicht mehr benötigt und abmeldet. Greift sich diese nun jemand anderes und betreibt darauf eine Seite ohne diesen Eintrag in der robots.txt, werden leider auch alte Versionen unserer alten Seite wieder im Archiv sichtbar.

Eine zweite Möglichkeit sich eine ältere Version einer Webseite anzuschauen, ist der Cache der Suchmaschinen. Bei Google und den meisten anderen Suchmaschinen wird dazu unterhalb der Ergebnisse ein Link auf diesen Cache eingeblendet. Auch dieser Link ist nicht wirklich verkaufsfördernd, sondern stillt eher die Neugier der Konkurrenz. Damit dieser Link für eine Webseite im Suchergebnis nicht mehr angezeigt wird, muss folgende Zeile in den Head-Bereich der Webseite aufgenommen werden:
<meta name=”ROBOTS” content=”NOARCHIVE” />
Wenn nur bei Google die Cache-Anzeige unterdrückt werden soll, ist ROBOTS durch GOOGLEBOT zu ersetzen.

Natürlich lassen sich so nicht immer alle Spuren auslöschen, die man im Internet hinterlässt, bekanntermaßen vergißt das Netz nie und nichts, was man dort einmal veröffentlicht hat. Jedoch wird durch diese Schritte der Einblick in Vergangenes zumindest erschwert.