Clicky

Datenspuren und Datenkraken

Von (real)Asmodis

Bleiben wir noch etwas bei Big Data und nehmen wir als Beispiel dafür mal Google, auch als Datenkrake bekannt. An dem Internet-Giganten kommt keiner vorbei. Spätestens dann, wenn man ein Android-Handy benutzt, benötigt man ein Google-Konto und und das Datensammeln geht ganz von alleine los.

Sicher, man kann alles mögliche deaktivieren – aber dann ist das Handy kaum noch von praktischem Nutzen. Ähnliches gilt für Tablets und Computer. Zumindest bei Google kann der Nutzer aber feststellen, was er so im Internet getrieben hat – und was Google daher über ihn weiß! Dabei geht es längst nicht nur um die Suchmaschine Google, sondern auch noch um das, was an Google dranhängt, also bspw. YouTube, Vevo, Googlemail u. ä. Google speichert nämlich alle Aktivitäten, die auch nur entfernt Google tangieren.

Wird dabei primär ein PC verwendet und der obendrein auch noch regelmäßig von verschiedenen Personen frequentiert, dann kommt als Datensatz nur Murks dabei heraus. Das war bei mir im Jahr 2014 der Fall, als der Rechner vier Personen zur Verfügung stehen musste und ich damals schonmal kontrollierte, was Google so gespeichert hatte.

Inzwischen sind fünf Jahre ins Land gegangen und ich benutze den PC zumeist nur noch alleine. Kommen noch Android-Handy sowie Android-Tablet hinzu. Meine ureigene Datenspur ist eben dadurch sehr viel genauer geworden. D. h. je länger ein Dienst Metadaten über jemanden sammelt, desto genauer weiß er auch über die betreffende Person Bescheid. Ich hatte vor fünf Jahren in meinem alten Blog schon einmal einen Beitrag über dieses Thema.

Seinerzeit übertitelte ich den mit “Spaß mit Google!”, weil an meinem Datensatz so ziemlich gar nichts stimmte. Damals fand ich es lustig, was Google an Datenmüll – denn um etwas anderes handelte es sich nicht – über mich zusammengetragen hatte. Heute, bei der erneuten Kontrolle, ist mir das Lachen vergangen. Um eine Ahnung davon zu bekommen, wie weit der Arm dieses Datenkraken reicht, seien hier nur mal ein paar Schlaglichter genannt:

– Recherchen mit der Suchmaschine Google
– Anschauen von YouTube- oder Vevo-Videos
– Nutzung von Chromecast am nicht-internetfähigen Fernseher
– Verwendung von Smartphone und Tablet mit dem Betriebssystem Android
– Nutzung von Google Maps oder/und Google Navigator
– Einsatz des Browsers Google Crome
– Verwendung von Sachen wie GMAIL, DRIVE, Kalender, Übersetzer, Google Play-Diensten (Books, Music, Movies) etc.

Ich nutze das alles. Manchmal, sporadisch, mit Bedacht – und dennoch ist das, was Google über mich weiß, erschreckend. Was weiß Google eigentlich über den jeweiligen User? Das kann jeder, der über ein Google-Konto verfügt (mithin also auch jeder Besitzer eines Android-Handys) selbst abfragen – probiert es einfach mal selbst aus! Dazu muss sich der Betreffende lediglich in seinem Google-Konto anmelden. Dann sind ein paar URLs, die zwar einerseits nicht gerade geheim sind, andererseits aber auch nicht gerade an die große Glocke gehängt werden, von besonderem Interesse.

https://adssettings.google.com/authenticated?hl=de
Dieser Datensatz beinhaltet grob gesagt eine Übersicht über den Benutzer, nämlich über Alter, Geschlecht und Interessen (musikalische Vorlieben, Shopping etc.). Im jahr 2014 war er bei mir noch zu 100% falsch. Im Jahr 2019 ist er nur noch zu rund 10% falsch u. d. h. Google kann mit diesen Daten arbeiten.

https://maps.google.com/locationhistory
Dieser Datensatz enthält das Bewegungsmuster, wobei alle mit dem Konto verknüpften Geräte mit einfließen. Beim PC ist das unwesentlich. Viel interessanter wird es mit Handy und Tablet. Denn wenn man dem keine Berechtigung zur Nutzung der Standortdienste erteilt, dann sind auch Maps, Routing und Navi nicht funktionell. Sobald man aber besagte Berechtigung erteilt – um die o. e. Dienste nutzen zu können – wird automatisch ein Bewegungsmuster aufgezeichnet. Das ist sogar äußerst detailliert, zeigt es doch, wann man wo unterwegs gewesen ist, wo man Urlaub gemacht hat, wo man wann eingekauft hat usw.

Aus den zeitlichen Differenzen zwischen zwei Punkten lässt sich darüber hinaus sogar noch ableiten, ob man zu Fuß unterwegs war, das Fahrrad verwendet hat oder PKWs bzw. Öffis benutzt hat. Wirklich, sehr detailliert! 2014 war dieser Datensatz bei mir zu 100% falsch, denn da hielt Goggle mich irrtümlicherweise für schon seit Monaten auf dem Schreibtischstuhl festgewachsen oder sogar versteinert. Im Jahr 2019 dagegen ist dieser Datensatz aufgrund von Funklöchern und häufigem Aktivieren des Flugmodus zwar unvollständig, aber das, was da ist, stimmt zu 100%.

https://myactivity.google.com/myactivity
Das ist eine Auflistung aller Suchabfragen, die über irgendeinen Google-Dienst gelaufen sind. Anhand der Suchabfragen lassen sich o. e. Interessen noch sehr, sehr viel exakter spezifizieren und das umfasst sämtliche (!!!) Lebensbereiche. Im Jahr 2014 war dieser Datensatz bei mir zu vielleicht maximal 20% korrekt, vor allem deswegen, weil ich Google-Dienste weitgehend gemieden habe, der Internet-Riese sich noch längst nicht so viele Dienste wie heute einverleibt hatte und weil eben mehrere Personen den gleichen PC benutzten.

Heute im Jahr 2019 ist dieser Datensatz zwar unvollständig (weil ich vieles an Google vorbei mache), nichtsdestotrotz aber zu 100% korrekt und erschreckend detailliert, so dass eindeutige Rückschlüsse auf meine Interessen möglich sind.

https://myaccount.google.com/permissions
Hier ist all das abspeichert, was mit den Kontozugriffen von Android-Geräten zu tun hat. Dieser Datensatz war 2014 bereits zu 100% korrekt sowie vollständig und ist es auch noch 2019 – was ja kein Wunder ist, denn andernfalls würden die Android-Geräte gar nicht vernünftig funktionieren können.

https://takeout.google.com/settings/takeout?pli=1
Damit kann man sich das, was die einzelnen Google-Dienste über einen gespeichert haben, als ZIP-Archiv runterladen. Das Erstellen des Archivs dauert ein paar Minuten und danach erhält man auf seiner GMAIL den Download-Link für ein Riesenarchiv in Gigabytegröße. In diesem Archiv befinden sich die Links der Suchanfragen in HTML-Form, Videos in Kopie sowie all das, was die Google-Dienste des Smartphones bzw. Tablets gespeichert haben: Noch detallierter geht es wirklich nicht mehr!

Bei mir war das, da mehrere Personen den gleichen PC verwendeten, im Jahr 2014 zu nur bestenfalls 35% korrekt im Sinne von mich selbst betreffend. Heute, 2019, sind es 100% – zwar unvollständig aufgrund der bestmöglichen Vermeidung von Google-Diensten, aber mehr als nur aufschlussreich genug!

Das bedeutet: Die Zeiten, in denen man seine eigene Datenspur noch einigermaßen selbst kontrollieren (und beeinflussen) konnte, sind im Grunde genommen vorbei. Einfach schon deswegen, weil Internet-Riesen einen Dienst nach dem anderen aufkaufen und eben dadurch Zugriff auf dessen Datensammlung erlangen.

Dabei ist Google jetzt nur ein Beispiel und steht hier stellvertretend für viele, für Twitter, Facebook, Microsoft, Amazon usw. Mit jedem dieser Internet-Riesen kommt man über kurz oder lang in Kontakt (einfach schon deswegen, weil man an denen nicht vorbei kommt) und jeder dieser Dienste sammelt Daten über den Benutzer, verkauft die und der Käufer versucht, den Benutzer anhand des Datenbestandes in der einen oder anderen, aber immer gewinnbringenden Form zu manipulieren.

Das ist aber nur die eine Seite der Medaille. Die andere sieht so aus: Ein unbefugter Dritter verschafft sich Zugang zu dem o. e. Konto. Das ist vergleichsweise einfach – sogar sehr einfach, wenn ein schwaches Password gewählt worden ist bzw. wenn sich ein User aus lauter Bequemlichkeit gar nicht erst abmeldet und ständig angemeldet bleibt.

Oder wenn auf dem Handy bzw. Tablet gleichfalls aus lauter Bequemlichkeit in den Einstellungen unter Google-Konto im Bereich Sicherheit die automatische Anmeldung aktiviert worden ist (machen zwar nur ausgemachte Vollidioten, aber von denen gibt’s mehr als genug). Dann reicht es völlig aus, besagtes Handy oder Tablet mal für einige Zeit zu “entführen” (Schema: “Mein Handy ist weg! Hast du es gesehen?” “Nein, aber ich helfe dir gerne suchen!”) und die o. e. Datenbestände abzugreifen, um allerbestens über eine Zielperson – u. U. inklusive intimer Details – informiert zu sein. Mancher könnte dann auf die Idee verfallen, derartiges Wissen zu Geld zu machen …

Doch von all dem ahnt der typische Otto Normalverbraucher natürlich nichts. Er ahnt mangels IT-Kompetenz nichts davon: Ein gefundenes Fressen für Menschen mit krimineller Energie! Wäre es da nicht wirklich besser, die IT-Kompetenz zu erhöhen und datensammelnde Firmen zur Löschung auf Verlangen des Benutzers zu verpflichten, anstatt immer und immer wieder nach mehr technischen Sicherungen zu rufen?

Denn gegen menschliche Dummheit ist auch die ausgefeilteste Technik machtlos …