GA4 interne Zugriffe über IPv4 oder IPv6 filtern?

padylee

Cadet 4th Year
Registriert
Mai 2020
Beiträge
107
Hallo,

ich versuche gerade meinen eigenen Traffic bei Google Analytics rauszufiltern.
Habe mir bereits jede Menge Videos angesehen, Blogbeiträge gelesen, im Google Analytics Forum gesucht und mir die komplette Google Analytics Hilfe zu diesem Thema durchgelesen. Bezüglich der Filterung via IP-Adressen habe ich noch offene Fragen und hoffe, dass mir hier jemand helfen kann:

1.) In fast allen Anleitungen die ich gefunden habe, wird via IPv4 blockiert. Ich dachte zuerst das es daran liegt, dass die Anleitungen veraltet sind - sie sind aber teilweise von 2021 und 2022. Kann sich jemand erklären warum hier noch fast immer auf IPv4 statt IPv6 verwendet wird?

2.) Ich möchte nur meinen Traffic Zuhause herausfiltern - allerdings für alle Geräte die Zuhause im WLAN sind. Laut Internetquellen verändert sich bei IPv4 Adressen nur der letzte Teil in (un)regelmäßigen Abständen. Also die letzten drei Ziffern, weshalb bei der Filterung meistens mit wildcard gearbeitet wird: 192.145.124.*
Es wird immer erwähnt, dass es vorkommen kann, dass auch andere Personen in diesem Nummernkreis befinden und diese mit herausgefiltert werden. Wie hoch ist denn hier die Wahrscheinlichkeit? Das wird leider nirgends erwähnt. Wäre natürlich doof, wenn ich mein Tracking komplett verfälsche, weil ich nebenbei noch unzählige weitere Personen herausfiltere.

3.) Fällt jemandem ein Grund gegen IPv6 ein? Scheinbar bleibt der Netzwerk Präfix bei IPv6 (so gut wie) immer gleich. Also könnte man ja auch hier mit Wildcard arbeiten? z.b. 2002:EE:A70A:5149:*
In einem Video wurde die DAD erwähnt, woraus ich schließe, dass es auch bei IPv6 sein kann, dass andere Personen auf der Welt in genau diesem (2002:EE:A70B:5149:*) Bereich online sind. Also würde auch diese Person rausgefiltert werden.? Verstehe ich das richtig?
Wenn ja, stellt sich mir hier die gleiche Frage wie auch bei IPv4: Wie hoch ist denn die Wahrscheinlichkeit, dass jemandem genau der selbe Netzwerk Präfix zugewiesen wird und somit ebenfalls herausgefiltert wird?

4.) Filterung über IPv4-Wildcard (192.145.124.) oder IPv6-Wildcard (2002:EE:A70A:5149:)?
Womit ist die Wahrscheinlichkeit geringer, dass ich jemanden versehentlich herausfiltere?

Danke für Eure Hilfe!


Und bevor die Frage kommt: Nein, ich habe keinen Millionen-Traffic pro Tag und nein, es entsteht auch kein Millionen-Schaden, wenn ich die ein oder andere Person versehentlich herausfiltere. Und ja, ich weiß, dass aufgrund von DSGVO, Cookie/Tracking-Regelungen, Anonymisierungen etc. die Daten sowieso schon sehr verfälscht sind. Ich hätte es aber trotzdem möglichst ordentlich und möchte das Setup einfach von Grund auf ordentlich und mit bestem Gewissen aufsetzen.
 
Kurz: Du möchtest Zugriffe aus Deinem Heimnetz auf einen oder mehrere, externe Webserver in Google Analytics ausblenden?
 
padylee schrieb:
Kann sich jemand erklären warum hier noch fast immer auf IPv4 statt IPv6 verwendet wird?
Der Mensch ist ein Gewohnheitstier und selbst für einige IT-Admins ist IPv6 irgendetwas zwischen Voodoo und schwarzer Magie und auch manch großer IT-Konzern hinkt da hinterher...

padylee schrieb:
Filterung über IPv4-Wildcard
In Zeiten von CGN kannst du auch dutzende/hunderte User raus filtern wenn du nur einzelne IPv4 Adressen exkludierst. ;)

Ansonsten sollte Google Analytics eine API bieten. Ich würde mir z.B. auf nem Raspi o.ä. ein Script bauen was die öffentliche IPv4 sowie IPv6 Adressen sich zusammen sucht und per API als Filter definiert.
Hier hatte jemand genau die gleiche Fragestellung wie du: https://stackoverflow.com/questions/47534618/google-analytics-api-filtering-out-internal-ip-address
Ist aber aus 2019, vermutlich hat sich die API geändert aber so als groben Start würde ich das nutzen.
 
@maxim.webster sorry, da war ich etwas undeutlich. Ich habe ein eigenes Web-Projekt und möchte auf diesem meine eigenen Aufrufe herausfiltern. Ich surfe natürlich selbst viel auf meiner eigenen Seite, und da werden die Zahlen ganz schön verfälscht.
@snaxilian danke für deine Antwort. Das hört sich für mich jetzt doch schon ziemlich kompliziert und aufwändig an. Auch wenn mein Eingangsposting sehr ausführlich ist, hatte ich gehofft, dass die Fragen ganz einfach zu beantworten sind. Von einem Raspi oder ähnlichem habe ich noch nie etwas gehört. Die Filter Funktion bietet Google ja selbst, und ich denke sie bieten die Filteroption schon so an, dass sie für den Gängigen User ausreichend ist. Die Frage ist nur, ob IPv4 oder IPv6 und wie viele weitere Nutzer diese IP-Adressen verwenden könnten.
 
Kannst Du Dir nicht einen Opt-Out Cookie setzen lassen oder Do-Not-Track im Browser aktivieren?
 
  • Gefällt mir
Reaktionen: padylee und snaxilian
padylee schrieb:
Ich surfe natürlich selbst viel auf meiner eigenen Seite, und da werden die Zahlen ganz schön verfälscht.
Dann guck dir halt deine eigene IP an bevor du auf der eigenen Seite rum klickst...

padylee schrieb:
Das hört sich für mich jetzt doch schon ziemlich kompliziert und aufwändig an. [...] die Fragen ganz einfach zu beantworten sind.
Hängt immer von der Perspektive ab und mMn ist die Frage einfach beantwortet und das sogar technisch korrekt und möglichst fehlerfrei.
So ein Script muss ja nicht viel machen sondern wirklich nur die eigenen IP-Adressen heraus finden und dann einen Aufruf in Richtung Google schicken und die gefundenen Adressen in den Aufruf einfügen. Ja, einmalig hinsetzen und die richtigen Befehle per Suchmaschine zusammen klöppeln oder das Ganze an einen freiberuflichen Programmierer outsourcen. Das dürfte in 3-4 Stunden zu erledigen sein inkl. Recherche würde ich schätzen wenn von von 0 anfängt.
padylee schrieb:
Die Frage ist nur, ob IPv4 oder IPv6 und wie viele weitere Nutzer diese IP-Adressen verwenden könnten.
Guck halt in deinen Router. Ich hab von meinem ISP beispielsweise eine public IPv4 Adresse und ein public /56 IPv6 Subnetz bekommen. Ja beide dynamisch aber dann muss ich die halt als Filter eintragen wenn ich mit GA den heutigen Tag analysieren möchte.
Will man mehrere Tage analysieren dann sollte man sich jeden Tag die eigenen Adressen notieren und für jeweils den Zeitraum exkludieren sofern möglich. Das o.g. potentielle Script würde diese Schritte halt automatisieren.

Alternativ geht Google ggf. auch davon aus, dass man so etwas von einem Geschäftsanschluss aus einrichtet und auswertet und die haben oft genug statische IP-Adressen.

Oder ich würde die Vorschläge von @maxim.webster in Betracht ziehen.
 
@maxim.webster danke, werde mir beide Möglichkeiten mal ansehen. Sollte funktionieren (Y)

@snaxilian Danke für deine Antwort. Kann gut sein, dass Google so denkt, die Filter müssen aber ja trotzdem funktionieren, auch für Privatpersonen und Kleinunternehmen ohne 5 Gebäude.

Nimm es mir nicht übel, aber du verkomplizierst die Situation extrem und ich glaube du hast noch nie mit GA gearbeitet. Das ist nicht wie ein Logfile, wo du nachträglich einzelne IP-Adressen oder User-Agents rausfiltern kannst wie du lustig bist.
Was ich für eine IP-Adresse habe weiß ich selbst. Aber jeden Tag die eigene Adresse notieren? Realy? Du hast mit Analyse und Tracking scheinbar noch nie etwas zu tun gehabt. Auch wenn du hier von Raspi und Scripten sprichst, kannst du nicht aus dem Informatikbereich kommen. Diese Denkweiße ist in der heutigen Zeit, vor allem in der Informatik, komplett fehl am Platz. Eigentlich versucht man alles möglichst effizient und einfach zu automatisieren. Was du hier für Tipps gibst ist leider genau das Gegenteil.

Google gibt Filtermöglichkeiten vor: Wieso zur Hölle sollte ich hier anfangen eigene Scripte zu schreiben oder mich täglich mit meiner IP-Adresse beschäftigen? Meine Fragen war ganz einfach und allgemein und irgendwie machst du daraus eine eigene Wissenschaft.
Mir geht es im Grunde einfach nur darum, ob ich mit einer IPv4 Wildcard-Adresse oder mit einer IPv6 Wildcard-Adresse mehr Personen "versehentlich" herausfiltere. Kann man aber wahrscheinlich nicht beantworten, habe ich mir schon gedacht.
 
padylee schrieb:
die Filter müssen aber ja trotzdem funktionieren
Warum müssen die Filter so funktionieren? Die Filter funktionieren halt so, wie Google glaubt dass sie sinnvoll sind.
padylee schrieb:
für Privatpersonen und Kleinunternehmen
padylee schrieb:
Raspi und Scripten
Raspis und Scripte sind eine Frickellösung mit Bastelei für Privatpersonen und Kleinstunternehmen, die idR. nicht bereit sind für andere Lösungen entsprechendes Geld und/oder Aufwand zu investieren.
padylee schrieb:
kannst du nicht aus dem Informatikbereich kommen.
Fehleinschätzung deinerseits ;)

padylee schrieb:
Eigentlich versucht man alles möglichst effizient und einfach zu automatisieren.
Zumindest alles was sinnvoll automatisierbar ist, da stimme ich dir zu.

padylee schrieb:
ob ich mit einer IPv4 Wildcard-Adresse oder mit einer IPv6 Wildcard-Adresse mehr Personen "versehentlich" herausfiltere. Kann man aber wahrscheinlich nicht beantworten, habe ich mir schon gedacht.
Kann man nicht pauschal mit ja oder nein beantworten sondern mit kommt drauf an. Hat dein Internetanschluss dynamische Adressen und du setzt eine Wildcard die den IP-Adresspool deines Providers umfasst dann filterst du auf jeden Fall dich selbst heraus aber auch alle anderen Kunden dieses Providers.
Hinzu kommt eben die Problematik mit CGN, da haben dann dutzende oder hunderte Kunden eines Providers nach außen hin die gleiche IP.
Eben weil eine IP alleine kein ausreichendes Merkmal ist um (einzelne) Endanwender zu tracken, gibt es deshalb ja deutlich bessere Methoden, beispielsweise Cookies und/oder device fingerprint tracking um nur zwei Bespiele zu nennen.
 
Zurück
Oben