News Ende der Pseudonyme im Netz?: Mit LLMs lassen sich im großen Ausmaß Online-Konten deanonymisieren

Ich glaub die Mehrheit hier macht sich um die völlig falsche Sache Sorgen; Ich bin schließlich eine selbstbewusste Frau aus Bielefeld, die sich nichts von einer KI vorschreiben lässt!

Will sagen: Die Dinger sind dumm wie Brot, und es wird ihnen reichlich schwer fallen einen roten Hering von der Makrele zu unterscheiden.

Worüber man sich stattdessen Gedanken machen sollte sind IPs, E-Mail-Adressen, Cookies, Endgeräte, Nutzungszeiten usw. - da braucht es nämlich beileibe kein LLM, um >90% aller Pseudonyme im Netz einem Klarnamen zuordnen zu können.

nighteeeeey schrieb:
Und deshalb nutze ich 3 verschiedene Emailadressen und 3 verschiedene Internetpseudonyme, und keine Verbindung zwischen diesen um alles was mit Klarnamen geschieht bestmöglich zu trennen von meinen restlichen Internetaktivitäten.

Keine Ahnung ob das wirklich funktioniert oder was bringt, fühlt sich aber bisher am sichersten an.
Habe ich früher auch so gehandhabt, gehe nun aber weg davon, weil es nicht wirklich eine "gute" Lösung ist, sondern lediglich eine "etwas weniger schlechte".

Wenn man Kreuzreferenzen vermeiden will, dann muss man tatsächlich auf verschiedene Nutzernamen und verschiedene E-Mailadressen setzen, was am Ende aber weniger wild ist, als es vielleicht scheint; Bin jetzt bspw. bei Proton Mail, die mir für jede Registrierung eine neue E-Mail-Maske generieren, sodass eigentlich keiner weiß, wie meine Mail in Wahrheit lautet. Mozilla bietet das imo auch seit einiger Zeit an, aber Sitz USA vs. Sitz Schweiz ist ein von vornherein verlorener Kampf. :lol:

Helge01 schrieb:
Deine Ausdrucksweise/Schreibfehler sind wie ein Fingerabdruck, eine KI kann das ziemlich sicher zuordnen.
Schinken42 schrieb:
Aber nein, LLMs können anhand deiner Wortwahl, Satzlänge, Duktus und Argumentationslinien deine Identität feststellen.
Das wurde nun mehrfach so erwähnt, als sei dies offensichtlich - habt ihr dazu eine Quelle?

Für mich erscheint das nämlich alles andere als trivial, eine ausreichende Menge an Daten für eine nennenswerte Konfidenz zusammen zu bekommen; Wann habt ihr denn das letzte Mal etwas im Klarnamen öffentlich im Internet gepostet? Und wann mehr als einen oder zwei Sätze? Und falls es da tatsächlich etwas gibt, hattet ihr da die gleichgroße(/-kleine) Menge an Aufwand in Grammatik und Rechtschreibung reingesteckt wie in die Forenbeiträge?

Ist wie ein vergessenes Glas in einem Meetingraum finden: Man mag perfekte Fingerabdrücke davon abnehmen können, die einem aber nicht viel nützen, wenn man nicht schon eine Datenbank zum abgleichen hat.
 
Bright0001 schrieb:
Das wurde nun mehrfach so erwähnt, als sei dies offensichtlich - habt ihr dazu eine Quelle?

Für mich erscheint das nämlich alles andere als trivial, eine ausreichende Menge an Daten für eine nennenswerte Konfidenz zusammen zu bekommen; Wann habt ihr denn das letzte Mal etwas im Klarnamen öffentlich im Internet gepostet? Und wann mehr als einen oder zwei Sätze? Und falls es da tatsächlich etwas gibt, hattet ihr da die gleichgroße(/-kleine) Menge an Aufwand in Grammatik und Rechtschreibung reingesteckt wie in die Forenbeiträge?

Ist wie ein vergessenes Glas in einem Meetingraum finden: Man mag perfekte Fingerabdrücke davon abnehmen können, die einem aber nicht viel nützen, wenn man nicht schon eine Datenbank zum abgleichen hat.
Ja, tatsächlich ist die Prüfung umso trivialer je mehr Vergleichsdaten man hat.
Ich nehme aber stark an dass diejeniegen die sowas umsetzen mehr als genug Daten haben.
Von staatlichen Akteuren ganz zu schweigen.

Die Aufgabe an sich ist nicht besonderw schwer, nur kleinteilig, langwierig. Das stört ein LLM aber nicht.
 
Hm, einfach nie und nirgends echte Namen und Bilder hochladen hat schon vor google suchen geholfen und hilft wohl auch weiterhin gut gegen KI-Agenten.
 
Bright0001 schrieb:
Für mich erscheint das nämlich alles andere als trivial, eine ausreichende Menge an Daten für eine nennenswerte Konfidenz zusammen zu bekommen; Wann habt ihr denn das letzte Mal etwas im Klarnamen öffentlich im Internet gepostet? Und wann mehr als einen oder zwei Sätze? Und falls es da tatsächlich etwas gibt, hattet ihr da die gleichgroße(/-kleine) Menge an Aufwand in Grammatik und Rechtschreibung reingesteckt wie in die Forenbeiträge?
Das hast du doch vorhin selbst beschrieben: man braucht nicht mit Klarnamen posten. IP-Adressen, die WLANs wo du dich täglich einloggst, die Route deines vernetzen Autos, deine Fitness-Uhr, die Metadaten deiner Messenger-Kontakte, Browser-Fingerprint, alles mögliche kann zusammengeführt werden zu einem Profil. Deinen Klarnamen kann man zur Not als letztes herausfinden, indem man z.B. beim Einwohnermeldeamt nachfragt oder an deiner Adresse vorbeischaut oder einen beliebigen Shop gehackt hat, der deine (Versand)Adresse hat.

Der Fall der Forscher hier hat sich ja quasi noch gezielt künstlich beschränkt und keine Databroker usw. wurden verwendet.

Abgesehen davon sind Schreibstile individuell, manche eher unauffällig, andere nicht. Ich bin mir sicher meiner ist relativ leicht wiedererkennbar; die Satzlänge oder Wortschatz (inkl. Dialektwörter) z.B. ändern sich wenig, egal ob ich konzentriert bin oder nicht.
 
Schinken42 schrieb:
Die Aufgabe an sich ist nicht besonderw schwer
Quelle? Oder zumindest Begründung?

Schinken42 schrieb:
Ich nehme aber stark an dass diejeniegen die sowas umsetzen mehr als genug Daten haben.
Von staatlichen Akteuren ganz zu schweigen.
Aber das ist doch die Krux, denn Datensammlung und Aufbereitung ist die eigentliche Herkulesaufgabe wenn man einen spezifischen Task per ML lösen möchte, nicht das füttern des Models an sich.

Und meine Fragen waren nicht rhetorisch, wo genau sollen die Referenzen mit Klarnamen herkommen? Mir fallen da eigentlich nur E-Mails ein - aber wenn einer Zugriff auf deine E-Mails hat, dann geht der einfach alle "noreply@...com" durch, da brauchts weder LLM noch allzu gescheiten Entwickler.

Thorakon schrieb:
Das hast du doch vorhin selbst beschrieben: man braucht nicht mit Klarnamen posten. IP-Adressen, die WLANs wo du dich täglich einloggst, die Route deines vernetzen Autos, deine Fitness-Uhr, die Metadaten deiner Messenger-Kontakte, Browser-Fingerprint, alles mögliche kann zusammengeführt werden zu einem Profil.
Jo, aber das ist doch genau mein Punkt: Wenn man mit seinen Daten schludert, dann ists völlig witzlos sich um irgendwelche LLM-Analysen Sorgen zu machen. Wenn sich einer über die Risiken von Passivrauchen beschwert, während er die Crackpfeife parat macht, dann besteht da irgendwo ein Missverständnis welches Gefahrenpotenzial gerade relevanter ist. :D
 
Also ich würd mir wünschen dass jemand eine KI baut welche die Leute ausfindig machen kann die Müll aus dem Fenster von fahrenden Autos werfen . Und nicht so sinnloses zeug welches dem Normalbürger nichts ausser Ärger bringt .


.
 
  • Gefällt mir
Reaktionen: Ben99
Nowareeng schrieb:
Also ich würd mir wünschen dass jemand eine KI baut welche die Leute ausfindig machen kann die Müll aus dem Fenster von fahrenden Autos werfen .

Flock Cameras und eine schnelle Eingreiftruppe von Polizei-Roombas?

aspro schrieb:
Und ich frag mich was dieser völlig übertriebene Kulturpessimismus soll. Oder existiert du nur noch in der digitalen Welt? Selbst wenn, was ändert sich dadurch für dich praktisch?

Wow, also ich wäre ja froh, wenn ich damit rein gar nichts anfangen könnte.

Vielleicht muss ich mal aufs Land ziehen oder so.

Pandora schrieb:
Zukünftig also einfach vor dem Posten den Text durch eine KI jagen die alles so umformuliert

l33t translator oder doch lieber gleich Klingonisch? ;)

CastorTransport schrieb:
Die Menschen in Somalia oder anders wo außerhalb der "first world" sehen das vermutlich etwas anders.

Ich kann durchaus sehen, dass wir es hier besser haben, als Menschen in Somalia oder wo auch immer.

Doch so Invalidierungen unserer Probleme mag ich gar nicht leiden. Dass es irgendwo anders schlimmer ist, lässt unsere Probleme hier auch nicht verschwinden und macht sie nicht geringer.


Bright0001 schrieb:
Will sagen: Die Dinger sind dumm wie Brot, und es wird ihnen reichlich schwer fallen einen roten Hering von der Makrele zu unterscheiden.

Also wenn sie mit einer Sache umgehen können, dann mit geschriebenen Texten. Die Fortschritte sind in dem Bereich schnell. Innerhalb von ein paar Wochen, hab ich bei Aufgabenstellungen massive Verbesserungen erfahren. Echte KI ist das jetzt für mich noch lange nicht. Trotzdem ist es mittlerweile fast schon ein Selbstläufer. Die Guardrails, die sie aufstellen, um die Entwicklung zu lenken, sind doch auch nur sporadisch. Grundsätze gibt es nicht wirklich, Moral und Ethik sowieso nicht und alles geht. Wer das nicht mittlerweile verstanden hat, ist ignorant.

Bright0001 schrieb:
Worüber man sich stattdessen Gedanken machen sollte sind IPs, E-Mail-Adressen, Cookies, Endgeräte, Nutzungszeiten usw. - da braucht es nämlich beileibe kein LLM, um >90% aller Pseudonyme im Netz einem Klarnamen zuordnen zu können.

Das kommt sicher dazu. Allerdings ist es einfacher ein paar Crawler laufen zu lassen. Da wird es keine Datenschutzdebatten geben. Schließlich wird nur oberflächlich abgegrast und dann irgendwo im Hinterzimmer ausgewertet. Darüber werden keine langatmigen politischen Debatten geführt werden, fürchte ich. Also jedenfalls nichts in Richtung Vorratsdatenspeicherung.
 
aid0nex schrieb:
Und wenn ich ehrlich bin: Ich halt mich auch nicht immer dran.
Ich versuche eigentlich schon immer mich im Internet möglichst datensparsam zu bewegen. Persönliches wird nur sehr verhalten preisgegeben, Kontaktdaten niemals öffentlich weitergegeben und z.B. Telefonnummern niemals.

Das hat dazu geführt, dass ich nur sehr wenig Mailspam erhalte und auch per Telefon nur sehr selten mal ein Spam- oder Scamanruf kommt. Das sind dann zumeist die Anrufe der Wahlcomputer, die systematisch ganze Nummernkreise abgrasen.
Ergänzung ()

Zweite Sonja schrieb:
Es werden (negative) Informationen über eine identifizierbare Person im Internet generiert, die man missbrauchen kann. Völlig egal, ob man sie selbst oder andere ins Internet stellen.
Das kommt nur vor, wenn diese Person möglichst viel im Netz von sich preis gibt - sich also nackig und damit angreifbar macht. Ich bewege mich seit fast fünfunddreissig Jahren in diesem Netz und noch niemand hat mich unmöglich gemacht oder gemobbt, trotzdem ich im Forenbereich zeitweise sehr prominent unterwegs war, einen YT Kanal besitze, auf FB präsent bin und sogar Instagram mit Inhalten bespiele. Dabei gilt halt immer, dass ich keine persönlichen und intimen Inhalte präsentiere und auf YT oder Insta gibts nicht einen Content, in dem ich selbst oder andere Personen sichtbar werden.

Wer gemobbt und unmöglich gemacht wird, der hat dem selbst Tür und Tor geöffnet, indem er unbedacht Inhalte online stellte, die ihn angreifbar machten. Und wenn die Mobber merken, dass sie offene Türen einrennen, dann treiben sie es auch weiter.
 
Zuletzt bearbeitet:
Bright0001 schrieb:
Quelle? Oder zumindest Begründung
Mit genug Vergleichsdaten ist es nur noch eine Fleissaufgabe.
Deine Ausdrucksweise ist eben einzigartig wie ein Fingerabdruck und wie dieser kann sie mit genug Übereinstimmung zur Identifikation genutzt werden.
Die "Quelle" ist der Beruf des forensischen Schriftsachverständigen.
Dabei gehts mitnichten nur um die Schrift. Auch Maschinengeschriebenes kann gerichtsfest zugeordnet werden.

Bright0001 schrieb:
Aber das ist doch die Krux, denn Datensammlung und Aufbereitung ist die eigentliche Herkulesaufgabe wenn man einen spezifischen Task per ML lösen möchte, nicht das füttern des Models an sich.

Und meine Fragen waren nicht rhetorisch, wo genau sollen die Referenzen mit Klarnamen herkommen?
Aus hunderten Leaks von hunderten Plattformen? Aus alten, archivierten Äusserungen? Aus zusammengetragenen Nicknames? Aus FB Posts von Freunden, Bildunterschriften von Schulen, Unis, Volksfesten, Zeitungsbeiträgen, Unternehmen...?
Aus der EPA, den Bezahlinfos bei Paypal, Ebax-Kleinanzeigen, Mailadressen (insbesondere berufliche)?
Aus NSA Datenbanken? Windows Recall?
Aus tausend Quellen die mir nicht eingefallen sind weil ich nur ein Mensch bin der ganz kurz nachgedacht hat.
Eine ganze Industrie sammelt solche Ideen.
 
Zuletzt bearbeitet:
Soso LLM hilft beim deanonnymisieren. Oder bei der Risikoabschätzung für die Krankenversicherer. Wer hätte das gedacht ..

Viel Spaß mit der Patientenakte. Zumal wenn der Gesundheitsminister geil drauf ist möglichst alle LLM's drauf loszulassen. Weil das den Ärzten und Forschern das Leben erleichtert.
 
Zurück
Oben