News Ende der Pseudonyme im Netz?: Mit LLMs lassen sich im großen Ausmaß Online-Konten deanonymisieren

Ich glaub die Mehrheit hier macht sich um die völlig falsche Sache Sorgen; Ich bin schließlich eine selbstbewusste Frau aus Bielefeld, die sich nichts von einer KI vorschreiben lässt!

Will sagen: Die Dinger sind dumm wie Brot, und es wird ihnen reichlich schwer fallen einen roten Hering von der Makrele zu unterscheiden.

Worüber man sich stattdessen Gedanken machen sollte sind IPs, E-Mail-Adressen, Cookies, Endgeräte, Nutzungszeiten usw. - da braucht es nämlich beileibe kein LLM, um >90% aller Pseudonyme im Netz einem Klarnamen zuordnen zu können.

nighteeeeey schrieb:
Und deshalb nutze ich 3 verschiedene Emailadressen und 3 verschiedene Internetpseudonyme, und keine Verbindung zwischen diesen um alles was mit Klarnamen geschieht bestmöglich zu trennen von meinen restlichen Internetaktivitäten.

Keine Ahnung ob das wirklich funktioniert oder was bringt, fühlt sich aber bisher am sichersten an.
Habe ich früher auch so gehandhabt, gehe nun aber weg davon, weil es nicht wirklich eine "gute" Lösung ist, sondern lediglich eine "etwas weniger schlechte".

Wenn man Kreuzreferenzen vermeiden will, dann muss man tatsächlich auf verschiedene Nutzernamen und verschiedene E-Mailadressen setzen, was am Ende aber weniger wild ist, als es vielleicht scheint; Bin jetzt bspw. bei Proton Mail, die mir für jede Registrierung eine neue E-Mail-Maske generieren, sodass eigentlich keiner weiß, wie meine Mail in Wahrheit lautet. Mozilla bietet das imo auch seit einiger Zeit an, aber Sitz USA vs. Sitz Schweiz ist ein von vornherein verlorener Kampf. :lol:

Helge01 schrieb:
Deine Ausdrucksweise/Schreibfehler sind wie ein Fingerabdruck, eine KI kann das ziemlich sicher zuordnen.
Schinken42 schrieb:
Aber nein, LLMs können anhand deiner Wortwahl, Satzlänge, Duktus und Argumentationslinien deine Identität feststellen.
Das wurde nun mehrfach so erwähnt, als sei dies offensichtlich - habt ihr dazu eine Quelle?

Für mich erscheint das nämlich alles andere als trivial, eine ausreichende Menge an Daten für eine nennenswerte Konfidenz zusammen zu bekommen; Wann habt ihr denn das letzte Mal etwas im Klarnamen öffentlich im Internet gepostet? Und wann mehr als einen oder zwei Sätze? Und falls es da tatsächlich etwas gibt, hattet ihr da die gleichgroße(/-kleine) Menge an Aufwand in Grammatik und Rechtschreibung reingesteckt wie in die Forenbeiträge?

Ist wie ein vergessenes Glas in einem Meetingraum finden: Man mag perfekte Fingerabdrücke davon abnehmen können, die einem aber nicht viel nützen, wenn man nicht schon eine Datenbank zum abgleichen hat.
 
Bright0001 schrieb:
Das wurde nun mehrfach so erwähnt, als sei dies offensichtlich - habt ihr dazu eine Quelle?

Für mich erscheint das nämlich alles andere als trivial, eine ausreichende Menge an Daten für eine nennenswerte Konfidenz zusammen zu bekommen; Wann habt ihr denn das letzte Mal etwas im Klarnamen öffentlich im Internet gepostet? Und wann mehr als einen oder zwei Sätze? Und falls es da tatsächlich etwas gibt, hattet ihr da die gleichgroße(/-kleine) Menge an Aufwand in Grammatik und Rechtschreibung reingesteckt wie in die Forenbeiträge?

Ist wie ein vergessenes Glas in einem Meetingraum finden: Man mag perfekte Fingerabdrücke davon abnehmen können, die einem aber nicht viel nützen, wenn man nicht schon eine Datenbank zum abgleichen hat.
Ja, tatsächlich ist die Prüfung umso trivialer je mehr Vergleichsdaten man hat.
Ich nehme aber stark an dass diejeniegen die sowas umsetzen mehr als genug Daten haben.
Von staatlichen Akteuren ganz zu schweigen.

Die Aufgabe an sich ist nicht besonderw schwer, nur kleinteilig, langwierig. Das stört ein LLM aber nicht.
 
Hm, einfach nie und nirgends echte Namen und Bilder hochladen hat schon vor google suchen geholfen und hilft wohl auch weiterhin gut gegen KI-Agenten.
 
Bright0001 schrieb:
Für mich erscheint das nämlich alles andere als trivial, eine ausreichende Menge an Daten für eine nennenswerte Konfidenz zusammen zu bekommen; Wann habt ihr denn das letzte Mal etwas im Klarnamen öffentlich im Internet gepostet? Und wann mehr als einen oder zwei Sätze? Und falls es da tatsächlich etwas gibt, hattet ihr da die gleichgroße(/-kleine) Menge an Aufwand in Grammatik und Rechtschreibung reingesteckt wie in die Forenbeiträge?
Das hast du doch vorhin selbst beschrieben: man braucht nicht mit Klarnamen posten. IP-Adressen, die WLANs wo du dich täglich einloggst, die Route deines vernetzen Autos, deine Fitness-Uhr, die Metadaten deiner Messenger-Kontakte, Browser-Fingerprint, alles mögliche kann zusammengeführt werden zu einem Profil. Deinen Klarnamen kann man zur Not als letztes herausfinden, indem man z.B. beim Einwohnermeldeamt nachfragt oder an deiner Adresse vorbeischaut oder einen beliebigen Shop gehackt hat, der deine (Versand)Adresse hat.

Der Fall der Forscher hier hat sich ja quasi noch gezielt künstlich beschränkt und keine Databroker usw. wurden verwendet.

Abgesehen davon sind Schreibstile individuell, manche eher unauffällig, andere nicht. Ich bin mir sicher meiner ist relativ leicht wiedererkennbar; die Satzlänge oder Wortschatz (inkl. Dialektwörter) z.B. ändern sich wenig, egal ob ich konzentriert bin oder nicht.
 
Schinken42 schrieb:
Die Aufgabe an sich ist nicht besonderw schwer
Quelle? Oder zumindest Begründung?

Schinken42 schrieb:
Ich nehme aber stark an dass diejeniegen die sowas umsetzen mehr als genug Daten haben.
Von staatlichen Akteuren ganz zu schweigen.
Aber das ist doch die Krux, denn Datensammlung und Aufbereitung ist die eigentliche Herkulesaufgabe wenn man einen spezifischen Task per ML lösen möchte, nicht das füttern des Models an sich.

Und meine Fragen waren nicht rhetorisch, wo genau sollen die Referenzen mit Klarnamen herkommen? Mir fallen da eigentlich nur E-Mails ein - aber wenn einer Zugriff auf deine E-Mails hat, dann geht der einfach alle "noreply@...com" durch, da brauchts weder LLM noch allzu gescheiten Entwickler.

Thorakon schrieb:
Das hast du doch vorhin selbst beschrieben: man braucht nicht mit Klarnamen posten. IP-Adressen, die WLANs wo du dich täglich einloggst, die Route deines vernetzen Autos, deine Fitness-Uhr, die Metadaten deiner Messenger-Kontakte, Browser-Fingerprint, alles mögliche kann zusammengeführt werden zu einem Profil.
Jo, aber das ist doch genau mein Punkt: Wenn man mit seinen Daten schludert, dann ists völlig witzlos sich um irgendwelche LLM-Analysen Sorgen zu machen. Wenn sich einer über die Risiken von Passivrauchen beschwert, während er die Crackpfeife parat macht, dann besteht da irgendwo ein Missverständnis welches Gefahrenpotenzial gerade relevanter ist. :D
 
Also ich würd mir wünschen dass jemand eine KI baut welche die Leute ausfindig machen kann die Müll aus dem Fenster von fahrenden Autos werfen . Und nicht so sinnloses zeug welches dem Normalbürger nichts ausser Ärger bringt .


.
 
  • Gefällt mir
Reaktionen: Ben99
Nowareeng schrieb:
Also ich würd mir wünschen dass jemand eine KI baut welche die Leute ausfindig machen kann die Müll aus dem Fenster von fahrenden Autos werfen .

Flock Cameras und eine schnelle Eingreiftruppe von Polizei-Roombas?

aspro schrieb:
Und ich frag mich was dieser völlig übertriebene Kulturpessimismus soll. Oder existiert du nur noch in der digitalen Welt? Selbst wenn, was ändert sich dadurch für dich praktisch?

Wow, also ich wäre ja froh, wenn ich damit rein gar nichts anfangen könnte.

Vielleicht muss ich mal aufs Land ziehen oder so.

Pandora schrieb:
Zukünftig also einfach vor dem Posten den Text durch eine KI jagen die alles so umformuliert

l33t translator oder doch lieber gleich Klingonisch? ;)

CastorTransport schrieb:
Die Menschen in Somalia oder anders wo außerhalb der "first world" sehen das vermutlich etwas anders.

Ich kann durchaus sehen, dass wir es hier besser haben, als Menschen in Somalia oder wo auch immer.

Doch so Invalidierungen unserer Probleme mag ich gar nicht leiden. Dass es irgendwo anders schlimmer ist, lässt unsere Probleme hier auch nicht verschwinden und macht sie nicht geringer.


Bright0001 schrieb:
Will sagen: Die Dinger sind dumm wie Brot, und es wird ihnen reichlich schwer fallen einen roten Hering von der Makrele zu unterscheiden.

Also wenn sie mit einer Sache umgehen können, dann mit geschriebenen Texten. Die Fortschritte sind in dem Bereich schnell. Innerhalb von ein paar Wochen, hab ich bei Aufgabenstellungen massive Verbesserungen erfahren. Echte KI ist das jetzt für mich noch lange nicht. Trotzdem ist es mittlerweile fast schon ein Selbstläufer. Die Guardrails, die sie aufstellen, um die Entwicklung zu lenken, sind doch auch nur sporadisch. Grundsätze gibt es nicht wirklich, Moral und Ethik sowieso nicht und alles geht. Wer das nicht mittlerweile verstanden hat, ist ignorant.

Bright0001 schrieb:
Worüber man sich stattdessen Gedanken machen sollte sind IPs, E-Mail-Adressen, Cookies, Endgeräte, Nutzungszeiten usw. - da braucht es nämlich beileibe kein LLM, um >90% aller Pseudonyme im Netz einem Klarnamen zuordnen zu können.

Das kommt sicher dazu. Allerdings ist es einfacher ein paar Crawler laufen zu lassen. Da wird es keine Datenschutzdebatten geben. Schließlich wird nur oberflächlich abgegrast und dann irgendwo im Hinterzimmer ausgewertet. Darüber werden keine langatmigen politischen Debatten geführt werden, fürchte ich. Also jedenfalls nichts in Richtung Vorratsdatenspeicherung.
 
aid0nex schrieb:
Und wenn ich ehrlich bin: Ich halt mich auch nicht immer dran.
Ich versuche eigentlich schon immer mich im Internet möglichst datensparsam zu bewegen. Persönliches wird nur sehr verhalten preisgegeben, Kontaktdaten niemals öffentlich weitergegeben und z.B. Telefonnummern niemals.

Das hat dazu geführt, dass ich nur sehr wenig Mailspam erhalte und auch per Telefon nur sehr selten mal ein Spam- oder Scamanruf kommt. Das sind dann zumeist die Anrufe der Wahlcomputer, die systematisch ganze Nummernkreise abgrasen.
Ergänzung ()

Zweite Sonja schrieb:
Es werden (negative) Informationen über eine identifizierbare Person im Internet generiert, die man missbrauchen kann. Völlig egal, ob man sie selbst oder andere ins Internet stellen.
Das kommt nur vor, wenn diese Person möglichst viel im Netz von sich preis gibt - sich also nackig und damit angreifbar macht. Ich bewege mich seit fast fünfunddreissig Jahren in diesem Netz und noch niemand hat mich unmöglich gemacht oder gemobbt, trotzdem ich im Forenbereich zeitweise sehr prominent unterwegs war, einen YT Kanal besitze, auf FB präsent bin und sogar Instagram mit Inhalten bespiele. Dabei gilt halt immer, dass ich keine persönlichen und intimen Inhalte präsentiere und auf YT oder Insta gibts nicht einen Content, in dem ich selbst oder andere Personen sichtbar werden.

Wer gemobbt und unmöglich gemacht wird, der hat dem selbst Tür und Tor geöffnet, indem er unbedacht Inhalte online stellte, die ihn angreifbar machten. Und wenn die Mobber merken, dass sie offene Türen einrennen, dann treiben sie es auch weiter.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: aid0nex
Bright0001 schrieb:
Quelle? Oder zumindest Begründung
Mit genug Vergleichsdaten ist es nur noch eine Fleissaufgabe.
Deine Ausdrucksweise ist eben einzigartig wie ein Fingerabdruck und wie dieser kann sie mit genug Übereinstimmung zur Identifikation genutzt werden.
Die "Quelle" ist der Beruf des forensischen Schriftsachverständigen.
Dabei gehts mitnichten nur um die Schrift. Auch Maschinengeschriebenes kann gerichtsfest zugeordnet werden.

Bright0001 schrieb:
Aber das ist doch die Krux, denn Datensammlung und Aufbereitung ist die eigentliche Herkulesaufgabe wenn man einen spezifischen Task per ML lösen möchte, nicht das füttern des Models an sich.

Und meine Fragen waren nicht rhetorisch, wo genau sollen die Referenzen mit Klarnamen herkommen?
Aus hunderten Leaks von hunderten Plattformen? Aus alten, archivierten Äusserungen? Aus zusammengetragenen Nicknames? Aus FB Posts von Freunden, Bildunterschriften von Schulen, Unis, Volksfesten, Zeitungsbeiträgen, Unternehmen...?
Aus der EPA, den Bezahlinfos bei Paypal, Ebax-Kleinanzeigen, Mailadressen (insbesondere berufliche)?
Aus NSA Datenbanken? Windows Recall?
Aus tausend Quellen die mir nicht eingefallen sind weil ich nur ein Mensch bin der ganz kurz nachgedacht hat.
Eine ganze Industrie sammelt solche Ideen.
 
Zuletzt bearbeitet:
Soso LLM hilft beim deanonnymisieren. Oder bei der Risikoabschätzung für die Krankenversicherer. Wer hätte das gedacht ..

Viel Spaß mit der Patientenakte. Zumal wenn der Gesundheitsminister geil drauf ist möglichst alle LLM's drauf loszulassen. Weil das den Ärzten und Forschern das Leben erleichtert.
 
Wenn es nicht für den Versand nötig ist, gebe ich auch keine realen Daten ein. Ok bei LinkedIn wäre es zwar schwierig aber das nutze ich nicht

Meine Daten sind allerdings immer so absurd, daraus könnte man wahrscheinlich ebenfalls eine Verbindung ziehen.
Mein Sohn fragt mich als, warum beim Windows Login Donald Duck steht :d


Vor Jahren habe ich mich mal selbst gegoogelt und habe über meine ICQ Nummer eine Jugendsünde gefunden...

In einem Forum habe ich bei einer Vorstellungsrunde sehr viel über mich preisgegeben. Habe dann den Betreiber angeschrieben und ihn darum gebeten diesen Post zu löschen. Hat er auch zum Glück ohne wenn und aber gemacht.
 
  • Gefällt mir
Reaktionen: Sanctuslight
Prost Mahlzeit.
Die Woche hat Oracle das hosten und auswerten von sensiblen gesundheitsdaten, militärischen daten zusätzlich zu Tiktok übernommen.
In UK machts Palantir, trotz der erkenntnis das korruption in verbindung mit Epstein den deal erst ermöglicht hat.
Jetzt erfährt man dass wohl zusätzlich jegliche aktivität im internet dazu verknüpft werden kann...
Das ist wirklich schlimm. Das kann man nicht mehr beschönigen/herunterspielen.
 
Wer überall Konten hat ( Link,X,Facebook) muss sich nicht wundern. Das ging schon immer manuell war nur halt unglaublich aufwendig. Wer überall seine richtigen Daten angibt ist auch ein stück weit selbst schuld.
 
Netter Versuch, aber ich halte mich für schlau genug und besitze die nötige Internetkompetenz.
Schönen Tag euch noch :)

LG
Roland Meyer
 
  • Gefällt mir
Reaktionen: testwurst200 und KeinNutzerName
Schinken42 schrieb:
Aber nein, LLMs können anhand deiner Wortwahl, Satzlänge, Duktus und Argumentationslinien deine Identität feststellen.
Nope. Das ist hier auch nicht passiert.
Die haben lediglich Konten in Verbindung gebracht wo bereits eine Identität bestand.

Es hat einen Grund warum die mit einem linked in Konto begonnen haben die waren dann vermutlich auch Juicy genug das es sich gelohnt hat.

Ich hätte gerne das gleiche Experiment mit zufälligen anonymen datensätzen gesehen aber das wäre dann vermutlich nicht mehr ganz so "beeindruckend".
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: testwurst200
Keiner kennt z.b. sämtliche Menschen aus diesem thread so gut wie "das Internet". Die Daten dazu müssen nur zusammengebracht werden. Ob das täglich noch einfacher&umfangreicher möglich wird - ich habe wenig Zweifel.
 
Bright0001 schrieb:
Das wurde nun mehrfach so erwähnt, als sei dies offensichtlich - habt ihr dazu eine Quelle?
Angesichts dessen, dass man schon vor über 10 Jahre Programmierer von kompilierter Software deanonymisieren konnte (und zwar nur anhand des Programmierstils), glaube ich das sofort.

Quelle: https://media.ccc.de/v/32c3-7491-de-anonymizing_programmers#t=1385

Es lohnt sich den kompletten Talk zu schauen.
In der Intro wird außerdem erwähnt, dass man vorher gezeigt hat, dass man normale Texte sogar noch deanononymisieren kann, nachdem man sie x mal durch einen Übersetzer gejagt hat.
 
Zuletzt bearbeitet: (Präzisierung)
  • Gefällt mir
Reaktionen: Bright0001 und Schinken42
SSD Freak schrieb:
Ohne Handy in der Natur o.Ä egal ob allein oder mit Person(en), da fühle ich mich komplett frei!
Bald auch überwachungsdrohnen in Form von Bussarden und Finken auch in Ihrem lokalen Wald :)
Ergänzung ()

Zweite Sonja schrieb:
Nun bist du Verdächtiger und musst deine Unschuld beweisen
Der Ankläger (hier bestimmt Staatsanwalt) muss dir die Schuld nachweisen. Nicht andersrum.
Ergänzung ()

Nowareeng schrieb:
Also ich würd mir wünschen dass jemand eine KI baut welche die Leute ausfindig machen kann die Müll aus dem Fenster von fahrenden Autos werfen
Das wär geil. Eine KI-Fensterscheibe. Wirfste Müll raus, zack, Fenster hoch, Hand ab. :D
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Nowareeng
aid0nex schrieb:
Das gepaart mit Datensparsamkeit ist der beste Weg, garantiert aber auch keine 100%ige Sicherheit
Wenn man "Pech" hat, wird genau diese Sparsamkeit einem dann zum Verhängnis: Da muss man gar nicht in lupenreine Diktaturen sehen. Schon der harmlose Versuch als einfacher Tourist in die USA einzreisen, um ein paar entspannte Tage oder Wochen zu verbringen, kann direkt bei der Einreise auf unbestimmte Zeit in den sog. Abschiebeknast führen, wenn den Typen der Border-Control etwas an deinem Profil "misfällt" - das kann auch ein Profil mit zu wenig Daten sein.
aGoat schrieb:
Natürlich war das nur ein Beispiel deinerseits, aber das ist ein wichtiger Punkt. Währrend wir hier in Deutschland und anderen EU-Ländern den Luxus haben, dass Inhaber von Informationen diese nicht verwenden dürfen wie sie lustig sind, ist das nicht überall der Fall. Das ist ein hohes Gut und sollte entsprechend gegen Vorstöße wie die Vorratsdatenspeicherung verteidigt werden.
Und es gilt auch hierzulande nur so lange, wie auch etwa gewählte Regierungen und ihre Verwaltungsapparate (sprich die Exekutive, die über die entsprechende sog. Staatsgewalt verfügt) sich an geltendes Recht und die Gesetze halten. In den USA dachten viele bei der letzten Präsidentenwahl sicher auch nicht, dass der Gewählte samt seiner Administration sich offen gegen die eigenen Gesetze stellen würden und sogar höchstrichterliche Urteile mehr oder weniger ignorieren oder umgehen und dabei auch noch die Kontrollmechanismen durch Parlamente und Medien völlig aushöhlen (z.B. statt Gesetzgebungsprozess einfach mal per Präsidialdekret Fakten schaffen).
aspro schrieb:
Unsinn in mehrfacher Hinsicht. 1. Unschuldsvermutung (muss ich das noch erklären?) 2. Ohne rechtskräftige Verurteilung würden die genannten Personen überhaupt nichts über etwaige polizeiliche Untersuchungen erfahren und somit auch nichts davon tun.
s.o. das alles gilt nur, solange ein Rechtsstaat noch funktioniert. es gibt absolut keine Garantie mehr, dass das auch bei uns für alle Zeit noch gilt - von anderen Staaten, die wir bislang für gefestigte Demokratien hielten, ganz abgesehen.
Bright0001 schrieb:
Will sagen: Die Dinger sind dumm wie Brot, und es wird ihnen reichlich schwer fallen einen roten Hering von der Makrele zu unterscheiden.
Das Problem ist: egal wie Dumm, es gibt genug Leute auch in den Administrationen, die den Output für bare Münze halten und danach agieren - sei es, dass es irgendwie in dem Kram passt oder nützt und irgendein "Schuldiger/Verdächtiger" ist besser als ein Cold Case ohne Täter:freak:
Bright0001 schrieb:
Für mich erscheint das nämlich alles andere als trivial, eine ausreichende Menge an Daten für eine nennenswerte Konfidenz zusammen zu bekommen; Wann habt ihr denn das letzte Mal etwas im Klarnamen öffentlich im Internet gepostet? Und wann mehr als einen oder zwei Sätze? Und falls es da tatsächlich etwas gibt, hattet ihr da die gleichgroße(/-kleine) Menge an Aufwand in Grammatik und Rechtschreibung reingesteckt wie in die Forenbeiträge?
Umgekehrt wird ein Schuh draus: Wann immer man seinen Klarnamen nutzen muss - politisch aktive Betätigung, Bewerbung, Einreise in fremdes Land ... - kann auf der Grundlage nach vermeintlich versteckten Infos gesucht und diese mit dem Klarnamen veknüpft werden.
 
  • Gefällt mir
Reaktionen: DKK007 und aid0nex
Zurück
Oben