crashbandicot schrieb:
Sonderzeichen bringen nicht viel, dann lieber die Länge erhöhen.
http://xkcd.com/936/
Nettes Bild. Aber rechnerisch ziemlicher Unsinn:
Erstmal kann man die
Entropie aus der Informationstheorie nicht mit der Qualität eines Passwortes gleichsetzen (obwohl das gern mal gemacht wird). Die Entropie (hier der binäre Fall zur Basis b=2) ist definiert als:
H = ∑ pz I(pz) = - ∑ pz log2 pz
Also die Summe der Produkte aus Auftrittswahrscheinlichkeit eines Symbols und dessen Logarithmus zur Basis der Anzahl der Symbole im Alphabet. Keine Ahnung wie die in der Grafik auf 28 Bit an Entropie für das Wort 1 "
Tr0ub4dor&3" kommen. Korrekt sind jedenfalls
H1=0.86 Bit
Die Basis sind ist dem Falle, wenn man von 24 Sonderzeichen ausgeht b= 48.
Für den Satz "correct horse battery staple" ergibt sich eine Entropie von
H2=2.32 Bit
Die Berechnung in der Grafik ist schon deswegen vom Ansatz nicht korrekt, weil man bei einem Wort aus der Linguistik nicht von einer Gleichverteilung der Symbole ausgehen kann. Z.B. hat das "t" in der englischen Sprache eine Autrittswahrscheinlichkeit von
p_t=0.724
und das "b" nur eine Auftrittswahrscheinlichkeit von
p_b=0.015
hat. Da hier ja auf das Schema
"ich denke mir einen Satz aus und ersetze bestimme Zeichen mit Sonderzeichen, also z.B. Leerzeichen mit '_' und e mit 3"
angespielt wird, erhöht sich die Entopie mit der Verwendung von Sonderzeichen nicht, wenn man davon ausgeht, dass man das Schema konsequent durchzieht und jedes Mal dieselben Zeichen durch dieselben Sonderzeichen ersetzt.
Die Wahscheinlichkeit jedoch, dass das Wort 1a "
Tr0ub4dor&3" in der Menge von Wörter inkl. Sonderzeichen vorkommt, ist ungleich geringer als die Wahrscheinlicheit des Wortes 1b "
Troubador". Nämlich
p1b=1 / 2,64181E+12
vs.
p1a=1 /3,1164E+18
Somit bietet die Variante inkl. Sonderzeichen hier einen drastischen Vorteil, wenn man von Bruteforce ausgeht.
Aber das ist wie gesagt nicht synonym mit "Entropie".