Gleichmässige Zahlenliste

haeuslebauer

Lt. Commander
Registriert
Dez. 2010
Beiträge
1.364
Hi!

Vielleicht könnt ihr mir hier helfen :-)

Ich muss eine Vielzahl von Polygonen vergleichen, je nachdem wie gleichmässig lang deren Kanten sind. Hier ein Beispiel:

Polygon A:
44.011314
64.577305
63.290806
32.238241
75.848936
86.869706
44.087107

Polygon B:
59.95591
107.072162
39.49337
55.495476
77.798456
45.199775

Wie bewerte ich hier die Gleichmässigkeit der Kantenlängen, bzw. deren Abweichung am besten?

Durchschnitt errechnen und jede Kante damit vergleichen, dann Schnitt errechnen?

Grüße!
 
Da fällt mir die Standardabweichung ein, also die "mittlere Abweichung vom Mittelwert", als Wurzel der Varianz

https://de.wikipedia.org/wiki/Varianz_(Stochastik)

Je kleiner dieser Wert ist, desto geringer ist im Mittel die Abweichung vom Mittelwert.
Für deine Polygone gäbe das z.B.:
Polygon 1: Mittelwert 58.703.345 Standardabw.: 19.462.593
Polygon 2: Mittelwert 49.251.800 Standardabw.: 40.340.850

Wenn du das mit Excel machen möchtest: "=STABW(Bereich)"
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: psYcho-edgE, BeBur und haeuslebauer
Für jedes Polygon den Mittelwert
Mittelwert.PNG
errechnen und daraus dann die Streuung
Streuung.PNG
.
Wenn ich keinen Denkfehler habe sollte, je größer die Streeung ist, desto ungleicher die Kantenlängen.
 
  • Gefällt mir
Reaktionen: psYcho-edgE und haeuslebauer
In beiden Fällen kannst du die relative Abweichung/Streuung bestimmen. Einfach
"Abweichung : Mittelwert" berechnen, dann bekommst du die relative Abweichung - unabhängig vom Mittelwert.
Ist vor allem bei vielen unterschiedlich großen Polygonen hilfreich (weil größenunabhängig)
Poly 1: 0,332=33,2%
Poly 2: 0,819=81,9%

@Mensor: Das ist im Prinzip das von mir :cool_alt:
 
  • Gefällt mir
Reaktionen: psYcho-edgE und haeuslebauer
Danke für die guten Tipps!
 
Oh je. Da gibt es ganze Lehrbücher zu dieser Frage.
Einfachstes wäre Standardabweichung jedoch nicht unbedingt genaugenug. Ein anderer Ansatz wäre ein Vertrauensintervall von 95% oder höher.
 
  • Gefällt mir
Reaktionen: haeuslebauer
Generell fällt das ganze in den Bereich, der sich 'deskriptive Statistik' nennt.

bzw. sobald du dann wissen willst, ob z.B. die Mittelwerte signifikant abweichen (zum Beispiel mit t-test varianten), nennt sich das dann 'induktive Statistik'.

Da du aber selber nicht konkret zu wissen scheinst, was du machen willst würde es vermutlich helfen zu wissen 'warum' du es machen willst.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: psYcho-edgE
@new Account() Standardabweichung dekt einen viel zu kleinen Bereich ab oder anders rum gesagt deine Abweichungen werden sehr häufig auserhalb deiner berechneten Standardabweichung liegen.

Wozu musst du überhaupt die Kanten vergleichen? Bzw. was willst du aus diesem Vergleich lernen.
 
Das tun sie, Aber es ist ja auch nur ein Maß für den Grad Abweichung unter den Kanten und keiner für die letztendliche Abweichung.
 
Klar hat das Vertrauensintervall was mit Standardabweichung zu tun da es ja auch in der Formel zu Berechnung drin stekt. Ist aber trotzdem nicht identisch.

Was willst du den machen mit der gleichmäßigkeit der Kanten?
 
Hi! Die Frage kam von mir, die Kantenlänge soll im nächsten Schritt optimiert werden, also gleichmässig gemacht werden. Grüße!
 
Dann mach alle Kanten gleichlang, auf diese Weise hast du das höchste Maß an Gleichmäßigkeit.
Oder du fängst an, dir mal etwas Mühe hier zu geben.
 
Xenons schrieb:
Sparst dir im vergleich zu Standardabweichung die Wurzel zu bilden.

Was nun aber nicht das größte Problem darstellen sollte. Funktionen wie sqrt(number) gibt's in fast jeder Programmiersprache.
 
psYcho-edgE schrieb:
Was nun aber nicht das größte Problem darstellen sollte. Funktionen wie sqrt(number) gibt's in fast jeder Programmiersprache.
Er meint vermutlich eher die Performance. Ob das eine Rolle hier spielt kann man allerdings nur raten.
 
  • Gefällt mir
Reaktionen: psYcho-edgE
@BeBur denke die Performance hängt davon ab, wie viele der Dreiecke er beackern muss. Je nach Menge der Dreiecke würde ich entweder die Wurzel weglassen, was ungenauer ist aber bei serieller Abarbeitung natürlich schneller ist oder direkt den Spaß mit mehreren Worker-Threads auslagern, je nach Möglichkeiten der Programmiersprache.
 
Die Wurzel der Standardabweichung muss ja unabhängig der Anzahl der Dreiecke nur einmal berechnet werden.
Falls die Performance überhaupt eine Rolle spielt.
 
Zurück
Oben