Gleichmässige Zahlenliste

haeuslebauer · 22. Dezember 2018

Hi!

Vielleicht könnt ihr mir hier helfen :-)

Ich muss eine Vielzahl von Polygonen vergleichen, je nachdem wie gleichmässig lang deren Kanten sind. Hier ein Beispiel:

Polygon A:
44.011314
64.577305
63.290806
32.238241
75.848936
86.869706
44.087107

Polygon B:
59.95591
107.072162
39.49337
55.495476
77.798456
45.199775

Wie bewerte ich hier die Gleichmässigkeit der Kantenlängen, bzw. deren Abweichung am besten?

Durchschnitt errechnen und jede Kante damit vergleichen, dann Schnitt errechnen?

Grüße!

Bunkeropfer · 22. Dezember 2018

Da fällt mir die Standardabweichung ein, also die "mittlere Abweichung vom Mittelwert", als Wurzel der Varianz

https://de.wikipedia.org/wiki/Varianz_(Stochastik)

Je kleiner dieser Wert ist, desto geringer ist im Mittel die Abweichung vom Mittelwert.
Für deine Polygone gäbe das z.B.:
Polygon 1: Mittelwert 58.703.345 Standardabw.: 19.462.593
Polygon 2: Mittelwert 49.251.800 Standardabw.: 40.340.850

Wenn du das mit Excel machen möchtest: "=STABW(Bereich)"

Mensor · 22. Dezember 2018

Für jedes Polygon den Mittelwert

errechnen und daraus dann die Streuung

.
Wenn ich keinen Denkfehler habe sollte, je größer die Streeung ist, desto ungleicher die Kantenlängen.

Bunkeropfer · 22. Dezember 2018

In beiden Fällen kannst du die relative Abweichung/Streuung bestimmen. Einfach
"Abweichung : Mittelwert" berechnen, dann bekommst du die relative Abweichung - unabhängig vom Mittelwert.
Ist vor allem bei vielen unterschiedlich großen Polygonen hilfreich (weil größenunabhängig)
Poly 1: 0,332=33,2%
Poly 2: 0,819=81,9%

@Mensor: Das ist im Prinzip das von mir

haeuslebauer · 22. Dezember 2018

Danke für die guten Tipps!

new Account() · 22. Dezember 2018

Nennt sich Variationskoeffizient.
https://de.m.wikipedia.org/wiki/Variationskoeffizient

Xenons · 23. Dezember 2018

Oh je. Da gibt es ganze Lehrbücher zu dieser Frage.
Einfachstes wäre Standardabweichung jedoch nicht unbedingt genaugenug. Ein anderer Ansatz wäre ein Vertrauensintervall von 95% oder höher.

BeBur · 23. Dezember 2018

Generell fällt das ganze in den Bereich, der sich 'deskriptive Statistik' nennt.

bzw. sobald du dann wissen willst, ob z.B. die Mittelwerte signifikant abweichen (zum Beispiel mit t-test varianten), nennt sich das dann 'induktive Statistik'.

Da du aber selber nicht konkret zu wissen scheinst, was du machen willst würde es vermutlich helfen zu wissen 'warum' du es machen willst.

new Account() · 23. Dezember 2018

Xenons schrieb:
Einfachstes wäre Standardabweichung jedoch nicht unbedingt genaugenug.

Warum? Warum ist das Vertrauensintervall ein besseres Maß?

Xenons · 23. Dezember 2018

@new Account() Standardabweichung dekt einen viel zu kleinen Bereich ab oder anders rum gesagt deine Abweichungen werden sehr häufig auserhalb deiner berechneten Standardabweichung liegen.

Wozu musst du überhaupt die Kanten vergleichen? Bzw. was willst du aus diesem Vergleich lernen.

new Account() · 23. Dezember 2018

Das tun sie, Aber es ist ja auch nur ein Maß für den Grad Abweichung unter den Kanten und keiner für die letztendliche Abweichung.

Xenons · 23. Dezember 2018

Klar hat das Vertrauensintervall was mit Standardabweichung zu tun da es ja auch in der Formel zu Berechnung drin stekt. Ist aber trotzdem nicht identisch.

Was willst du den machen mit der gleichmäßigkeit der Kanten?

haeuslebauer · 24. Dezember 2018

Hi! Die Frage kam von mir, die Kantenlänge soll im nächsten Schritt optimiert werden, also gleichmässig gemacht werden. Grüße!

BeBur · 24. Dezember 2018

Dann mach alle Kanten gleichlang, auf diese Weise hast du das höchste Maß an Gleichmäßigkeit.
Oder du fängst an, dir mal etwas Mühe hier zu geben.

Xenons · 24. Dezember 2018

@haeuslebauer da reicht dir dann Varianz. Sparst dir im vergleich zu Standardabweichung die Wurzel zu bilden.

psYcho-edgE · 25. Dezember 2018

Xenons schrieb:
Sparst dir im vergleich zu Standardabweichung die Wurzel zu bilden.

Was nun aber nicht das größte Problem darstellen sollte. Funktionen wie sqrt(number) gibt's in fast jeder Programmiersprache.

BeBur · 25. Dezember 2018

psYcho-edgE schrieb:
Was nun aber nicht das größte Problem darstellen sollte. Funktionen wie sqrt(number) gibt's in fast jeder Programmiersprache.

Er meint vermutlich eher die Performance. Ob das eine Rolle hier spielt kann man allerdings nur raten.

psYcho-edgE · 25. Dezember 2018

@BeBur denke die Performance hängt davon ab, wie viele der Dreiecke er beackern muss. Je nach Menge der Dreiecke würde ich entweder die Wurzel weglassen, was ungenauer ist aber bei serieller Abarbeitung natürlich schneller ist oder direkt den Spaß mit mehreren Worker-Threads auslagern, je nach Möglichkeiten der Programmiersprache.

BeBur · 25. Dezember 2018

Die Wurzel der Standardabweichung muss ja unabhängig der Anzahl der Dreiecke nur einmal berechnet werden.
Falls die Performance überhaupt eine Rolle spielt.

psYcho-edgE · 25. Dezember 2018

Stimmt, dann sollte das eigentlich nicht ausschlaggebend für die Performance sein. Wurzeln ziehen selbst aus größeren Floats dauert meist nur wenige Mikrosekunden mit halbwegs aktuellen CPUs.

Gleichmässige Zahlenliste

Lt. Commander

Lt. Junior Grade

Lt. Junior Grade

Lt. Junior Grade

Lt. Commander

Banned

Xenons

Gast

Commodore

Banned

Xenons

Gast

Banned

Xenons

Gast

Lt. Commander

Commodore

Xenons

Gast

Admiral

Commodore

Admiral

Commodore

Admiral

Ähnliche Themen