Goody schrieb:
Und sicher ist das ein gutes Stück Fleißarbeit damit man hinterher "was gemacht hat". Ist mir aber lieber als eine BA, in der ich nur Literatur suche und neu zusammen zitiere
Das ist löblich, vor allem da es ja auch genug gibt, die diese "Zusammenfassungs-BAs" schreiben, weils schlicht einfacher ist.
Nichtsdestoweniger war allerdings der "Fleißarbeitskommentar" meinerseits sowie die Kritik von
@new Account(), dass es derartige Aufgabenstellungen schon vielfach gab und entsprechend online zu finden ist. Deshalb meinte ich auch, dass das als Abschlussarbeit eine Fleißarbeit sei, sofern es nicht anteile wie etwa "eigenen Deep Learning Ansatz entwickeln und vergleichen mit 'herkömmlichen' Lösungen" beinhaltet.
Die ganze Aufgabenstellung ist eben alles andere als neu und natürlich kann man Objekte mit CNNs identifizieren. Da macht man halt Null selber oder neu, weil man für sowas z.B.
YOLO nehmen und mit deinen Trainingsdaten füttern kann. Auch bei "herkömmlichen" Machine Learning Ansätzen ist das kein Novum.
Ich sehe da also keinen tatsächlichen Forschungsanteil.
Selbstredend kennen wir aber deine konkrete Aufgabenstellung nicht. Wenn du beispielsweise eben einen eigenen Ansatz entwickelst und den beispielsweise mit YOLO vergleichst, dann wäre das ganze natürlich schon interessanter. Vor allem, wenn es hinterher auch robust genug funktioniert, dass etwa verschiedene Hintergründe, Spielzeugmünzen aus Brettspielen usw. keine respektive nur geringe Probleme für dein Modell darstellen.
Wobei aber eben sowas...
Goody schrieb:
Es soll gezeigt werden, wie/inwiefern das machbar ist mittels eines Convolutional Neural Network. Es geht also auch nicht um die 100% Genauigkeit.
...häufig auf nachimplementieren hinausläuft. Vor allem wenn man von Anfang an keine fixen Ziele verfolgt. Also natürlich wirst du mit einem CNN beispielsweise den Münzwert approximieren können, wenn die exakte Genauigkeit nicht so interessant ist, indem du jedes Trainingsbild einen entsprechenden Münzwert zuweist und das supervised trainierst. Allerdings ist (1) die Aufgabenstellung an sich schon trivial und (2) das hinterher nicht robust, wenn etwaige Testdaten mitunter stark von deinem Trainingsszenario abweichen, weil keine einzelnen Münzen detektiert werden sondern nur eine Gesamtsumme geschätzt wird.
Interessanter wäre es da halt schon etwa mit YOLO bounding boxes für jede einzelne Münze zu predicten und eben - wie bei YOLO üblich - für jede bounding box dann eine prediction zu welcher Klasse sie gehört (1 Cent, 2 Cent, 5 Cent, ...).
Besonders dann, wenn man dann noch einen eigenen Deep Learning Ansatz dafür entwickelt und mit YOLO vergleicht. YOLO ist auch vergleichsweise teuer, weil es so gut generalisiert. Bei einer beschränkten Anzahl an Klassen performen etwa FCNNs (fully convolutional neural network) sehr gut bei gleichzeitig hoher accuracy, precision, recall, ...
Da würde man dann im output heatmaps für jede Klasse predicten und später z.B. per OpenCV die bounding boxes in jeder heatmap finden.