Vorwort zum Test: Ein Experiment auf zwei Ebenen
Mit diesem Lesertest verfolge ich zwei Hauptziele. Einerseits natürlich die Überprüfung der Samsung 9100 Pro und ihrer „SSD-Gefährten“ unter realistischen Umständen: Welche Auswirkungen hat eine aktuelle PCIe 5.0 SSD auf typische KI-Workloads, insbesondere auf die Ladezeiten? Andererseits – und das war für mich fast noch spannender – wollte ich herausfinden, wie gut KI-Modelle mittlerweile in der Bewältigung komplexer Planungsaufgaben geworden sind.
Da sich dieser Test zeitlich mit der Veröffentlichung von OpenAIs GPT-5.2 und Googles Gemini 3 überschnitt, nutzte ich den Anlass für ein Experiment: Ich ließ die KI die Planung und Durchführung dieses SSD-Tests übernehmen. Mit Ausnahme der manuellen CrystalDiskMark- und PCMark-Ergebnisse wurden alle hier gezeigten Tests und Skripte von GPT-5.2 erstellt. (Randnotiz: Versuche, den Test mit lokal gehosteten Modellen zu entwerfen, scheiterten leider – die Ansätze waren entweder untauglich, fehlerhaft oder führten zum Absturz des jeweiligen Modells.)
Das Vorgehen: Ich habe GPT-5.2 (Plus Version) mit meiner ComputerBase-Lestertest-Bewerbung gefüttert und um ein vollautomatisiertes Testkonzept gebeten. Das Ergebnis war eine Reihe von PowerShell- und Python-Skripten, die diverse Tests vollkommen automatisiert und somit zu 100 % reproduzierbar durchführten.
Bei der Auswertung und dem Verfassen des Testberichts stieß GPT-5.2 jedoch an seine Grenzen. Hier delegierte ich die Aufgabe an ein zweites Modell: Googles Gemini 3 Pro. Das Ergebnis, das wir gemeinsam erarbeitet haben, kann sich meines Erachtens absolut sehen lassen.
Ein Wort zum Aufwand: Wer nun glaubt, dass Entwurf und Durchführung mit ein bis zwei "Prompts" erledigt waren, den muss ich leider enttäuschen. Ich habe drei volle Tage (jeweils ca. 10 Stunden) mit Troubleshooting und Feintuning des von GPT-5.2 entworfenen Konzepts verbracht. Auch der Bericht selbst entstand nicht auf Knopfdruck; ich musste die Rohdaten mit Gemini punkteweise durchgehen, um ideale Ergebnisse zu erzielen. Meine Rolle reduzierte sich dabei oft auf gesunden Menschenverstand und eine Portion Skepsis – die technische Fehleranalyse und -behebung führten die KI-Modelle jedoch erstaunlich eigenständig durch, inklusive cleverer Rückfragen und der Anforderung von Logs oder Screenshots. Trotz der derzeit noch erforderlichen manuellen Eingriffe ist die Leistung der beiden KI-Modelle erstaunlich und eine echte Bereicherung im (Arbeits-)Alltag.
Den eigentlichen, detaillierten Testbericht habe ich als PDF-Datei angehängt, da dies deutlich lesefreundlicher ist als ein endloser Forum-Post.
Ich wünsche viel Spaß beim Lesen und hoffe, ihr findet die Hardware-Ergebnisse – und die Fähigkeiten aktueller KI-Modelle – genauso spannend wie ich.
„Die Samsung 9100 Pro 2TB wurde mir von Samsung für diesen Test zur Verfügung gestellt und ich darf sie im Anschluss behalten. Eine Einflussnahme auf den Testbericht oder eine Verpflichtung zur Veröffentlichung eines positiven Ergebnisses fand nicht statt.“
Versionshistorie:
19.12.2025: Publikation Version 1 des Lesertests
20.12.2025: Aufgrund des berechtigten Einwandes von @Rickmer (danke dafür) habe ich mir die Ergebnisse von Punkt 7 (Comfy UI) des Tests noch einmal angesehen und festgestellt, dass die Ergebnisse verfälscht waren (Das Löschen des Standby Caches funktionierte bei einigen Durchläufen aus nicht gänzlich klärbaren Gründen nicht zuverlässig). Eine aktualisierte Version des Berichts (Version 2) habe ich eingestellt (es hat sich gezeigt, dass es Abweichungen zwischen den Skript basiert ermittelten Werten und manuell ermittelten Pendants gibt). Ich werde in den kommenden Tagen auch die übrigen Ergebnisse noch einmal auf mögliche Abweichungen prüfen.
21.12.2025: Da ich auch in anderen Bereichen des Tests auf für mich nicht klärbare Ungereimtheiten bei den mittels Skript (KI-generiert) ermittelten Ergebnissen gestoßen bin, habe ich mich entschieden weite Teile des Tests durch manuelle Messungen zu ersetzen, die den Lesern nun einen plausiblen Eindruck von der SSD verschaffen sollten. Die neuen Ergebnisse finden sich in Version 3 meines Lesertests.
Mit diesem Lesertest verfolge ich zwei Hauptziele. Einerseits natürlich die Überprüfung der Samsung 9100 Pro und ihrer „SSD-Gefährten“ unter realistischen Umständen: Welche Auswirkungen hat eine aktuelle PCIe 5.0 SSD auf typische KI-Workloads, insbesondere auf die Ladezeiten? Andererseits – und das war für mich fast noch spannender – wollte ich herausfinden, wie gut KI-Modelle mittlerweile in der Bewältigung komplexer Planungsaufgaben geworden sind.
Da sich dieser Test zeitlich mit der Veröffentlichung von OpenAIs GPT-5.2 und Googles Gemini 3 überschnitt, nutzte ich den Anlass für ein Experiment: Ich ließ die KI die Planung und Durchführung dieses SSD-Tests übernehmen. Mit Ausnahme der manuellen CrystalDiskMark- und PCMark-Ergebnisse wurden alle hier gezeigten Tests und Skripte von GPT-5.2 erstellt. (Randnotiz: Versuche, den Test mit lokal gehosteten Modellen zu entwerfen, scheiterten leider – die Ansätze waren entweder untauglich, fehlerhaft oder führten zum Absturz des jeweiligen Modells.)
Das Vorgehen: Ich habe GPT-5.2 (Plus Version) mit meiner ComputerBase-Lestertest-Bewerbung gefüttert und um ein vollautomatisiertes Testkonzept gebeten. Das Ergebnis war eine Reihe von PowerShell- und Python-Skripten, die diverse Tests vollkommen automatisiert und somit zu 100 % reproduzierbar durchführten.
Bei der Auswertung und dem Verfassen des Testberichts stieß GPT-5.2 jedoch an seine Grenzen. Hier delegierte ich die Aufgabe an ein zweites Modell: Googles Gemini 3 Pro. Das Ergebnis, das wir gemeinsam erarbeitet haben, kann sich meines Erachtens absolut sehen lassen.
Ein Wort zum Aufwand: Wer nun glaubt, dass Entwurf und Durchführung mit ein bis zwei "Prompts" erledigt waren, den muss ich leider enttäuschen. Ich habe drei volle Tage (jeweils ca. 10 Stunden) mit Troubleshooting und Feintuning des von GPT-5.2 entworfenen Konzepts verbracht. Auch der Bericht selbst entstand nicht auf Knopfdruck; ich musste die Rohdaten mit Gemini punkteweise durchgehen, um ideale Ergebnisse zu erzielen. Meine Rolle reduzierte sich dabei oft auf gesunden Menschenverstand und eine Portion Skepsis – die technische Fehleranalyse und -behebung führten die KI-Modelle jedoch erstaunlich eigenständig durch, inklusive cleverer Rückfragen und der Anforderung von Logs oder Screenshots. Trotz der derzeit noch erforderlichen manuellen Eingriffe ist die Leistung der beiden KI-Modelle erstaunlich und eine echte Bereicherung im (Arbeits-)Alltag.
Den eigentlichen, detaillierten Testbericht habe ich als PDF-Datei angehängt, da dies deutlich lesefreundlicher ist als ein endloser Forum-Post.
Ich wünsche viel Spaß beim Lesen und hoffe, ihr findet die Hardware-Ergebnisse – und die Fähigkeiten aktueller KI-Modelle – genauso spannend wie ich.
„Die Samsung 9100 Pro 2TB wurde mir von Samsung für diesen Test zur Verfügung gestellt und ich darf sie im Anschluss behalten. Eine Einflussnahme auf den Testbericht oder eine Verpflichtung zur Veröffentlichung eines positiven Ergebnisses fand nicht statt.“
Versionshistorie:
19.12.2025: Publikation Version 1 des Lesertests
20.12.2025: Aufgrund des berechtigten Einwandes von @Rickmer (danke dafür) habe ich mir die Ergebnisse von Punkt 7 (Comfy UI) des Tests noch einmal angesehen und festgestellt, dass die Ergebnisse verfälscht waren (Das Löschen des Standby Caches funktionierte bei einigen Durchläufen aus nicht gänzlich klärbaren Gründen nicht zuverlässig). Eine aktualisierte Version des Berichts (Version 2) habe ich eingestellt (es hat sich gezeigt, dass es Abweichungen zwischen den Skript basiert ermittelten Werten und manuell ermittelten Pendants gibt). Ich werde in den kommenden Tagen auch die übrigen Ergebnisse noch einmal auf mögliche Abweichungen prüfen.
21.12.2025: Da ich auch in anderen Bereichen des Tests auf für mich nicht klärbare Ungereimtheiten bei den mittels Skript (KI-generiert) ermittelten Ergebnissen gestoßen bin, habe ich mich entschieden weite Teile des Tests durch manuelle Messungen zu ersetzen, die den Lesern nun einen plausiblen Eindruck von der SSD verschaffen sollten. Die neuen Ergebnisse finden sich in Version 3 meines Lesertests.
Anhänge
Zuletzt bearbeitet: