Hallo Zusammen.
Vor ein paar Wochen, um die Weihnachtszeit, hatte sich bei mir der Gedanke festgesetzt wissen zu wollen was so alles an verschiedenen Titeln im "Musik-Thread" bisher gepostet wurde. Ausloeser war die Diskussion um "wham - last christmas" und "mariah carey - all i want for christmas is you". 😁
Die Theorie:
Rein gedanklich eine einfache Aufgabe. Man schreibt sich einen Script, welcher den Thread abgrast nach den pro Post vorhandenen Video-ID und schreibt das zeilenweise lokal weg in eine Textdatei. Ein weiter Script liest dann diese Datei dann zeilenweise aus und schickt Anfragen an Youtube um von dort die Videotitel als Antwort zu bekommen. In der Antworten wieder zeilenweise in eine Textdatei. Diese zweite Textdatei kann man dann mit einem dritten Script zusammen zaehlen / auswerten lassen. Hier waere interessant welcher Artist wie oft und natuerlich auch wie oft ein Titel gepostet wurde.
Die Praxis: (Die verwendeten Scripte/Dateien packe ich ein 7z-Archiv und haenge das an diesen Beitrag)
Das Abgrasen durch mich per Script haette extrem lange gedauert. Also habe ich @Steffen gebeten ob er mir das Gewuenschte (also die Links zu den Videos bzw. den Eintrag des eingebetteten Videos) zur Verfuegung stellen kann. Im Ergebnis erhielt ich vom ihm eine Textdatei mit 35413 Zeilen. Letzter beruecksichtigter Post darin ist der #35094 vom 10.02.2026.
Da sich ueber die Jahre das Ablegen / die Verlinkung in den Post geaendert hatte gibt es im Grunde drei Varianten.
In allen Faellen gleich ist, dass eine 11 stellige Video-Id vorhanden ist. Diese Video-Id zu extrahieren uebernahm ein Python-Script (txt_id_extract.py).
Python deshalb weil ich rudimentaere Kenntnisse darin habe, den Sohn fragen kann und am Ende auch ChatGPT um Hilfe gerufen werden konnte.
Durch das gezielte Extrahieren wurden Zeilen welche keine Video-Id von Youtube enthielten eliminiert. Das waren 520 Zeilen. Meistens tiny.url, Verweise innerhalb des Froums, Spotify.
Die enstandene Datei (raw_youtube_ids.csv) mit 34893 Zeilen wurde als Quelle fuer die Anfragen an Youtube genutzt. Der Script (yt_ask,py) lief ungefaehr 11 Stunden, brachte im Ergebnis 30849 positive Antworten (youtube_videos_final.csv). Wegen "privat/geloescht/ungueltige-Id/nur mit Anmeldung" wurden 4044 Zeilen nicht gewertet.
In der Masse ist das Ergebnis so wie hier.
Allerdings auch ein Haufen Muell.
Das liegt einfach daran das die Ersteller bei Youtube Eintraege machten welche sich nicht wirklich in einen Standard aka Artist - Titel hielten. Da steht oft nur der Titel wenn ueberhaupt, eine Masse von kleinen Grafiken, bunte HTML-Zeichen usw.
Am Ende 8344 Zeilen (festgestellt per yt_extract_artist_song.py) die man manuell nachkorrigieren muesste indem man das Video aufruft, versucht herauszufinden wer da was gesungen hat und das zurueck in die Datei (youtube_videos_final.csv) schreibt. Dann den Script wieder laufen lassen. Zuviel Aufwand fuer mich.
Die angelegt Datei youtube_artist_song.csv mit gueltigen Eintraegen hat immerhin noch 22483 Zeilen welche per yt_extract.py passend fuer die Auswertung gemacht wurden. In der enstehenden Datei yt_songs_raw.csv wurden dann noch manuell kleine Korrekturen durchgefuehrt.
Nun zum Ergebnis.
Erzeugt mit dem Script yt_fuzzy_merge_complete.py. Die Grundidee der Umsetzung hatte mein Sohn, komplettiert hat ChatGPT. Wir haben uns dafuer entschieden die Schreibweisen der Artisten / Titel zu normalisieren.
Top 50 Artisten:
Top 50 Titel:
Die kompletten Zahlen sind fuer Interessierte in den Dateien yt_artist_stats_fuzzy.csv und yt_song_stats_fuzzy.csv zu finden. Wer seine selbst geposteten Titel nicht wieder findet sollte nachsehen wie das Ding bei Youtube angezeigt wird. Die Gruende warum da nicht beruecksichtigt wurde habe ich genannt.
Fuer mich persoenlich ist die Neugier befriedigt. Ich hoffe fuer manch Anderen Mitleser auch.
BFF
P.S.
Wenn dieser Artikel in einem anderen Bereich besser aufgehoben ist, bitte verschieben.
Vor ein paar Wochen, um die Weihnachtszeit, hatte sich bei mir der Gedanke festgesetzt wissen zu wollen was so alles an verschiedenen Titeln im "Musik-Thread" bisher gepostet wurde. Ausloeser war die Diskussion um "wham - last christmas" und "mariah carey - all i want for christmas is you". 😁
Die Theorie:
Rein gedanklich eine einfache Aufgabe. Man schreibt sich einen Script, welcher den Thread abgrast nach den pro Post vorhandenen Video-ID und schreibt das zeilenweise lokal weg in eine Textdatei. Ein weiter Script liest dann diese Datei dann zeilenweise aus und schickt Anfragen an Youtube um von dort die Videotitel als Antwort zu bekommen. In der Antworten wieder zeilenweise in eine Textdatei. Diese zweite Textdatei kann man dann mit einem dritten Script zusammen zaehlen / auswerten lassen. Hier waere interessant welcher Artist wie oft und natuerlich auch wie oft ein Titel gepostet wurde.
Die Praxis: (Die verwendeten Scripte/Dateien packe ich ein 7z-Archiv und haenge das an diesen Beitrag)
Das Abgrasen durch mich per Script haette extrem lange gedauert. Also habe ich @Steffen gebeten ob er mir das Gewuenschte (also die Links zu den Videos bzw. den Eintrag des eingebetteten Videos) zur Verfuegung stellen kann. Im Ergebnis erhielt ich vom ihm eine Textdatei mit 35413 Zeilen. Letzter beruecksichtigter Post darin ist der #35094 vom 10.02.2026.
Da sich ueber die Jahre das Ablegen / die Verlinkung in den Post geaendert hatte gibt es im Grunde drei Varianten.
Code:
https://youtu.be/4Dl6JsEAeaI
https://www.youtube.com/watch?v=4_3iw-b5inA
[MEDIA=youtube]kA9uaBqvRtA[/MEDIA]
In allen Faellen gleich ist, dass eine 11 stellige Video-Id vorhanden ist. Diese Video-Id zu extrahieren uebernahm ein Python-Script (txt_id_extract.py).
Python deshalb weil ich rudimentaere Kenntnisse darin habe, den Sohn fragen kann und am Ende auch ChatGPT um Hilfe gerufen werden konnte.
Durch das gezielte Extrahieren wurden Zeilen welche keine Video-Id von Youtube enthielten eliminiert. Das waren 520 Zeilen. Meistens tiny.url, Verweise innerhalb des Froums, Spotify.
Die enstandene Datei (raw_youtube_ids.csv) mit 34893 Zeilen wurde als Quelle fuer die Anfragen an Youtube genutzt. Der Script (yt_ask,py) lief ungefaehr 11 Stunden, brachte im Ergebnis 30849 positive Antworten (youtube_videos_final.csv). Wegen "privat/geloescht/ungueltige-Id/nur mit Anmeldung" wurden 4044 Zeilen nicht gewertet.
In der Masse ist das Ergebnis so wie hier.
Code:
MNjM9JWstVU,Black Magic Six - Hudaa
yTKzrE6Z_ws,Aerosmith - Sweet Emotion (Rock For The Rising Sun) ~1080p HD
Md0wQUrwXmo,Jack Beats - Get Down Full Version
Allerdings auch ein Haufen Muell.
Das liegt einfach daran das die Ersteller bei Youtube Eintraege machten welche sich nicht wirklich in einen Standard aka Artist - Titel hielten. Da steht oft nur der Titel wenn ueberhaupt, eine Masse von kleinen Grafiken, bunte HTML-Zeichen usw.
Code:
4qPSHOTzidw,水曜日のカンパネラ『メロス』
wUfKbWyr-OM,Summer Son
CgGA38zh6do,"""FREE SPIRIT"""
OQOySC27i_0,🔴 RuRu的聖誕節鋼琴直播🎄🎹 來抽海量禮物吧!🎁Christmas Piano Livestream 🎅 クリスマス ピアノ 生放送🦌
Am Ende 8344 Zeilen (festgestellt per yt_extract_artist_song.py) die man manuell nachkorrigieren muesste indem man das Video aufruft, versucht herauszufinden wer da was gesungen hat und das zurueck in die Datei (youtube_videos_final.csv) schreibt. Dann den Script wieder laufen lassen. Zuviel Aufwand fuer mich.
Die angelegt Datei youtube_artist_song.csv mit gueltigen Eintraegen hat immerhin noch 22483 Zeilen welche per yt_extract.py passend fuer die Auswertung gemacht wurden. In der enstehenden Datei yt_songs_raw.csv wurden dann noch manuell kleine Korrekturen durchgefuehrt.
Code:
natalie imbruglia,torn
philipp dittberner & marv,wolke 4
archie,verano
knorkator,alter mann
Nun zum Ergebnis.
Erzeugt mit dem Script yt_fuzzy_merge_complete.py. Die Grundidee der Umsetzung hatte mein Sohn, komplettiert hat ChatGPT. Wir haben uns dafuer entschieden die Schreibweisen der Artisten / Titel zu normalisieren.
Top 50 Artisten:
| Artist | Anzahl |
| rammstein die ärzte queen abba nightwish feuerschwanz acdc sabaton alligatoah michael jackson depeche mode nirvana deep purple red hot chili peppers the rolling stones madonna deichkind pink floyd lord of the lost david bowie knorkator the beatles aerosmith within temptation billy idol genesis mono inc judas priest dire straits iron maiden electric callboy herbert grönemeyer bruce springsteen reinhard mey die apokalyptischen reiter the cure five finger death punch electric light orchestra u2 babymetal led zeppelin disturbed elton john scooter kreator phil collins scorpions billy talent system of a down dartagnan | 157 102 76 71 70 70 67 57 53 52 51 51 50 49 48 48 46 46 46 45 45 39 38 38 37 37 37 37 36 36 36 35 35 35 35 34 34 34 34 34 33 33 33 32 32 31 31 31 31 31 |
Top 50 Titel:
| Titel | Anzahl |
| faithless - insomnia rammstein - deutschland toto - africa soundgarden - black hole sun 4 non blondes - whats up ram jam - black betty depeche mode - enjoy the silence whigfield - saturday night red hot chili peppers - snow nirvana - smells like teen spirit tears for fears - everybody wants to rule the world van halen - jump alannah myles - black velvet the cranberries - zombie billy idol - white wedding laura branigan - self control gala - freed from desire kiss - i was made for lovin you journey - dont stop believin babymetal x electriccallboy - ratatata genesis - land of confusion the cure - lullaby acdc - thunderstruck styx - boat on the river nightwish - sleeping sun deichkind - wer sagt denn das talk talk - such a shame dire straits - sultans of swing boston - more than a feeling rammstein - amerika anne clark - our darkness tears for fears - shout new order - blue monday wham - last christmas melanie thornton - wonderful dream earth & fire - weekend rammstein - zeit visage - fade to grey the hooters - johnny b adele - hello the who - baba oriley zz top - rough boy jon secada - just another day david bowie - lazarus vanilla ice - ice ice baby the dead south - in hell ill be in good company roxette - it must have been love fools garden - lemon tree alice cooper - poison phil collins - in the air tonight | 14 11 11 10 10 10 10 10 9 9 9 9 9 9 9 9 9 9 9 9 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 7 7 7 7 7 7 7 7 7 7 7 7 7 |
Die kompletten Zahlen sind fuer Interessierte in den Dateien yt_artist_stats_fuzzy.csv und yt_song_stats_fuzzy.csv zu finden. Wer seine selbst geposteten Titel nicht wieder findet sollte nachsehen wie das Ding bei Youtube angezeigt wird. Die Gruende warum da nicht beruecksichtigt wurde habe ich genannt.
Fuer mich persoenlich ist die Neugier befriedigt. Ich hoffe fuer manch Anderen Mitleser auch.
BFF
P.S.
Wenn dieser Artikel in einem anderen Bereich besser aufgehoben ist, bitte verschieben.