[Leserartikel] Musik Thread - Was oder wer wurde wie oft gepostet.

Hallo Zusammen.

Vor ein paar Wochen, um die Weihnachtszeit, hatte sich bei mir der Gedanke festgesetzt wissen zu wollen was so alles an verschiedenen Titeln im "Musik-Thread" bisher gepostet wurde. Ausloeser war die Diskussion um "wham - last christmas" und "mariah carey - all i want for christmas is you". 😁

Die Theorie:
Rein gedanklich eine einfache Aufgabe. Man schreibt sich einen Script, welcher den Thread abgrast nach den pro Post vorhandenen Video-ID und schreibt das zeilenweise lokal weg in eine Textdatei. Ein weiter Script liest dann diese Datei dann zeilenweise aus und schickt Anfragen an Youtube um von dort die Videotitel als Antwort zu bekommen. In der Antworten wieder zeilenweise in eine Textdatei. Diese zweite Textdatei kann man dann mit einem dritten Script zusammen zaehlen / auswerten lassen. Hier waere interessant welcher Artist wie oft und natuerlich auch wie oft ein Titel gepostet wurde.

Die Praxis: (Die verwendeten Scripte/Dateien packe ich ein 7z-Archiv und haenge das an diesen Beitrag)
Das Abgrasen durch mich per Script haette extrem lange gedauert. Also habe ich @Steffen gebeten ob er mir das Gewuenschte (also die Links zu den Videos bzw. den Eintrag des eingebetteten Videos) zur Verfuegung stellen kann. Im Ergebnis erhielt ich vom ihm eine Textdatei mit 35413 Zeilen. Letzter beruecksichtigter Post darin ist der #35094 vom 10.02.2026.

Da sich ueber die Jahre das Ablegen / die Verlinkung in den Post geaendert hatte gibt es im Grunde drei Varianten.

Code:
https://youtu.be/4Dl6JsEAeaI
https://www.youtube.com/watch?v=4_3iw-b5inA
[MEDIA=youtube]kA9uaBqvRtA[/MEDIA]

In allen Faellen gleich ist, dass eine 11 stellige Video-Id vorhanden ist. Diese Video-Id zu extrahieren uebernahm ein Python-Script (txt_id_extract.py).
Python deshalb weil ich rudimentaere Kenntnisse darin habe, den Sohn fragen kann und am Ende auch ChatGPT um Hilfe gerufen werden konnte.
Durch das gezielte Extrahieren wurden Zeilen welche keine Video-Id von Youtube enthielten eliminiert. Das waren 520 Zeilen. Meistens tiny.url, Verweise innerhalb des Froums, Spotify.

Die enstandene Datei (raw_youtube_ids.csv) mit 34893 Zeilen wurde als Quelle fuer die Anfragen an Youtube genutzt. Der Script (yt_ask,py) lief ungefaehr 11 Stunden, brachte im Ergebnis 30849 positive Antworten (youtube_videos_final.csv). Wegen "privat/geloescht/ungueltige-Id/nur mit Anmeldung" wurden 4044 Zeilen nicht gewertet.

In der Masse ist das Ergebnis so wie hier.

Code:
MNjM9JWstVU,Black Magic Six - Hudaa
yTKzrE6Z_ws,Aerosmith - Sweet Emotion (Rock For The Rising Sun) ~1080p HD
Md0wQUrwXmo,Jack Beats - Get Down Full Version

Allerdings auch ein Haufen Muell.
Das liegt einfach daran das die Ersteller bei Youtube Eintraege machten welche sich nicht wirklich in einen Standard aka Artist - Titel hielten. Da steht oft nur der Titel wenn ueberhaupt, eine Masse von kleinen Grafiken, bunte HTML-Zeichen usw.

Code:
4qPSHOTzidw,水曜日のカンパネラ『メロス』
wUfKbWyr-OM,Summer Son
CgGA38zh6do,"""FREE SPIRIT"""
OQOySC27i_0,🔴 RuRu的聖誕節鋼琴直播🎄🎹 來抽海量禮物吧!🎁Christmas Piano Livestream 🎅 クリスマス ピアノ 生放送🦌

Am Ende 8344 Zeilen (festgestellt per yt_extract_artist_song.py) die man manuell nachkorrigieren muesste indem man das Video aufruft, versucht herauszufinden wer da was gesungen hat und das zurueck in die Datei (youtube_videos_final.csv) schreibt. Dann den Script wieder laufen lassen. Zuviel Aufwand fuer mich.

Die angelegt Datei youtube_artist_song.csv mit gueltigen Eintraegen hat immerhin noch 22483 Zeilen welche per yt_extract.py passend fuer die Auswertung gemacht wurden. In der enstehenden Datei yt_songs_raw.csv wurden dann noch manuell kleine Korrekturen durchgefuehrt.

Code:
natalie imbruglia,torn
philipp dittberner & marv,wolke 4
archie,verano
knorkator,alter mann

Nun zum Ergebnis.
Erzeugt mit dem Script yt_fuzzy_merge_complete.py. Die Grundidee der Umsetzung hatte mein Sohn, komplettiert hat ChatGPT. Wir haben uns dafuer entschieden die Schreibweisen der Artisten / Titel zu normalisieren.

Top 50 Artisten:

ArtistAnzahl
rammstein
die ärzte
queen
abba
nightwish
feuerschwanz
acdc
sabaton
alligatoah
michael jackson
depeche mode
nirvana
deep purple
red hot chili peppers
the rolling stones
madonna
deichkind
pink floyd
lord of the lost
david bowie
knorkator
the beatles
aerosmith
within temptation
billy idol
genesis
mono inc
judas priest
dire straits
iron maiden
electric callboy
herbert grönemeyer
bruce springsteen
reinhard mey
die apokalyptischen reiter
the cure
five finger death punch
electric light orchestra
u2
babymetal
led zeppelin
disturbed
elton john
scooter
kreator
phil collins
scorpions
billy talent
system of a down
dartagnan
157
102
76
71
70
70
67
57
53
52
51
51
50
49
48
48
46
46
46
45
45
39
38
38
37
37
37
37
36
36
36
35
35
35
35
34
34
34
34
34
33
33
33
32
32
31
31
31
31
31


Top 50 Titel:

TitelAnzahl
faithless - insomnia
rammstein - deutschland
toto - africa
soundgarden - black hole sun
4 non blondes - whats up
ram jam - black betty
depeche mode - enjoy the silence
whigfield - saturday night
red hot chili peppers - snow
nirvana - smells like teen spirit
tears for fears - everybody wants to rule the world
van halen - jump
alannah myles - black velvet
the cranberries - zombie
billy idol - white wedding
laura branigan - self control
gala - freed from desire
kiss - i was made for lovin you
journey - dont stop believin
babymetal x electriccallboy - ratatata
genesis - land of confusion
the cure - lullaby
acdc - thunderstruck
styx - boat on the river
nightwish - sleeping sun
deichkind - wer sagt denn das
talk talk - such a shame
dire straits - sultans of swing
boston - more than a feeling
rammstein - amerika
anne clark - our darkness
tears for fears - shout
new order - blue monday
wham - last christmas
melanie thornton - wonderful dream
earth & fire - weekend
rammstein - zeit
visage - fade to grey
the hooters - johnny b
adele - hello
the who - baba oriley
zz top - rough boy
jon secada - just another day
david bowie - lazarus
vanilla ice - ice ice baby
the dead south - in hell ill be in good company
roxette - it must have been love
fools garden - lemon tree
alice cooper - poison
phil collins - in the air tonight
14
11
11
10
10
10
10
10
9
9
9
9
9
9
9
9
9
9
9
9
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
7
7
7
7
7
7
7
7
7
7
7
7
7

Die kompletten Zahlen sind fuer Interessierte in den Dateien yt_artist_stats_fuzzy.csv und yt_song_stats_fuzzy.csv zu finden. Wer seine selbst geposteten Titel nicht wieder findet sollte nachsehen wie das Ding bei Youtube angezeigt wird. Die Gruende warum da nicht beruecksichtigt wurde habe ich genannt.

Fuer mich persoenlich ist die Neugier befriedigt. Ich hoffe fuer manch Anderen Mitleser auch.

BFF

P.S.
Wenn dieser Artikel in einem anderen Bereich besser aufgehoben ist, bitte verschieben.
 

Anhänge

  • Gefällt mir
Reaktionen: Skaiy, rezzler, andi_sco und 11 andere
Cooles Projekt. Auch wenn ich den Script-Teil nicht verstehe. 😅

Für eine grobe Tendenz ist das doch vollkommen ausreichend.

Dadurch, dass mehr oder weniger immer die selben User dort aktiv sind, wird auch mehr oder weniger häufig die selbe Musik geteilt.
 
  • Gefällt mir
Reaktionen: BFF, Tom_Callaghan und Banger
Zurück
Oben