[Leserartikel] Musik Thread - Was oder wer wurde wie oft gepostet.

Hallo Zusammen.

Vor ein paar Wochen, um die Weihnachtszeit, hatte sich bei mir der Gedanke festgesetzt wissen zu wollen was so alles an verschiedenen Titeln im "Musik-Thread" bisher gepostet wurde. Ausloeser war die Diskussion um "wham - last christmas" und "mariah carey - all i want for christmas is you". 😁

Die Theorie:
Rein gedanklich eine einfache Aufgabe. Man schreibt sich einen Script, welcher den Thread abgrast nach den pro Post vorhandenen Video-ID und schreibt das zeilenweise lokal weg in eine Textdatei. Ein weiter Script liest dann diese Datei dann zeilenweise aus und schickt Anfragen an Youtube um von dort die Videotitel als Antwort zu bekommen. In der Antworten wieder zeilenweise in eine Textdatei. Diese zweite Textdatei kann man dann mit einem dritten Script zusammen zaehlen / auswerten lassen. Hier waere interessant welcher Artist wie oft und natuerlich auch wie oft ein Titel gepostet wurde.

Die Praxis: (Die verwendeten Scripte/Dateien packe ich ein 7z-Archiv und haenge das an diesen Beitrag)
Das Abgrasen durch mich per Script haette extrem lange gedauert. Also habe ich @Steffen gebeten ob er mir das Gewuenschte (also die Links zu den Videos bzw. den Eintrag des eingebetteten Videos) zur Verfuegung stellen kann. Im Ergebnis erhielt ich vom ihm eine Textdatei mit 35413 Zeilen. Letzter beruecksichtigter Post darin ist der #35094 vom 10.02.2026.

Da sich ueber die Jahre das Ablegen / die Verlinkung in den Post geaendert hatte gibt es im Grunde drei Varianten.

Code:
https://youtu.be/4Dl6JsEAeaI
https://www.youtube.com/watch?v=4_3iw-b5inA
[MEDIA=youtube]kA9uaBqvRtA[/MEDIA]

In allen Faellen gleich ist, dass eine 11 stellige Video-Id vorhanden ist. Diese Video-Id zu extrahieren uebernahm ein Python-Script (txt_id_extract.py).
Python deshalb weil ich rudimentaere Kenntnisse darin habe, den Sohn fragen kann und am Ende auch ChatGPT um Hilfe gerufen werden konnte.
Durch das gezielte Extrahieren wurden Zeilen welche keine Video-Id von Youtube enthielten eliminiert. Das waren 520 Zeilen. Meistens tiny.url, Verweise innerhalb des Froums, Spotify.

Die enstandene Datei (raw_youtube_ids.csv) mit 34893 Zeilen wurde als Quelle fuer die Anfragen an Youtube genutzt. Der Script (yt_ask,py) lief ungefaehr 11 Stunden, brachte im Ergebnis 30849 positive Antworten (youtube_videos_final.csv). Wegen "privat/geloescht/ungueltige-Id/nur mit Anmeldung" wurden 4044 Zeilen nicht gewertet.

In der Masse ist das Ergebnis so wie hier.

Code:
MNjM9JWstVU,Black Magic Six - Hudaa
yTKzrE6Z_ws,Aerosmith - Sweet Emotion (Rock For The Rising Sun) ~1080p HD
Md0wQUrwXmo,Jack Beats - Get Down Full Version

Allerdings auch ein Haufen Muell.
Das liegt einfach daran das die Ersteller bei Youtube Eintraege machten welche sich nicht wirklich in einen Standard aka Artist - Titel hielten. Da steht oft nur der Titel wenn ueberhaupt, eine Masse von kleinen Grafiken, bunte HTML-Zeichen usw.

Code:
4qPSHOTzidw,水曜日のカンパネラ『メロス』
wUfKbWyr-OM,Summer Son
CgGA38zh6do,"""FREE SPIRIT"""
OQOySC27i_0,🔴 RuRu的聖誕節鋼琴直播🎄🎹 來抽海量禮物吧!🎁Christmas Piano Livestream 🎅 クリスマス ピアノ 生放送🦌

Am Ende 8344 Zeilen (festgestellt per yt_extract_artist_song.py) die man manuell nachkorrigieren muesste indem man das Video aufruft, versucht herauszufinden wer da was gesungen hat und das zurueck in die Datei (youtube_videos_final.csv) schreibt. Dann den Script wieder laufen lassen. Zuviel Aufwand fuer mich.

Die angelegt Datei youtube_artist_song.csv mit gueltigen Eintraegen hat immerhin noch 22483 Zeilen welche per yt_extract.py passend fuer die Auswertung gemacht wurden. In der enstehenden Datei yt_songs_raw.csv wurden dann noch manuell kleine Korrekturen durchgefuehrt.

Code:
natalie imbruglia,torn
philipp dittberner & marv,wolke 4
archie,verano
knorkator,alter mann

Nun zum Ergebnis.
Erzeugt mit dem Script yt_fuzzy_merge_complete.py. Die Grundidee der Umsetzung hatte mein Sohn, komplettiert hat ChatGPT. Wir haben uns dafuer entschieden die Schreibweisen der Artisten / Titel zu normalisieren.

Top 50 Artisten:

ArtistAnzahl
rammstein
die ärzte
queen
abba
nightwish
feuerschwanz
acdc
sabaton
alligatoah
michael jackson
depeche mode
nirvana
deep purple
red hot chili peppers
the rolling stones
madonna
deichkind
pink floyd
lord of the lost
david bowie
knorkator
the beatles
aerosmith
within temptation
billy idol
genesis
mono inc
judas priest
dire straits
iron maiden
electric callboy
herbert grönemeyer
bruce springsteen
reinhard mey
die apokalyptischen reiter
the cure
five finger death punch
electric light orchestra
u2
babymetal
led zeppelin
disturbed
elton john
scooter
kreator
phil collins
scorpions
billy talent
system of a down
dartagnan
157
102
76
71
70
70
67
57
53
52
51
51
50
49
48
48
46
46
46
45
45
39
38
38
37
37
37
37
36
36
36
35
35
35
35
34
34
34
34
34
33
33
33
32
32
31
31
31
31
31


Top 50 Titel:

TitelAnzahl
faithless - insomnia
rammstein - deutschland
toto - africa
soundgarden - black hole sun
4 non blondes - whats up
ram jam - black betty
depeche mode - enjoy the silence
whigfield - saturday night
red hot chili peppers - snow
nirvana - smells like teen spirit
tears for fears - everybody wants to rule the world
van halen - jump
alannah myles - black velvet
the cranberries - zombie
billy idol - white wedding
laura branigan - self control
gala - freed from desire
kiss - i was made for lovin you
journey - dont stop believin
babymetal x electriccallboy - ratatata
genesis - land of confusion
the cure - lullaby
acdc - thunderstruck
styx - boat on the river
nightwish - sleeping sun
deichkind - wer sagt denn das
talk talk - such a shame
dire straits - sultans of swing
boston - more than a feeling
rammstein - amerika
anne clark - our darkness
tears for fears - shout
new order - blue monday
wham - last christmas
melanie thornton - wonderful dream
earth & fire - weekend
rammstein - zeit
visage - fade to grey
the hooters - johnny b
adele - hello
the who - baba oriley
zz top - rough boy
jon secada - just another day
david bowie - lazarus
vanilla ice - ice ice baby
the dead south - in hell ill be in good company
roxette - it must have been love
fools garden - lemon tree
alice cooper - poison
phil collins - in the air tonight
14
11
11
10
10
10
10
10
9
9
9
9
9
9
9
9
9
9
9
9
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
7
7
7
7
7
7
7
7
7
7
7
7
7

Die kompletten Zahlen sind fuer Interessierte in den Dateien yt_artist_stats_fuzzy.csv und yt_song_stats_fuzzy.csv zu finden. Wer seine selbst geposteten Titel nicht wieder findet sollte nachsehen wie das Ding bei Youtube angezeigt wird. Die Gruende warum da nicht beruecksichtigt wurde habe ich genannt.

Fuer mich persoenlich ist die Neugier befriedigt. Ich hoffe fuer manch Anderen Mitleser auch.

BFF

P.S.
Wenn dieser Artikel in einem anderen Bereich besser aufgehoben ist, bitte verschieben.
 

Anhänge

  • Gefällt mir
Reaktionen: Froki, konkretor, rasand79 und 7 andere
Interessant. Danke für die Arbeit.
Hätte nicht erwartet, Feuerschwanz laut der Auswertung auf Platz 5 zu sehen.

Du hast aber noch vergessen, zu erwähnen, dass es auch viele Einträge gibt, die überhaupt keinen Link enthalten, sondern einfach einen Post nach dem Schema "Interpret - Titel". Wäre noch interessant, wie viel dadurch auch wegfällt. Aber wahrscheinlich inshesamt weniger, als die nicht geparsten Youtube-Links.

Übrigens kommen die Tabellen hier auf'm Handy leider versetzt raus. Evtl. ist das was, wo die @Steffen mal drüberschauen kann oder es an Xenforo (oder was jetzt grade die Forensoftware ist) weiterleiten kann.
 

Anhänge

  • Screenshot_20260213_072210_Samsung Internet.jpg
    Screenshot_20260213_072210_Samsung Internet.jpg
    60 KB · Aufrufe: 16
  • Gefällt mir
Reaktionen: Banger
Na siehste mal. Last Christmas nur im unteren Feld. Die ganze Aufregung für die Katz. ;)
 
  • Gefällt mir
Reaktionen: BFF und Banger
simpsonsfan schrieb:
Übrigens kommen die Tabellen hier auf'm Handy leider versetzt raus.
TatschFone quer halten. Dann paast es. Jedenfalls bei mir am 16pro.
 
  • Gefällt mir
Reaktionen: Banger
BFF schrieb:
rammstein - deutschland

Da komme ich auch auf 11x per SUFU.
https://www.computerbase.de/forum/t...eptember-2023.1430857/page-1618#post-30961694
https://www.computerbase.de/forum/t...eptember-2023.1430857/page-1254#post-29827077
https://www.computerbase.de/forum/t...september-2023.1430857/page-923#post-28315706
https://www.computerbase.de/forum/t...september-2023.1430857/page-885#post-28119868
https://www.computerbase.de/forum/t...september-2023.1430857/page-677#post-26975992
https://www.computerbase.de/forum/t...september-2023.1430857/page-591#post-26523204
https://www.computerbase.de/forum/t...september-2023.1430857/page-473#post-25764688 (Konzert-Version, mit Remix vorher, der Link steht auch unten bei der Kategorie "anderes" Lied. Ergänzungsvideo gelöscht.)
https://www.computerbase.de/forum/t...september-2023.1430857/page-412#post-25298971
https://www.computerbase.de/forum/t...september-2023.1430857/page-381#post-24973059
https://www.computerbase.de/forum/t...september-2023.1430857/page-241#post-23297841 (Video wurde gelöscht.)
https://www.computerbase.de/forum/t...september-2023.1430857/page-214#post-22480874

Als "anderes" Lied dann 1x die Patriot-Version mit anderem Text, 1x eine Version im Jazz-Style oder ähnlich und 2x der Remix von R. Kruspe.
https://www.computerbase.de/forum/t...eptember-2023.1430857/page-1602#post-30925658
https://www.computerbase.de/forum/t...eptember-2023.1430857/page-1203#post-29655641
https://www.computerbase.de/forum/t...september-2023.1430857/page-794#post-27579296 (Video gelöscht.)
https://www.computerbase.de/forum/t...september-2023.1430857/page-473#post-25764688 (Steht auch oben, wegen normaler Version.)

Ich bin mir aber relativ sicher, dass Deutschland in der normalen Version, obere Kategorie, öfters gepostet wurde und Insomnia vielleicht gar nicht 1. ist.

Edit:

Wie ging das nochmal, wenn man eigene Beiträge in einem Thread sucht, dass mehr als 20 Seiten / 400 Posts angezeigt werden? Bei Seite 20 ist kein Knopf unten mehr für Seite 21 bis 40, egal ob ich nach Datum oder Relevanz einstelle. Ich habe einige Lieder auch mit anderen Fonts eingestellt und wenn ich nach Wörtern suche, werden die wegen des anderen Fonts nicht berücksichtigt. Ich bin der Meinung, dass ich Deutschland auch mit einem anderen Font eingestellt habe, welches in der Liste oben fehlt.

Der älteste Beitrag von mir, den ich so derzeit bekomme, ist dieser hier:
https://www.computerbase.de/forum/t...eptember-2023.1430857/page-1481#post-30585628
 
Zuletzt bearbeitet:
Du kannst Dir gern das ganze Konstrukt greifen, nachbearbeiten für Dich. Es ist alles von Quelle an in dem 7z.

Das von irgendeinem irgendwas nicht mit gezählt wurde, Deiner Meinung nach, kannst Du gern tun.

Das Ding für mich hab ich geleistet

Sei happy das Dein Rammstein überhaupt erwähnt wurde. Den Part Rammstein hätte man komplett ausblenden können. Weil eigentlich mag ich die nicht. 🥳
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Banger
BFF schrieb:

Feuerschwanz 70x stimmt wahrscheinlich nicht. Wenn ich Feuerschwanz gepaart mit Posts von mir suche, komme ich auf 68 Posts, die Lieder enthalten. Inkludiert sind Konzertmitschnitte von einzelnen Liedern, komplette Konzerte, aber auch Features. Eventuell fehlen da auch sogar von meinen Posts welche, sodass ich alleine vielleicht auf 70 komme. Und es haben auch andere Leute Feuerschwanz gepostet wie @Tom_Callaghan, also realistischer sind dann eher so 85-100 Posts mit Feuerschwanz-Liedern. Also dermaßen viel Schwund bei dem Zählskript da.

BFF schrieb:
Sei happy das Dein Rammstein überhaupt erwähnt wurde. Den Part Rammstein hätte man komplett ausblenden können. Weil eigentlich mag ich die nicht. 🥳

:stock:

Edit:

Durch das Durchklicken wieder einige dieser ätzenden HTM-Dateien eingefangen, wo und wie blocke ich das?
 
Banger schrieb:
Feuerschwanz 70x stimmt wahrscheinlich nicht. Wenn ich Feuerschwanz gepaart mit Posts von mir suche, komme ich auf 68 Posts, die Lieder enthalten. Inkludiert sind Konzertmitschnitte von einzelnen Liedern, komplette Konzerte, aber auch Features

Wie getippt.
Mach es selbst!
Und frage an das Dein @Banger im Post steht. 😉

Wenn Du andere Ergebnisse willst schau nach ob das was in der Quelle ist das her gibt.
Ich fuer mich sage hammerhart, dass auslesbare und verwertbare Informationen fuer exakt Deine beiden Lieblinge eingeflossen sind. Fuer den unberuecksichten Rest beschwere Dich bei den Postern oder bei YT.

Wie die Ergebnisse zusammen gekommen sind hab ich auch erklaert.
Ergänzung ()

Kuristina schrieb:
Na siehste mal. Last Christmas nur im unteren Feld. Die ganze Aufregung für die Katz

Nicht wirklich. Es sollte nur nicht noch oefter gepostet werden.
Abgesehen davon hatten wir dieses Jahr echt gute Alternativen zu dem "Originalen". 😁
 
Zuletzt bearbeitet: (typo)
Stimmt. Ich glaube, es wurden so viele "Last Christmas" Songs gepostet, wie noch nie zuvor. :)
Volle Dosis quasi. ^^ Aber diesen Rekord kann man ab Dezember bestimmt noch knacken..
 
  • Gefällt mir
Reaktionen: Froki
Interessantes Thema/Leserartikel!

Wenn ich die SuFu des Forums bemühe (oben rechts, Suche in "Dieses Thema"), nach "Tyga" suche, und anschließend in die Adresszeile

javascript:!function(){for(var o=document.body,n=0,e=/\n(Tyga)/gi;m=e.exec(o.innerText);)console.log(m,++n);console.log(n)}();

eingebe, dann zählt er alleine 12+14+11+7+6=50 Matches, bei denen "Tyga" als erster Interpret genannt wird. Dieser taucht in deiner Liste aber gar nicht auf... Da kann also etwas noch nicht ganz stimmen.
 
  • Gefällt mir
Reaktionen: Banger
Ich hatte auch den Eindruck, mehr Mono Inc. Und NIcoletta Rosellini gepostet zu haben. Und das mit Feuerschwanz müßte auch mehr gewesen sein. Da hat @Banger Recht.
 
  • Gefällt mir
Reaktionen: dev-kA und Banger
BFF schrieb:
Die enstandene Datei (raw_youtube_ids.csv) mit 34893 Zeilen wurde als Quelle fuer die Anfragen an Youtube genutzt. Der Script (yt_ask,py) lief ungefaehr 11 Stunden, brachte im Ergebnis 30849 positive Antworten (youtube_videos_final.csv). Wegen "privat/geloescht/ungueltige-Id/nur mit Anmeldung" wurden 4044 Zeilen nicht gewertet.
....

Die angelegt Datei youtube_artist_song.csv mit gueltigen Eintraegen hat immerhin noch 22483 Zeilen welche per yt_extract.py passend fuer die Auswertung gemacht wurden. In der enstehenden Datei yt_songs_raw.csv wurden dann noch manuell kleine Korrekturen durchgefuehrt.
So wie ich das verstehe hat das Script von 34k Posts nur 22k verweten koennen, weswegen die Zahlen nicht eins zu eins zur CB-Suche oder Post-Historie passen.

Da es hier nur um ein Spass-Projekt geht, reicht es IMHO aus um zumindest eine grobe Einschaetzung ueber die geposteten Interpreten und Lieder zu bekommen. Ich glaube um mehr ging es @BFF auch garnicht.
 
  • Gefällt mir
Reaktionen: konkretor und BFF
Axxid schrieb:
weswegen die Zahlen nicht eins zu eins zur CB-Suche oder Post-Historie passen.

Axxid schrieb:
Ich glaube um mehr ging es @BFF auch garnicht.

Absolut korrekt.
Es wurde nichts aus dem was man bei CB suchen kann verwendet.
In der bereit gestellten Datei befinden sich nur die 11stellige Youtube-ID der durch die Nutzer eingestellten Videos.

Nur die war am Ende interessant und darauf basieren alle weiteren Zahlen.

Anyway.
Die Quelle und die verwendeten Scripte habe ich nicht ohne Grund als Archiv angehaengt.
Jeder kann nach seinem Gusto sich selbst daran versuchen.
 
Zuletzt bearbeitet:
Dann lies noch mal ganz oben und verstehe das Prinzip. @dev-kA

Das da, also eine verwertbare YT-Video-ID ist keine Fanatsie. 😉

1771019706171.png
 
Kuristina schrieb:
Die ganze Aufregung für die Katz.
@BFF halt ... - aber das war ja keine echte Aufregung. Das war doch nur Spaß und die nächste Weihnachtszeit ist ja im anrollen. ;):D

Schöne Arbeit, @BFF . Sehr interessant. 👍

Danke hierfür. :schluck:
 
  • Gefällt mir
Reaktionen: BFF
Zurück
Oben