Facebook und Javascript

moonwalker99 · 24. Juli 2021

Ich versuche die Bilder von großen Facebook-Alben komplett runterzuladen und sehe, dass es gar nicht so einfach ist. Das Problem heißt Javascript. Wenn ich den HTML-Link zu einem Foto speichere, dann enthält er keine Informationen zum Foto. Wird der Link aber im Browser geöffnet und das Javascript interpretiert, dann wird dort der Link zum Foto eingefügt.

Muss ich also jeden Link manuell öffnen? Oder gibt es eine Möglichkeit, sich den Link speichern zu lassen, nachdem das enthaltene Javascript interpretiert wurde?

DeusoftheWired · 24. Juli 2021

Wenn es dir nur um das Ergebis geht und nicht darum, zu lernen, das selbst umzusetzen, dann probier es mit dieser Erweiterung: https://chrome.google.com/webstore/detail/album-downloader-for-face/oallcdoceahndjmaalbicbcgpfnajgae

moonwalker99 · 24. Juli 2021

Ich würde schon gerne wissen, ob es eine Möglichkeit gibt, einen HTML-Link erst interpretieren und dann das Ergebnis davon speichern zu lassen. Sowas kann man immer gebrauchen.

sandreas · 25. Juli 2021

Sowas kann man mit https://github.com/puppeteer/puppeteer machen (oder anderen Browser-Steuer-APIs). Wichtig dabei ist, dass Facebook und Co sich recht gut zur Wehr setzen können, in dem sie zwischenzeitlich captchas oder sowas einblenden.

moonwalker99 · 25. Juli 2021

Ich habe einen Weg gefunden, hab unter Linux ein Skript geschrieben mit

Code:

chromium-browser --headless --disable-gpu --dump-dom http...

Das funktioniert soweit ganz gut, außer dass es recht langsam ist (weniger als 30 Bilder pro Minute) und manche Aufrufe eine leere Antwort produzieren.

Wo wir schon beim Thema sind: gibt es eine Möglichkeit, ebenfalls automatisiert das Nach-unten-scrollen zu emulieren? Z.B. wenn man von einer FB-Gruppe alle alten Beiträge laden will. Das wäre echt interessant.

Joshinator · 26. Juli 2021

Wurde schon verlinkt: Puppeteer, da kannst du auch scrollen und gegenchecken ob einzelne Dom-Elemente gefunden werden.
Ist nichts anderes als headless Chrome, nur mit einer einfachen API um mit den Seiten zu interagieren.

Suche

Facebook und Javascript

moonwalker99

Lt. Commander

DeusoftheWired

Fleet Admiral

moonwalker99

Lt. Commander

sandreas

Lieutenant

moonwalker99

Lt. Commander

Joshinator

Commander

Ähnliche Themen