Facebook und Javascript

moonwalker99

Lt. Commander
Registriert
Jan. 2008
Beiträge
1.820
Ich versuche die Bilder von großen Facebook-Alben komplett runterzuladen und sehe, dass es gar nicht so einfach ist. Das Problem heißt Javascript. Wenn ich den HTML-Link zu einem Foto speichere, dann enthält er keine Informationen zum Foto. Wird der Link aber im Browser geöffnet und das Javascript interpretiert, dann wird dort der Link zum Foto eingefügt.

Muss ich also jeden Link manuell öffnen? Oder gibt es eine Möglichkeit, sich den Link speichern zu lassen, nachdem das enthaltene Javascript interpretiert wurde?
 
  • Gefällt mir
Reaktionen: piepenkorn
Ich würde schon gerne wissen, ob es eine Möglichkeit gibt, einen HTML-Link erst interpretieren und dann das Ergebnis davon speichern zu lassen. Sowas kann man immer gebrauchen.
 
Ich habe einen Weg gefunden, hab unter Linux ein Skript geschrieben mit
Code:
chromium-browser --headless --disable-gpu --dump-dom http...

Das funktioniert soweit ganz gut, außer dass es recht langsam ist (weniger als 30 Bilder pro Minute) und manche Aufrufe eine leere Antwort produzieren.

Wo wir schon beim Thema sind: gibt es eine Möglichkeit, ebenfalls automatisiert das Nach-unten-scrollen zu emulieren? Z.B. wenn man von einer FB-Gruppe alle alten Beiträge laden will. Das wäre echt interessant.
 
Wurde schon verlinkt: Puppeteer, da kannst du auch scrollen und gegenchecken ob einzelne Dom-Elemente gefunden werden.
Ist nichts anderes als headless Chrome, nur mit einer einfachen API um mit den Seiten zu interagieren.
 
  • Gefällt mir
Reaktionen: moonwalker99
Zurück
Oben