Webseiten zu PDF

Lycaner

Cadet 2nd Year
Registriert
Juni 2005
Beiträge
19
Hallo in die Runde,

ich bin auf der Suche nach einem Tool welches mir Webseiten in ein PDF in der Originalen Formatierung speichert?
Als Beispiel sind die Artikeln von Computerbase - kein Tool was ich gefunden habe schafft es die Formatierung zu übernehmen (Ich finde die Tabellen von Computerbase sehr gut dargestellt), ebenfalls wenn in einem Artikel mehrere Bilder sind schaffen es die meisten Tools nicht.
Ich brauche das ganze zur Recherche Zwecken weil ich in meinem Unternehmen Mitarbeiter schule.

Ich freue mich auf eure Antworten

Liebe Grüße aus Wien
Igor
 
Also, du versuchst hier die Quadratur des Kreises.
Wie soll man eine dynamische Sache wie eine Internetseite vollkommen in ein starres Format wie PDF packen?
Die Seiten passen sich der Fenstergröße und dem Inhalt an.
Die Bilder sind oft Bildergalerien.
Die Seite wird zur Laufzeit erst generiert und entsprechend noch Sachen (wie Werbung) erst einfügt und entsprechend dann aufgebaut.
Eine PDF ist für ein definiertes Format gedacht, dass man es auch ausdrucken kann.

Wenn PDF für solche Inhalte geeignet wäre, hätten wir kein HTML/CSS.
Warum genau willst du so etwas in eine PDF packen?
Gibt halt einfach links an oder mach Screenshots
 
  • Gefällt mir
Reaktionen: halwe, DJMadMax und Intruder
rg88 schrieb:
Wenn PDF für solche Inhalte geeignet wäre, hätten wir kein HTML/CSS.
Warum genau willst du so etwas in eine PDF packen?
Gibt halt einfach links an oder mach Screenshots

dem schließe ich mich an, ansonsten Drucken->PDF^^
1691621553766.png
 
  • Gefällt mir
Reaktionen: DJMadMax, Intruder und rg88
print.css blockieren probieren
 
Datei Drucken als PDF, Haken bei Kopf/Fußzeile weg und bei Hintergrund hin.
Ich sehe das Problem scheinbar nicht. Eventuell kannst Du Dir ja für einen "langen" Beitrag ein langes Papierformat "kreieren" :-)


1691622477602.png


Sieht dann genau so aus wie im Original.

1691622256670.png

1691622292710.png
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: SR388 und DJMadMax
Die "Bildschirmfoto aufnehmen" Funktion von Firefox macht da in meinen Augen mehr Sinn, da die Website dann nicht in DIN A4 Teile zerstückelt wird.
 

Anhänge

  • Screenshot 2023-08-10 at 01-21-00 Baldur's Gate 3 im Benchmark-Test.png
    Screenshot 2023-08-10 at 01-21-00 Baldur's Gate 3 im Benchmark-Test.png
    4,1 MB · Aufrufe: 108
  • Gefällt mir
Reaktionen: M4ttX, SR388, NJay und 6 andere
john.smiles schrieb:
"Bildschirmfoto aufnehmen" Funktion von Firefox macht da in meinen Augen mehr Sinn
sofern die Seite nicht ewig lang ist sonst hat man ein ein elendig langes großes Bild generiert
so als Beispiel:
Beispiel zu langer Webseite

musste da sogar was weg schneiden um es überhaupt als Beispiel hochladen zu können weil es zu groß wurde 😂
 
Ich denke mal, das es ihm klar ist, das Werbung etc. dynamisch generiert wird und darum geht es auch glaube ich nicht. Er will nur den stand der aktuellen Webseite drucken. Ich würde die Webseite komplett speichern, entweder unter "Speichern unter" oder mit httrack.

https://www.httrack.com/
 
john.smiles schrieb:
Die "Bildschirmfoto aufnehmen" Funktion von Firefox macht da in meinen Augen mehr Sinn, da die Website dann nicht in DIN A4 Teile zerstückelt wird.
Allerdings mit dem Nachteil, dass STRG+F nicht so richtig will im PNG-Format :D
 
Verstehe ich das richtig? Du klaust dir auf CB Content und verwendest den dann für gewerbliche Zwecke? Ohne Erlaubnis oder auch ohne gefragt zu haben? Und tatsächlich helfen dir noch CB-Mitglieder dabei? Und es handelt sich nicht um einzelne Bilder, sondern um komplette Webseiten.
 
  • Gefällt mir
Reaktionen: Janush, Millkaa und cartridge_case
Unter Angabe der Quelle, darf man doch alles verwenden für "interne" Zwecke!
 
  • Gefällt mir
Reaktionen: piepenkorn
Gute Internetseiten bieten eine Druckansicht an, bei dem auch die Links übersichtlich im Klartext gelistet werden.
Beispiel: https://www.heise.de/news/Patchday-...-Android-11-12-und-13-9239055.html?view=print

Wenn so etwas nicht vorhanden ist, ist ein Bild wie von Firefox, welches man in der Höhe beschneiden kann, die sauberste Lösung. Zur Vorbereitung sollte man das Fenster an die Breite des Inhaltes anpassen und dann erst das Screenshot-Tool laufen lassen, um keine unnötig breiten Ränder (siehe Bild unten) zu haben.

Mit einer einer vernünftigen PDF App kannst du diese Bilder randlos als PDF darstellen, allerdings werden die Bilder immer in z.B. DinA4 zerstückelt, was auch mitten in einem Satz sein könnte.

Ich selbst handhabe es wie HisN und drucke es entsprechend aus, wenn es keine Druckansieht gibt.
Mit einem guten PDF-Editor (inkl. Browser Add-on und PDF-Drucker-Funktion) wie PDF-XChange werden die Seiten trotzdem "okay" ausgedruckt und der Text überall via OCR selbst in Bildern erkannt.

rg88 schrieb:
Die Seiten passen sich der Fenstergröße und dem Inhalt an.

Naja... eher nein.
So sieht ComputerBase auf 4k ohne "Zoom" aus.
1691647273248.png


Nahezu alle Seiten sind "Schlauchseiten".
Sie haben eine fixe Breite und gehen unterschiedlich lang mit der Höhe um.
 
Zuletzt bearbeitet:
yxcvb schrieb:
Verstehe ich das richtig? Du klaust dir auf CB Content und verwendest den dann für gewerbliche Zwecke? Ohne Erlaubnis oder auch ohne gefragt zu haben?
keine Ahnung warum du da so reagierst, wenn der TE einfach mal CB nur als Beispiel genommen hat:
Lycaner schrieb:
Als Beispiel sind die Artikeln von Computerbase
da steht nix davon dass der Inhalt von Computerbase für irgendeine Mitarbeiterschulung herhalten soll, aber evtl. weißt du da ja mehr
 
  • Gefällt mir
Reaktionen: cyberpirate
yxcvb schrieb:
Du klaust dir auf CB Content und verwendest den dann für gewerbliche Zwecke?
Schon Mal in der Schule oder der Uni gewesen? Die erstellen da alle ihre Folien selbst 😁

Rechtlich ist das übrigens völlig ok, Unterricht an Bildungseinrichtungen ist nicht öffentlich und fremde Werke dürfen so genutzt werden.
 
abcddcba schrieb:
keine Ahnung warum du da so reagierst,
Weil er einer dieser Hilfssherifs ist welche die welt gewaltsam versuchen mit pseudoregeln zu verbessern.
Einfach ignorieren.

Zum Thema :
Ich würde einfach die druckfunktion hernehmen, glaub HiSn hats vereits beschrieben.
 
  • Gefällt mir
Reaktionen: Mickey Cohen und Krisenmanager
Zuerst einmal einen großen Dank an die vielen Antworten - ich versuche es mal genauer zu erklären bevor mich hier jemand des Diebstahles besichtigt. Ich habe CB als Beispiel genommen, ich suche meine Inhalte auf vielen anderen Seiten auch zusammen und gebe immer die Quelle an wenn ich zu internen Schulungszwecken Material herzeige.

Als Beispiel für die "Export" Funktion wäre folgender Beitrag: https://www.computerbase.de/2023-02/intel-xeon-w-3400-w-2400/

Hier ist neben den Text auch eine Tabelle in einer schönen Darstellung (sollte auch so dargestellt werden) und auch viele Bilder in dem Artikel welche nützlich sind. Nun möchte ich gerne alle Bilder, den Inhalt der Seite und die Tabellen in ein halbwegs übersichtliches PDF fassen und unter den Namen XEON W-Prozessoren neue Generation abspeichern. Die "Druck" Funktion vom Browser macht es ja nicht schlecht, sie kann die ganzen Bilder jedoch nicht "übernehmen".

Wenn es nicht möglich ist - ist das für mich auch OK, ich dachte jemand hat so ein Ähnliches Thema schon gehabt, deswegen habe ich mich an das Forum gewandt.

Ich habe es auch mit Adobe Acrobat versucht, der formatiert die Seite ganz komisch, die Tabelle verschwindet komplett mit der Formatierung und auch die Bilder schafft es gar nicht.

Liebe Grüße
Igor
 
Lycaner schrieb:
Nun möchte ich gerne alle Bilder
Da gehts halt schon los. Das kann ja nicht mal das originale Layout der Webseite. Selbst da musst du klicken um zum nächsten Bild zu kommen.
Du willst also sogar noch mehr als die Quadratur des Kreises. Du willst Inhalte die gar nicht angezeigt werden "ausdrucken";)
 
  • Gefällt mir
Reaktionen: Lycaner
DJMadMax schrieb:
Allerdings mit dem Nachteil, dass STRG+F nicht so richtig will im PNG-Format
Auf macOS dürfte schon eine Texterkennung in der Vorschau mitlaufen, URLs kann man hier wieder anklicken.
Ergänzung ()

Es wurde dann einfach kein druckfähiges Layout bereitgestellt als print.css müsste das sein.
 
  • Gefällt mir
Reaktionen: Lycaner
pdf-Export hilft nur bedingt, da wie erwähnt die dynamischen Inhalte ja fehlen - Bild 1/34 wird dargestellt und dann eben in den pdf-Export übernommen.
Da musst Du die Seite schon als html abspeichern.
Für sowohl pdf-export als auch html scheint meiner Meinung nach Chromium die bessere Wahl zu sein als Firefox.

Wenn man Rastern möchte und 1 Screenshot von der dargestellten Seite nimmt, und diesen unbedingt als pdf haben möchte, muss man die pdf-Darstellung nicht zwingend auf ein Ausgabeformat wie DinA4 festlegen, es geht auch direkt.
Siehe Anhang - der screenshot (wg. der Größe die png auf 256 Farben reduziert) wurde mit https://gitlab.mister-muffin.de/josch/img2pdf/ in ein pdf eingebettet.
Natürlich fehlen dann die weiteren Bilder und der Text ist auch nicht selektierbar..
 

Anhänge

  • 2023-08-27 11.17.06 direkt.pdf
    821,7 KB · Aufrufe: 67
  • Gefällt mir
Reaktionen: Independent
Zurück
Oben