Automatisiert alle Webseiten hinter Links nach meinen Regeln speichern?

Tobias Claren

Banned
Registriert
Feb. 2003
Beiträge
620
Hallo.

Ich will zu Forenantworten deren Benachrichtigungen ich in einen IMAP-Ordner verschoben habe, die Webseiten sichern und weiterverarbeiten. Also z.B. Textstellen markieren ("Marker"...), dann evtl. noch die Screenshots in ein Dokument einbinden. Allerdings sehe ich da schon Probleme mit der Größe der Screenshots und der Trennung über die Seiten etc..

Allerdings wäre eine Umwandlung all dieser Screenshots in eine PDF schon interessant.
Evtl. digital betrachtet ohne Seitenumbruch innerhalb eines Screenshots. Ausgedruckt kann es allerdings ein Problem geben, wenn mitten in einer Zeile ein abtrennen stattfände.
Hier wäre eine gleichzeitige Texterkennung und nur abtrennen nach oder vor Textzeilen gut.

Für die vorherige Erstellung der Screenshoss evtl. eine Art automatisierte Nummerierung der Screenshots (gleich am Anfang des Dateinamen, am besten mit führenden Nullen für eine spätere Sortierung nach Zahlen), gefolgt von einem Resttitel, der z.B. das Datum der Email und einen ergändenden Titel evtl. aus dem Titel der Webseite.

So weit wie möglich den "Workflow" dazu minimieren.

Also Tools die dabei helfen Einzelschritte zu automatisieren etc..
 
Zuletzt bearbeitet:
Da sehe ich kaum Licht am Horizont.

Von mir aus könnte man die Mails im IMAP-Order exportieren. Das als Reintextdateien könnte man durchforsten und die Links sammeln. reihenfolge der Treffer wäre eine Nummerierung.
Und dann? Dann soll irgendwas das Browser heißt diese Links aufrufen und ein der Text in den offenen Seiten automatisch markiert werden? Da sehe ich schon mal weniger Chancen. AutoIt vielleicht.
Screenshots von - was? (Und wozu?!?) Wenn die aufgerufene Seite über mehrere Bildschirme geht dann solls Tools geben die das zu einer einzigen Grafikdatei machen und die speichern können. Oder drucken, als PDF.

Was soll das Ergebnis all dieser Aktivitäten sein, was der Nutzen?

CN8
 
Nein, den Text muss ich schon selbst markieren.

Ich überlege selbst gerade, wie es am Besten (das Endergebnis) wäre.

Einmal evtl. um 200 Seiten komplett als HTML sichern, und dann noch möglichst automatisiert eine Index-Seite mit den Links in der Reihenfolge dazu. Gerne mit den Webseitentiteln statt nackten Links. Gibt es evtl. eine Software der ich nur noch einen Ordner in dem sich alle gespeicherten Webseiten befinden nenne, und die macht so was draus? Dann müsste ich "nur" noch um 200 mal den Link öffnen, und STRG-S und Enter drücken...
An die Webseiten wo Beiträge schon entdeckt und gelöscht wurden, habe icch dabei noch gar nicht gedacht.
Da hätte ich maximal den Text in der Benachrichtigungs-Email.



Dann noch mal die um 200 Seiten als Screenshot, und evtl. auch so einen Index auf die Bilder.

Notfalls muss ich dann die Bilder die zu markierenden Text enthalten später ändern, und einfach über sich selbst speichern.
Allerdings sollte es dann schnell möglich sein die geänderten (Marker drin) schnell wieder zu finden.
Hmmmm... Wenn es tatsächlich möglich wäre so eine Screenshot-Index-HTML zu erstellen, wäre die ja erstmal alle gleich.
Und wenn ich einzelne Bilder danach bearbeite, gäbe es in der Liste ja keinerlei Hinweis auf diese Bilder mit markierten Textstellen.
 
Zurück
Oben