NAS

Keyword-Suche in mehreren URL

T

Tandeki

Gast
Hi,

ich stehe vor einem Problem und vielleicht könnt ihr mir dabei helfen.

In einem Text-File stehen einige Webadressen untereinander. Diese Adressen möchte ich automatisch nach einem bestimmten Keyword durchsuchen lassen. Befindet sich das Schlüsselwort auf dieser Seite, so soll die URL eindeutig markiert werden, zum Beispiel mit "1". Ist das Stichwort auf dieser Seite nicht zu finden, so soll die URL mit einem anderen eindeutigen Wert markiert werden, zum Beispiel "0".

Beispiel: ich lasse auf www.focus.de nach dem Keyword "Nachrichten" suchen. Da das Schlüsselwort unter der URL zu finden ist, soll www.focus.de mit "1" markiert werden. Zum Beispiel in einem Text-File mit getrennten Werten (Semikolon, Tab, Komma oder was auch immer).

Kennt jemand ein Programm/Batch/etc., mit dem ich das machen könnte?

Vielen Dank,

Deliberation
 
Hast du dir schon überlegt in welcher Sprache du das ganze machen würdest? Falls nicht, würde ich ja php empfehlen, sollte das für dich in Frage kommen, schau dir mal Snoopy an: http://sourceforge.net/projects/snoopy/
 
Ich dachte weniger an eigene Programmierleistungen als an ein fertiges Tool. Dieses hier macht schon so ziemlich was ich suche:

http://www.winwebcrawler.com/

- man kann Webseiten crawlen
- nur solche werden ausgelesen, die bestimmte Schlüsselwörter aufweisen
- das Ergebnis liegt als CSV vor

Was mir jetzt noch weiterhelfen würde, wäre ein Tool, das

- komplexere Textfilter zulässt und
- möglichst günstig oder am besten kostenlos ist

Hat da jemand noch 'ne Idee?
 
Zurück
Oben