RSS-Feed mit Shell-Script auslesen

  • Ersteller Ersteller _arne
  • Erstellt am Erstellt am
A

_arne

Gast
Hallo,

ich habe einen relativ simplen RSS-Feed, aus dem ich (den einzigen) Link auslesen möchte.
Dieser hat (auch als einziger) den Tag <enclosure>, es dürfte also nicht allzu schwer werden.
Leider reichen meine Shell-Kenntnisse dafür nicht aus.

Wäre dankbar für Hilfe.

Vielen Dank schonmal,
Arne
 
Zuletzt bearbeitet:
Linux. Bash. :)
Ergänzung ()

Also, ich kann ja etwas ausführlicher werden, vielleicht erbarmt sich dann ja jemand. :)

Ich möchte den folgenden Podcast-Feed mit Bash parsen: http://feeds.feedburner.com/Film-UndKino-trailerVideopodcast

Im Titel soll ein (de) stehen, damit nur deutsche Trailer herausfallen.
HTML:
<title>Redemption Road (en)</title>

Das Veröffentlichungsdatum der Beiträge sollte mit dem aktuellen übereinstimmen:
Code:
<pubDate>Sun, 24 Jul 2011 11:32:07 +0200</pubDate>

Dann brauche ich folgende URL der Beiträge:
HTML:
<enclosure url="http://feedproxy.google.com/~r/Film-UndKino-trailerVideopodcast/~5/qWG21zeGy7k/trailer01_en.mp4" length="16755850" type="video/mp4" />

Wäre echt super, wenn jemand helfen würde, habe mir das mal angesehen und bin so weit gekommen:
Code:
wget -q -O- view-source:http://feeds.feedburner.com/Film-UndKino-trailerVideopodcast?format=xml| awk 'BEGIN{RS="<pubDate>"}
/(date +'%d %M %Y')/{
gsub(/.*<enclosure>|<\/enclosure>.*/,"")
print
}

So. Leider weiß ich nicht, wie ich zusätzlich einstelle, dass nur Links mit (de) im Titel ausgelesen werden. Des Weiteren wird bei gsub nicht der URL-Tag ausgelesen, sondern gar nichts (weil das Element ja keinen "Inhalt" hat).

Kann es auch momentan leider nicht testen, weil ich kürzlich den Anbieter gewechselt habe (von Site5 zur OVH, falls es jemanden interessiert) und somit momentan keine Shell zum testen habe.

Trotzdem vielen Dank im Voraus!
 
Zuletzt bearbeitet: (Etwas genauer)
Zurück
Oben