Martinus33
Lt. Commander
- Registriert
- Juni 2011
- Beiträge
- 1.665
Hallo,
man kann doch in der robots.txt bestimmte Sachen vom Crawling ausschließen bzw. erlauben.
Ich möchte für meine Wordpress-Website gerne alle Seiten (pages), die im Dateinamen ein "test" beinhalten bzw. damit beginnen, vom Crawling ausschließen. Wenn der erstere Fall, also alle Dateien, die irgendwo ein "test" beinhalten auch den zweiten Fall (Beginn mit "test") sauber beinhaltet, wäre mir das lieber. Sicher ist sicher.
Die Seiten liegen alle im Hauptverzeichnis.
Wie ist das nun richtig, wenn es sich bei den Seiten zwar logischerweise um HTML-Dateien handelt, diese aber das .html nicht im Dateinamen hinten dran haben und vom Browser nur mit "....seite-eins" (nicht ...seite-eins.html) aufgerufen werden.
Wenn man die Datei-Art am Ende einer solchen Disallow-Zeile angibt, steht das dann für die Art der Datei oder den tatsächlichen Dateinamen?
Disallow: /*test*.html$
Disallow: /*test*
oder
Disallow: /test*.html$
Disallow: /test*
oder ?
man kann doch in der robots.txt bestimmte Sachen vom Crawling ausschließen bzw. erlauben.
Ich möchte für meine Wordpress-Website gerne alle Seiten (pages), die im Dateinamen ein "test" beinhalten bzw. damit beginnen, vom Crawling ausschließen. Wenn der erstere Fall, also alle Dateien, die irgendwo ein "test" beinhalten auch den zweiten Fall (Beginn mit "test") sauber beinhaltet, wäre mir das lieber. Sicher ist sicher.
Die Seiten liegen alle im Hauptverzeichnis.
Wie ist das nun richtig, wenn es sich bei den Seiten zwar logischerweise um HTML-Dateien handelt, diese aber das .html nicht im Dateinamen hinten dran haben und vom Browser nur mit "....seite-eins" (nicht ...seite-eins.html) aufgerufen werden.
Wenn man die Datei-Art am Ende einer solchen Disallow-Zeile angibt, steht das dann für die Art der Datei oder den tatsächlichen Dateinamen?
Disallow: /*test*.html$
Disallow: /*test*
oder
Disallow: /test*.html$
Disallow: /test*
oder ?