Robots.txt für Wordpress-Websites

Martinus33

Lt. Commander
Registriert
Juni 2011
Beiträge
1.628
Hallo,
auf http://codex.wordpress.org/Search_Engine_Optimization_for_WordPress#Robots.txt_Optimization
empfiehlt Wordpress folgende robots.txt:
Code:
Sitemap: http://www.example.com/sitemap.xml

# global
User-agent: *
Disallow: /cgi-bin/
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /wp-content/plugins/
Disallow: /wp-content/cache/
Disallow: /wp-content/themes/
Disallow: /trackback/
Disallow: /comments/
Disallow: */trackback/
Disallow: */comments/
Disallow: wp-login.php
Disallow: wp-signup.php

Würdet Ihr das so übernehmen? Da es sich um keine Ausgabe-Seiten handelt, deren Pagerank durch die Deindexierung verloren gehen könnte, spricht eigentlich nichts dagegen.

Wäre ein Ausschluss meiner Bilderdateien durch folgenden Code korrekt, der einfach unten ergänzt würde:
Code:
Disallow: /*.jpg$
Disallow: /*.png$
Disallow: /*.gif$

oder gleichwertig:
Disallow: /wp-content/uploads/*.jpg$
Disallow: /wp-content/uploads /*.png$
Disallow: /wp-content/uploads/*.gif$

Bei mir sind ALLE Medien im uploads-Ordner, es sollen aber nur die Bilder aus der Bildersuche der Sumas herausgehalten werden.
 
@maxator:
Nach meiner Erfahrung schauen die Besucher nur kurz zum Klauen vorbei, verfälschen Statistiken und einige wenige betreiben Hotlinking.

Da kann ich drauf verzichten, zumal seit Panda Google die Aufenthaltszeit stärker mitberücksichtigen dürfte.
 
Spätestens wenn du tatsächlich bloggst und deine Seite mit Rich Snippets ausrüstest, können Bilder direkt in die SERPs einfließen. Bilder zu blocken ist hier absolut kontraproduktiv.
 
@maxator:
Worin sollte ein positiver Google-Effekt bestehen? Ungünstige bounce-rate und Aufenthaltszeit sprechen dagegen.

Ist es seit einiger Zeit nicht sogar möglich, das gesuchte Bild anzuschauen, ohne die Website zu besuchen?

@Daaron:
Ist kein Blog.
Bilder gehören nicht zu den von Google unterstützen Inhaltstypen für rich snippets, siehe https://support.google.com/webmasters/answer/99170?hl=de
Das Autorenbild wurde übrigens vor einiger Zeit aus den Serps wieder entfernt.
Ergänzung ()

Beim Recherchieren habe ich festgestellt, dass viele Webmaster noch weitere Dinge aussperren, zusätzlich zur obigen Empfehlung:

Disallow: xmlrpc.php
Disallow: index.php
Disallow: wp-register.php
Disallow: /feed/
Disallow: /author/
Disallow: /archives/
Diasllow: /20*

Macht das Sinn?
 
Bei Wordpress? Das Ding ist so ein Code-Klamauk, da weiß doch im Nachhinein keiner, was man alles noch umstellen muss... Wobei ich zum Wohle des Knowledge Graph immer alle Daten in die Suchmaschinen pumpen würde...
 
Ich habe in den Lese-Settings eine statische Startseite gewählt. Ist ja auch kein Blog.

Für die Besucher gibt es daher keine /index.php-Startseite. WP sorgt offenbar für einen Umleitung auf domain.de, wenn jemand domain.de/index.php mit dem Browser aufrufen will.

Google beachtet die robots.txt eigentlich schon...
 
domain.tld/ ist dasselbe wie domain.tld/index.php, außer man hat an der .htaccess herum gepfuscht.
 
Hm, viele schließen jedenfalls index.php in der robots.txt aus und wenn das wirklich ihre Sartseite aussperren würde, würden sie das schnell merken und sicher nicht öffentlich empfehlen.

Was diejenigen in der htaccess stehen haben, weiß man natürlich nicht.

Ich kann die index.php ja mal aus der robots rauslassen, vorsichtshalber. Dachte halt, es würde nochmal verdeutlichen für die Sumas, dass das NICHT meine Startseite ist und dass die Wahl einer statischen Startseite mit .de im WP-backend keinerlei Probs mehr mit der damit "gekillten" index.php machen kann.
 
Ein Webserver kennt 2 Betriebsmodi für Ordner.
1.) Kein Index -> wird nur der Ordner angesprochen, dann wird der Inhalt des Ordners dargestellt. Lohnt sich, wenn man große DAteimengen zum Download anbieten will
2.) Standard-Index -> kann mehrere nacheinander eingetragene Werte erhalten. Üblich ist z.B. index.html -> index.php. Wenn es eine index.html gibt, öffne sie beim Öffnen des Ordners. Ansonsten öffne die PHP. Pfuscht man, bei Apache, an der .htaccess herum, kann man eine andere Standard-Indexdatei setzen.
Daher: domain.tld = domain.tld/index.html oder domain.tld/index.php

Die Frage ist eher, ob die index.php jemals wirklich in der URL angezeigt wird. Wenn das nie der Fall ist, ändert der Eintrag bei der Robots.txt kaum was. Du verlierst nur eine weitere Methode, auf die gewünschte Startseite zu gelangen.
 
Also soweit es alleine mich und meine Besucher betrifft - jenseits technischer Notwendigkeiten bei WP, PHP oder den theme - sollen meine Startseiten auch in Zukunft immer so aussehen wie bisher: www.domain.de, ohne "index" hinten dran. Es werden wohl immer statische Sites sein, die allenfalls einen Onsite-blog auf einer Subdomain haben.

Darüber hinaus werde ICH keine URLs anlegen beim Erstellen von posts/pages, bei denen "index" in irgendeiner Form vorkommt. Wozu auch.
 
Zurück
Oben