Anfragevolumen von Suchmaschinen

Nightt

Ensign
Registriert
Feb. 2006
Beiträge
246
Hallo liebe Community,

hier mal eine etwas "alternative" Frage - vielleicht weiß ja doch jemand Rat oder brauchte für seine Arbeit schon einmal die selbe Informationen.

Gibt es eine Möglichkeit, um an das (absolute) Anfragevolumen nach Schlüsselwörtern (z.B. "Audi A8") heranzukommen? Also die Zahl, wie oft nach diesem Wort in einem bestimmten Zeitraum gesucht wurde?

Der einzige Dienst, der mir dazu einfällt, ist Google Trends. Leider normiert Google die Zeitreihe, d.h. man bekommt nur relative Werte und hat keine Auskunft über die absolute Zahl an Suchanfragen. :(

Im Internet bin ich nicht wirklich fündig geworden, zumindest nicht konkret.... Vielleicht weiß ja jemand Rat :)


Viele Grüße & Danke im Voraus!

PS: Hintergrund ist das arbeiten im statistischen Bereich an der Uni
 
Na gesicherte Aussagen darüber bekommst du nur über die eigene Seiten ;p Ansonsten den Betreiber höflich fragen ;p wirkt auch mal Wunder.
 
Wenn die eigene Seite hinreichend populär ist, kannst du die eventuell zum "Kalibrieren" der Trends-Ergebnisse nutzen. Wie zuverlässig das ist, kannst du aber vermutlich besser bewerten als ich.
 
ForenTroll schrieb:
Wenn die eigene Seite hinreichend populär ist, kannst du die eventuell zum "Kalibrieren" der Trends-Ergebnisse nutzen. Wie zuverlässig das ist, kannst du aber vermutlich besser bewerten als ich.

Das wäre ein interessantes Experiment! Leider geht es nicht um eine eigene Seite. Sondern ganz allgemein das Suchvolumen zu verschiedenen Stichworten für eine Regressionsanalyse. Zum Beispiel: Vor Verkaufsstart des Audi A8 wurde der Begriff "Audi A8" x-mal gesucht. Vor Verkaufsstart des Audi A7 wurde der Begriff "Audi A7" y-mal gesucht. Daraus könnte man dann, so die Hypothese, abschätzen welcher Wagen sich wohl besser verkauft (höheres Suchanfragevolumen => höhere Verkaufszahl, vereinfacht gesagt).

Den Betreiber fragen gestaltet sich ebenfalls als schwierig - da muss ich mich ja schon direkt an Google oder Yahoo oder so wenden. Und ob die die Daten einfach so für mich rausgeben.... Wahrscheinlich nicht^^
 
naja, auf dein Beispiel bezogen interessiert es Audi ja wohl selbst, wie oft nach einem Wagen gesucht wurde. Die Audi Seite ist auch hinreichend populär und Anhand der Seitenaufrufe der entsprechenden Audi-Seite (A8 oder A7) kann Audi sich dann selbst ausrechnen/hochrechnen, wie oft in etwa nach einem bestimmten Wagen gesucht wurde und die möglichen Verkaufszahlen bestimmen (wenn die Suchanfragen mit den Verkauszahlen überhaupt korrelieren)
Wenn du das natürlich als Außenstehender für beliebige Produkte haben willst, wirds schwierig. Wenns nur für Audi sein soll, und du entsprechend Kontakt dahin hast, könnten die dir die Daten auch liefern (wobei die da teilweise echt restriktiv sind, was es angeht überhaupt irgendetwas rauszugeben :D )
 
Ich meinte ja auch, dass du die Daten der eigenen Seite zum Kalibrieren nimmst. Du vergelichst also z.B. die Begriffe "Audi A7", "Audi A8" und "Nightt":
https://www.google.de/trends/explore#q=audi%20a7%2C%20audi%20a8%2C%20Nightt&cmpt=q&tz=

Da du die Zugriffszahlen von Nightt.de kennst, berechnest du daraus die absoluten Zahlen der anderen beiden, denn relativ zueinander bekommst du sie ja von Trends. Da Nightt relativ unpopulär zu sein scheint, passt es vielleicht besser mit Werten von größeren Seiten:
https://www.google.de/trends/explore#q=audi%20a7%2C%20audi%20a8%2C%20uni%20berlin&cmpt=q&tz=
 
Hellblazer schrieb:
naja, auf dein Beispiel bezogen interessiert es Audi ja wohl selbst, wie oft nach einem Wagen gesucht wurde. Die Audi Seite ist auch hinreichend populär und Anhand der Seitenaufrufe der entsprechenden Audi-Seite (A8 oder A7) kann Audi sich dann selbst ausrechnen/hochrechnen, wie oft in etwa nach einem bestimmten Wagen gesucht wurde und die möglichen Verkaufszahlen bestimmen (wenn die Suchanfragen mit den Verkauszahlen überhaupt korrelieren)
Wenn du das natürlich als Außenstehender für beliebige Produkte haben willst, wirds schwierig. Wenns nur für Audi sein soll, und du entsprechend Kontakt dahin hast, könnten die dir die Daten auch liefern (wobei die da teilweise echt restriktiv sind, was es angeht überhaupt irgendetwas rauszugeben :D )
Das ist wohl korrekt, dass z.B. Audi selbst an den Daten interessiert ist . Nützt mir ja aber als Außenstehender nichts, außer ich kontaktiere, wie du schon sagst, das Unternehmen selbst. Werde mir das mal überlegen, aber die Chancen dafür sind wohl verschwindend gering.



ForenTroll schrieb:
Ich meinte ja auch, dass du die Daten der eigenen Seite zum Kalibrieren nimmst. Du vergelichst also z.B. die Begriffe "Audi A7", "Audi A8" und "Nightt":
https://www.google.de/trends/explore#q=audi%20a7%2C%20audi%20a8%2C%20Nightt&cmpt=q&tz=

Da du die Zugriffszahlen von Nightt.de kennst, berechnest du daraus die absoluten Zahlen der anderen beiden, denn relativ zueinander bekommst du sie ja von Trends. Da Nightt relativ unpopulär zu sein scheint, passt es vielleicht besser mit Werten von größeren Seiten:
https://www.google.de/trends/explore#q=audi%20a7%2C%20audi%20a8%2C%20uni%20berlin&cmpt=q&tz=
Danke für deinen Input. Habe daran noch garnicht gedacht. Das Problem bleibt aber leider bestehen: Sobald ein neues Stichwort hinzu kommt, verändert sich die Werteverteilung untereinander. Speziell wird der höchste Wert aller eingegebenen Stichwörter immer auf 100 gesetzt und die anderen Werte werden dementsprechend daran orientiert. So gesehen bräuchte es ja das "Kallibrieren" garnicht; zumindest unter den eingegebenen Stichwörtern könnte man das Suchvolumen vergleichen. Problem ist allerdings, dass man nur bis zu 5 Suchwörter gleichzeitig eingeben kann. Leider ein bisschen zu wenig für einen aussagekräftigen Datensatz.... :(
 
Ich kenn mich jetzt mit Webseiten-Skripten nicht so aus, aber kann man das nicht automatisieren?
Suchbegriffe A,B,C,D und E-> csv runterladen
Suchbegriffe A,F,G,H und I-> csv runterladen
...
Der Rest ist Dreisatz, da du alles auf A beziehen kannst. Als Bonbon obendrauf kannst du als Suchbegriff A die bekannte Seite nehmen und hast für alle abgefragten somit die absoluten Zahlen.
 
Ich bin mir gerade noch etwas unsicher, aber ich glaube nicht, dass das funktionieren wird bezüglich der Interpretierbarkeit der absoluten Werte. Wenn ich z.B. A B C D E eingebe können hierbei andere Werte rausgegeben werden als wenn ich A B C D F eingebe. Durch die relative Wertausrichtung verändert sich das Niveau untereinander ja immer wieder.
Heißt also: Die Werte passen immer nur unter sich.

Hier ist das erklärt: https://support.google.com/trends/answer/4365533?hl=en&ref_topic=4365599
Macht also Sinn, wenn man die Veränderungen verschiedener Zeitreihen in unterschiedlichen Regionen oder so untersuchen will, aber für meinen Zweck wohl leider ungeeignet :(
 
Ich mach mal ein Beispiel:
https://www.google.com/trends/explore#q=audi%20a7%2C%20audi%20a8&cmpt=q&tz=
März 2011: Audi A7:56 Audi A8: 70

https://www.google.com/trends/explore#q=audi%20a7%2C%20computerbase&cmpt=q&tz=
März 2011: Audi A7:68 computerbase: 18

Die Normierung ist bei beiden unterschiedlich.
Jetzt bringen wir cb mal auf die selbe Norm:
18/68*56=14.8

Mal überprüfen:
https://www.google.com/trends/explore#q=audi%20a7%2C%20computerbase%2C%20Audi%20A8&cmpt=q&tz=
März 2011: Audi A7:56 Audi A8: 70 computerbase: 15
Passt!
 
Vielen Dank für die Klärung. Das sieht wirklich vielversprechend aus. Scheitern wird es aber vermutlich, wie du schon sagtest, an dem Aufwand. Ohne Automatisierung das alles auszurechnen... Auch wenn mein Datensatz nur ca. 50 Elemente aufweist wird das schon sehr schwierig, da ich auch verschiedene Zeitpunkte vergleichen müsste.

Werde mich nochmal ein wenig damit beschäftigen, aber Google Trends scheint wohl doch eher auf Längsschnittdatenanalyse und nicht Querschnitts- ausgelegt zu sein -.-
 
Verschiedene Zeitpunkte ist ja nicht das Problem. In den runtergeladenen csv-Dateien sind ja die kompletten Zeitreihen wochengenau aufgelöst drin. Mit ein wenig Sprachkenntnissen (C, C++, Python...) kann man das automatisiert auswerten.

Nur das automatische eingeben der Suchbegriffe und runterladen der csv-Files weiß ich nicht wie das gehen soll. Was nicht heißt, dass das nicht möglich ist.

Nightt schrieb:
Längsschnittdatenanalyse und nicht Querschnitts-
Bahnhof
 
ForenTroll schrieb:

Ein Element kann super über die Zeit analysiert werden, aber mehrere Elemente in einem Zeitpunkt ist schwierig.

Programmierkenntnisse sind bei mir leider nur begrenzt vorhanden. Werde es dennoch mal versuchen und mal sehen was dabei rauskommt. Ansonsten kommt das Ganze eben in die "Discussion & Future Research" ;)

Vielen Dank für deine Hilfe! Auf CB ist Verlass :)
 
das Thema der Normierung von Google Trends Daten ist sogar komplizierter als gedacht.

Google setzt nicht nur den Höchstwert auf 100 und rechnet die anderen Werte proportional um, sondern es wird eine Art "Glättung" der Einzelwerte vorgenommen.

Es könnte eine einfache Mittelwertsglättung oder eine Polynomische oder Exponentiale Glättung oder eine Progressionsmethode sein.

Alle Glättungskurven sind normal immer "Nachlaufend" und "Abweichend" egal welche Methode man verwendet.

So wie ich die Daten beobachtet hab, ändern sich die rückwirkende Historie jeden Tag neu. Was ja eigentlich zu statistisch unbrauchbaren Daten führen muss.

Die Normierung ist nirgends dokumentiert.

Ich vermute sogar dass Google die Glättungskurven nachträglich um einige Perioden zurück setzt um dann näher an die Absolutzahlen mit der Normierung heranzukommen.

Das würde zumindest die täglichen Abweichungen in den Wochenwerten erklären.

Verwendet man aber Google Trends Daten in einer täglichen Auflösung (z.B. 30 Tage) und bildet daraus Wochendaten, so ist dieser Fehler nahezu elimeniert.

Eine andere Möglichkeit ist die Daten einfach zur Ende der Woche am Samstag (nach linux ist der erste Tag 0 der Sonntag) abzurufen. Am Sonntag beginnt dann die neue Woche für Google und der letzte Samstagswert wird in die csv geschrieben. Der letzte Wert ist bezüglich der historischen Glättung nicht veränderbar. Er muss aber jede Woche neu aufgezeichnet werden.
 
Zurück
Oben