News Neuer Suchindex bei Google

@sizeofanocean
sehr interessantes Video, danke für den Link.

Mich würde auch mal interessieren was google alles speichert und vor allem wie ? Kann mir nicht vorstellen das die mit mysql datenbanken arbeiten :)

mfg Jojo
 
sizeofanocean schrieb:

Da wird aber nur ueber die Ausfallwahrscheinlichkeit der Platten (SAS / SATA) und die Verknuepfung mit SMART Daten berichtet. Mir ging es aber um die geringere Performance von SATA Platten in Datenbankumgebungen (hoher IO) und warum gerade Google davon nicht betroffen waere. Trotzdem Danke, war auch so interessant! :)

winni71 schrieb:
Da ist ein Bericht mit Bild
http://winfuture.de/news,46336.html
Ist übrigens kein Aprilscherz gewesen, haben auch andere Medien drüber berichtet.

Sieht aber doch irgendwie nach Aprilscherz aus. ;)

1160 Server pro Container und 2 Hitachi Deskstar pro Server? Da soll der komplette Google Datenbestand gespeichert sein?? Welches System soll denn da den Overhead verwalten um die Daten kreuz und quer auf allen "Miniservern" abzulegen?

Sieht mir eher nach einem effizienten und leicht erweiterbarem Clustersystem aus, was die ganzen Anfragen etc. bewaeltigt. Aber nicht nach dem eigentlichen Storagesystem, auf was meine Frage eigentlich abzielte. :)
 
DVNO schrieb:
vorallem, wie durchsucht man so viel innerhalb von den paar sekunden die nach einem klick auf den googlebutton bleiben?
irgendwas damit haben wohl die illuminaten zu tun.

Ja ne klar.
Schon mal was von Suchalgorithmen gehört?

Das Containerprinzip finde ich nicht schlecht, ich frage mich aber ob man evt. auch die Abwärme irgendwie Sinnvoll nutzt denn die ist bei der Menge ja sicherlich ordentlich.

So wird immerhin auch mal deutlich wieso Google solch ein aggressives Werbemedium besitzt. Das ganz muss ja auch finanziert und weiter entwickelt werden, mal von den ganzen Nebenkosten die dabei entstehen abgesehen.
 
Hier scheinen manche den RAM nicht bedacht zu haben. Hinzu kommt, das Google wohl die ganzen Daten komprimiert abspeichert.
Denken fällt manchmal schwer, wenn es doch nur um die einfachsten Dinge geht. :D
 
Glaubst du nicht das man die komprimierte Größe angegeben hat wenn es so ist?
Das scheinst du nicht bedacht zu haben.
 
Ihr müsst auch bedenken, dass diese 100 Millionen Gigabyte nur den Suchindex umfassen.
Viele Webseiten befinden sich auch bei Google im Cache, dann gibts noch Google Mail, Earth usw.
Youtube ist auch nicht zu vergessen.
 
Was ich am heutigen Internetrecht nicht verstehe ist, warum darf ein Indexierungsdienst ohne Erlaubnis alle Seiten aufrufen und abspeichern, ich aber nicht auf einer Domain einer Bank alle möglichen Kombinationen von Benutzer und Passwort ausprobieren. Das ist doch Schizophre.
...
Am liebsten würde ich mal wenn Herr Brin oder Herr Page in Deutschland sind an eines ihrer Hotelzimmer klopfen, wenn einer aufmacht hineingehen, mir ein Sandwitch machen und mich bei Ihm vor die Klotze setzen.

[Kurz um]
Richtig wäre es, die Erlaubnis vorher mittel robots.txt zu prüfen und vor jeder Weiterleitung erneut zu prüfen, oder über den Meta Eintrag zu prüfen.
 
Zuletzt bearbeitet:
@dml: hä? was hat denn das eine mit dem anderen zu tun?
seit wann darf ein indizierungsdienst seiten und passwörter hacken? ein indizierungsdienst scanned nur freizugängliche seiten.

unerlaubeter zugriff auf private seiten ist was völlig anderes.

was ist daran shizophren?
 
Privat ist ein zu ungenauer Begriff für mich.
Der LogIn Bereich einer Bank ist auch öffentlich, es sei den betrügeriche Absicht einer Bank steckt dahinter, wenn sie wonanders, dann wieder einschränkungen macht, oder sie z.B. auf finnisch schreibt.
 
Zuletzt bearbeitet:
alter schwede. der loginbereich ja, aber nicht das wo du mit einem gehakten password reinkommst!

du kannst dir den loginbereich so oft anschaun wie du willst und ihn auch speichern, aber das umgehen der sicherheitssperren ist illegal. was hat das mit dem vorgehen eines suchindizierung zu tun?

was du schreibst entbehrt jeglichen zusammenhangs und logik.
 
Aber du hast mich auf eine Idee gebracht. Ich schreibe unter die Seite das die Indexierung verboten ist und mit einer Strafe von 5000€ belegt ist.

Tolle Idee, Danke :D

Obwohl, muss ich noch nicht einmal schreiben, oder ist es erlaubt in anderen Leute Brieftaschen zu greifen, wenn sie es nicht ausdrücklich verbieten?
 
Zuletzt bearbeitet:
sag mal nimmst du drogen?

ich blick einfach nicht durch was du da redest. ich erkenne einfach keine zusammenhänge zwischen den verschiedenen dingen die du da von dir läßt. deine metaphern und ausagen passen in meinen augen sowas von überhaupt nicht.

völlig wirr was du da redest.
 
Stimmt, eine besser Erklärung wäre ein Klamottenladen, der ist auch, wenn er geöffnet ist für alle Leute zugänglich und deshalb darf man dort sich die Klamotten nehmen und wieder gehen.
Ok ich mach es leichter:
Normaler Weise müsste ein Hinweis (robots.txt) in dem Klamottenlader ausgehangen sein, der die Mitnahme von Kleidungsstücken nur gegen Bezahlung erlaubt. In Deutschland findet man solch einen Hinweis meist nicht an, da es im Gesetz geregelt und allgemein bekannt ist. Doch nur weil der Laden in den Öffnungzeiten geöffnet ist, kann man dort nicht tun und lassen was man will.
 
Zuletzt bearbeitet:
nein, das ist genauso dämlich und falsch!

entweder du nimmst wirklich üble drogen, dann lass es. oder aber du hast ne echt verdrehte und sinnfreie logik.
 
Wo nimmst du einfach die Beziehung mit den Drogen her? Beleidigend kann ich auch sein keine Angst.
Feierabend.
 
aus deinen wirren und zusammenhangslosen kommentaren. es war nicht beleidigend gemeint. ich hab nur noch nie jemanden so wirr reden sehen.

ich blick immer noch nicht, wie du das knacken von passwortgeschützten seiten mit dem dursuchen des indexierungsdienstes verlgeichen willst, noch das speichern von öffentlich ausgestellten seiten mit dem klauen von klammoten im laden.

und ausgerechnet du meinst die rechtslage wäre deswegen shizophren?

also man muss sich schon sehr viel mühe geben so zusammenhangslose vergleiche aufzustellen.

edit: du beleidigst dich selbst mit deinen absurden beispielen und kommentaren.
 
Es ging mir lediglich darum das diese beiden Daten in den ungeschützten Bereich, ohne .htacess, auf dem Webserver liegen, und das alleine kein Grund/keine Berechtigung ist mit diesen Daten anzustellen was man will.
Aber du hast Recht, ich sollte mich hier nicht wie eine Harpyie aufführen, ich bin für diese Auslegung weder Schuld noch Verandwortlich.
Also lassen wir es am besten.
 
Zuletzt bearbeitet:
ich kapiere dml auch nicht, was er uns sagen will...wenn du nicht willst das deine Seite nicht von google indixiert werden soll, dann verbiete es in der robot.txt oder nehme die seite vom netz :freak:
 
Ich muss mich korrigieren, ich bohr das Schloß einfach auf, da dies ja möglich ist, und hau den beiden einfach ein paar auf den Kopp.

Heute schon wieder ein Angriff von Google auf meinen Rechner.
Vielleicht sollte man unter anderem inzwischen eine Sicherheitswarnung herrausbringen, das der Internetbrowser Thunderbird von Google infiziert ist. Wie steht es eigentlich mit der Bezahlung, kann ich die Kosten zur Gegenwehr eigentlich der Firma auch in Rechnung stellen? Oder gehört das alles wieder zur Eigenverantwortung, die angesichts das Know-Hows und der Verbindungen der Firma eigentlich nicht erfüllbar ist?
 
Zuletzt bearbeitet:
Zurück
Oben