News Amazon Web Services: DNS-Problem legte zahlreiche Online-Dienste lahm

kachiri schrieb:
@aid0nex War doch früher nicht anders...
Immer mehr wurde von E-Mail zu MS Teams verlagert:
Wenn der eigene E-Mail Dienst ausfällt, ist vielleicht ein Unternehmen betroffen, vielleicht auch mehrere wenn man einen Hostingprovider nutzt.
Wenn MS Teams ausfällt, ist die ganze Welt betroffen.

Zum Glück findet langsam ein Umdenken statt, auch wenn eher getrieben durch politische Unabhängigkeit.
 
  • Gefällt mir
Reaktionen: truetone
Habs an Signal gemerkt. Dachte erst, mein Internet spinnt nach dem Umzug und wollte schon losfluchen, bis ich gemerkt habe, dass alles andere geht. :p

Wenn mal was bei AWS hakt, sind die Auswirkungen natürlich direkt für "alle" spürbar. Aber wie oft kommt das in der Größenordnung vor? Die Fehler werden dann auch innerhalb von kurzer Zeit behoben.

Wie viele Hobbyadmins haben in kleinen und mittelständischen Unternehmen bereits für größere Ausfälle ihrer Betriebe gesorgt, indem ihre Frickel-Eigenlösung zusammengebrochen ist?
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: prayhe, CadillacFan77, Wallwatcher und eine weitere Person
Moritz Velten schrieb:
Das ist ja ein Weltuntergang :rolleyes:
Je nachdem was du für Dienste als Firma brauchst ja.
Der letzte Azure Ausfall blieb mir in guter Erinnerung als 19h Tag.
Ergänzung ()

Ranayna schrieb:
Interessant finde ich dabei vorallem, dass obwohl es ja - laut Amazon - nur ein Rechenzentrum betroffen hat, trotzdem soviel ausgefallen ist.
Ich denke vielen Kunden ist die Moeglichkeit der Georedundanz, die AWS und andere Cloudabbieter ja anbieten, dann doch zu teuer. Und mein Stand ist, das so ein Ausfall wie dieser, locker-flockig in die ueblichen Verfuegbarkeits SLAs passen duerfte.
Da es ein DNS Problem war, ist das überhaupt nicht interessant sondern logisch.
Ergänzung ()

FrAGgi schrieb:
Wie viele Hobbyadmins haben in kleinen und mittelständischen Unternehmen bereits für größere Ausfälle ihrer Betriebe gesorgt, indem ihre Frickel-Eigenlösung zusammengebrochen ist?
Jap, das sehen viele auch nicht.
 
hä? in der heutigen zeit sollte doch alles in der cloud funktionieren und doppel aber vierfach abgesichert sein? verstehe das problem nicht. die KI hätte auch helfen können.
 
  • Gefällt mir
Reaktionen: Sennox
AAS schrieb:
Da es ein DNS Problem war, ist das überhaupt nicht interessant sondern logisch.
DNS kann man auch redundant bekommen. Und man sollte meinen, dass Amazon mehr DNS Server hat als die, die in US-EAST-1 stehen.
Und wenn das tatsaechlich Auswirkungen auf DNS in der gesamten AWS Umgebung hatte, ist die Aussage von Amazon falsch, dass es nur US-EAST-1 betroffen haette.

Ergo: Wenn Kunden Totalausfaelle hatten weil AWS US-EAST-1 ausgefallen ist, hat entweder der Kunde gespart und nur dort gehostet, oder Amazon hat noch nicht alles verraten was da tatsaechlich passiert ist.
 
  • Gefällt mir
Reaktionen: IgorGlock
Daraus lernen werden die Entscheidungssträger wie BWLer und Politiker mal wieder nichts lernen. Alles in die Cloud und vor allem in die SELBE Cloud stopfen. So viel zu digitalen Soveränität ...
 
aid0nex schrieb:
Das Internet war damals dezentralisiert gedacht... Aus gutem Grund: Redundanz durch Design. Mittlerweile wird es aber immer zentralisierter. Das ist nicht gut!
aber aber cloud ist doch dezentral * duck *



Oh Junge, es ist wieder so weit :)
layer8_dns_bgp_potter.jpg
 
  • Gefällt mir
Reaktionen: Fliz, SteeL1942, dasBaum_CH und 9 andere
kachiri schrieb:
So ist es ja nicht. AWS ist auch nur einer von vielen.

Nein eben nicht. AWS wird immer größer und größer, früher mal unabhängig gehostete Dienste gehen zu AWS usw. Es ist wie ein Krebsgeschwür das immer mehr Teile des Internets einnimmt. Das widerspricht jeglichem Kerngedanken eines dezentralisierten Internet.
 
  • Gefällt mir
Reaktionen: hansdampf84, Qyxes und Helge01
TempeltonPeck schrieb:
Daraus lernen werden die Entscheidungssträger wie BWLer und Politiker mal wieder nichts lernen. Alles in die Cloud und vor allem in die SELBE Cloud stopfen. So viel zu digitalen Soveränität ...
Ich kann dir aus dem FF min. 5 Fälle nennen, wo grössere Ausfälle da waren für die betroffenen KMUs, weil die Admins nichts in die böse Cloud verlagern wollten und nicht das Know-How hatten sowas anständig zu betreiben.
Ergänzung ()

Ranayna schrieb:
DNS kann man auch redundant bekommen. Und man sollte meinen, dass Amazon mehr DNS Server hat als die, die in US-EAST-1 stehen.
Und wenn das tatsaechlich Auswirkungen auf DNS in der gesamten AWS Umgebung hatte, ist die Aussage von Amazon falsch, dass es nur US-EAST-1 betroffen haette.

Ergo: Wenn Kunden Totalausfaelle hatten weil AWS US-EAST-1 ausgefallen ist, hat entweder der Kunde gespart und nur dort gehostet, oder Amazon hat noch nicht alles verraten was da tatsaechlich passiert ist.
DNS ist leider kein „lokales Detail“, das man einfach redundant wegkonfiguriert.
Alle AWS-Dienste hängen an der Namensauflösung – S3, EC2, RDS, interne APIs usw. Sobald der Resolver oder die Zone nicht sauber läuft, sind die Services für Clients praktisch unerreichbar, auch wenn die Server selbst laufen.

Dazu kommen zwei Punkte:
  • Viele Kunden nutzen den von AWS bereitgestellten Resolver (AmazonProvidedDNS). Fällt der in einer Region aus, schlägt das global auf alle Workloads durch, die darauf zeigen.
  • Schon kurze Aussetzer beim DNS führen zu Timeouts, Retries und Ketteneffekten in Microservices. Das wirkt dann wie ein Totalausfall, obwohl „nur“ DNS betroffen ist.
DNS kann trotz Redundanz systemisch ein Single Point of Failure sein – und genau deshalb haben DNS-Probleme oft deutlich grössere Auswirkungen als man auf den ersten Blick meint.
 
  • Gefällt mir
Reaktionen: prayhe, KoKane, tiga05 und eine weitere Person
aid0nex schrieb:
Nein eben nicht. AWS wird immer größer und größer, früher mal unabhängig gehostete Dienste gehen zu AWS usw.
Ja und dann kommen Vercel & Co um die ecke und verkaufen ein glorifiziertes AWS Frontend mit 500% Aufpreis.

Gerade sehe ich jedoch einen starken shift Richtung Cloudflare (cantinaband.jpg) und Hetzner "Cloud"
Und leider Wird Azure immer präsenter. Ich kann das alles nicht mehr.
Kann gen alpha denn kein ssh?!


So sehr ich Levelsio auch nicht mag, sein Bare Metal "influencing" Zieht bei seinen Fans sehr. Das respektiere ich gern
Ergänzung ()

AAS schrieb:
, weil die Admins nichts in die böse Cloud verlagern wollten und nicht das Know-How hatten sowas anständig zu betreiben
joa, skill issue
 
Tjoa, war ruhig in der Firma als CRM und Tel-Provider ausfielen.
 
AAS schrieb:
DNS kann trotz Redundanz systemisch ein Single Point of Failure sein – und genau deshalb haben DNS-Probleme oft deutlich grössere Auswirkungen als man auf den ersten Blick meint.
Das stelle ich garnicht in Frage. Klar, aufgrund der hierarchischen Struktur im DNS kann ein Fehler sehr schnell weitreichende Folgen haben.
Aber dann sind wir da wieder an der Stelle, das Amazon noch nicht mit allen Details rumgekommen ist, und bis jetzt immer nur US-EAST-1 erwaehnt wird, als ob andere AWS Regionen nicht betroffen waren.
 
Ah, deswegen ging bei Todoist wohl nix am Vormittag. Habe die Zeit teilweise genutzt um mir Gedanken zu machen, wie ich ein ähnliches Aufgabenmanagment in meiner NextCloud Instanz aufbauen kann 😄
 
  • Gefällt mir
Reaktionen: madmax2010
forumular schrieb:
hä? in der heutigen zeit sollte doch alles in der cloud funktionieren und doppel aber vierfach abgesichert sein? verstehe das problem nicht.
Damit hast Du eigentlich Recht, Cloud-Dienste sind "normalerweise" redundant ausgelegt, daher hätte das eigentlich nicht passieren sollen. Kann aber auch ein Konfigurationsproblem gewesen sein, und nicht ein Hardware-Ausfall.
forumular schrieb:
die KI hätte auch helfen können.
Die bestimmt nicht.
 
1776 schrieb:
Deshalb nie vergessen liebe IT Kollegen. Wenn Euch die McKinsey beeinflussten Manager zwingen, Zeug in die Cloud zu verlagern, schlagt vor unbedingt das Ticket und Telefonsystem in diesselbe Cloud zu verlagern!
Wenn die down ist, habt Ihr dann wenigstens Eure Ruhe. 👍
Gefällt mir.
Bei uns hat es jedenfalls das Ticketsystem stark beeinflusst, hatte quasi den selben Effekt :D
 
Heute morgen hatte ich Probleme in der Amazon App. Er hat mir meinen Warenkorb im Konto meiner Frau angezeigt. Habe mich ausgeloggt und konnte mich nicht mehr einloggen.
 
War Spaßig heute morgen, endlich Zeit sich in der Kaffe Küche Zeit zu lassen ohne schlechtes Gewissen


G3sPyzcW4AAKARa.png
 
  • Gefällt mir
Reaktionen: Benj, catch 22, KoKane und 4 andere
Zurück
Oben