Một sự cố hệ thống tên miền (DNS) nghiêm trọng tại Amazon Web Services (AWS) đã khiến một phần lớn internet toàn cầu tê liệt vào sáng ngày 20 tháng 10 năm 2025, gây ra gián đoạn trên diện rộng cho hàng trăm dịch vụ trực tuyến, từ các ứng dụng mạng xã hội đến nền tảng thương mại điện tử và cả các trang web chính phủ. Đây là một lời nhắc nhở không mấy dễ chịu về mức độ phụ thuộc của thế giới hiện đại vào hạ tầng đám mây của một ông lớn như Amazon.
Internet Tê Liệt Do Sự Cố DNS Của AWS
Vào khoảng 07:30 UTC (khoảng 14:30 giờ Việt Nam), sự cố bắt đầu xuất hiện, chủ yếu ảnh hưởng đến khu vực US-East-1 của AWS, đặt tại Bắc Virginia, Mỹ. Các báo cáo gián đoạn bùng nổ trên Downdetector, với hàng ngàn người dùng than phiền về việc không thể truy cập các dịch vụ yêu thích của mình. Nguyên nhân được xác định là một lỗi liên quan đến Amazon Route 53, dịch vụ DNS then chốt của AWS, vốn đóng vai trò như "danh bạ điện thoại" của internet, chuyển đổi tên miền dễ đọc thành địa chỉ IP mà máy tính có thể hiểu.
Mặc dù ban đầu có nhiều tin đồn lan truyền trên mạng xã hội về một cuộc tấn công mạng quy mô lớn – thậm chí có người còn suy đoán về sự can thiệp từ Trung Quốc – các chuyên gia an ninh đã nhanh chóng bác bỏ. Bằng chứng hiện tại chỉ ra đây là một lỗi nội bộ của AWS, có thể do cấu hình sai hoặc sự cố về tải, tương tự như các sự cố kỹ thuật trước đây chứ không phải một cuộc tấn công có chủ đích từ bên ngoài. Thật không thể tin nổi là một lỗi nhỏ như vậy lại có thể gây ra tác động lớn đến thế, phải không?
Phạm Vi Ảnh Hưởng Và Thời Gian Khắc Phục
Phạm vi của sự cố phải nói là cực kỳ rộng. Hàng trăm nền tảng, dịch vụ lớn nhỏ đều bị ảnh hưởng, bao gồm những cái tên quen thuộc hàng ngày của chúng ta như Snapchat, Hulu, Roblox, Fortnite, DoorDash, và cả các dịch vụ của chính Amazon như Prime Video và trợ lý ảo Alexa. Ngay cả các ngân hàng như Lloyds Bank và một số trang web chính phủ Anh cũng không thoát khỏi vòng xoáy gián đoạn này. Người dùng trên toàn cầu, đặc biệt ở Mỹ, Anh, châu Âu và một phần châu Á, đã phải đối mặt với tình trạng "mất mạng" tạm thời.
Sau khoảng 4 đến 6 giờ gián đoạn căng thẳng, đến khoảng 11:00-12:00 UTC, AWS bắt đầu báo cáo "dấu hiệu phục hồi". Theo thông tin cập nhật trên AWS Health Dashboard lúc 11:40 UTC, hầu hết các dịch vụ đã trở lại hoạt động bình thường, và đến 13:41 UTC, tình hình đã được kiểm soát phần lớn. Dù AWS đã có những cải tiến đáng kể trong khả năng tự động khôi phục DNS sau các sự cố trước đó, nhưng đây vẫn là một khoảng thời gian dài đủ để gây thiệt hại không nhỏ.
Tác Động Kinh Tế Và Bài Học Từ Sự Cố
Mặc dù chưa có con số chính thức về thiệt hại kinh tế, nhưng các sự cố tương tự trong quá khứ đã gây ra tổn thất hàng triệu USD cho các doanh nghiệp. Lần này, với việc các công ty tài chính như Robinhood và Coinbase báo cáo gián đoạn giao dịch, chắc chắn sẽ có những hệ lụy tài chính đáng kể. Người dùng Alexa cũng không thể sử dụng thiết bị của mình làm đồng hồ báo thức, một chi tiết nhỏ nhưng lại cho thấy sự phụ thuộc sâu rộng vào các thiết bị kết nối.
Sự cố lần này một lần nữa nhấn mạnh sự mong manh của hạ tầng internet và rủi ro của việc phụ thuộc quá mức vào một nhà cung cấp đám mây duy nhất – AWS hiện chiếm hơn 30% thị phần đám mây toàn cầu. Giới chuyên gia công nghệ đang cảnh báo về tầm quan trọng của chiến lược đa đám mây (multi-cloud) để giảm thiểu rủi ro khi một nhà cung cấp gặp sự cố. Đây không chỉ là vấn đề kỹ thuật; nó còn là một bài học lớn về chiến lược kinh doanh và khả năng phục hồi của doanh nghiệp trong kỷ nguyên số. Có lẽ đã đến lúc các công ty cần nghiêm túc suy nghĩ về việc phân tán rủi ro hạ tầng của mình, nếu không muốn rơi vào cảnh "chuỗi domino" mỗi khi một mắt xích yếu đi.