Amazon thừa nhận 1 lỗi đánh máy đã khiến 20% Internet tê liệt

Đầu tuần vừa qua, máy chủ S3 của Amazon Web Services gặp sự cố dẫn đến 20% Internet tê liệt, và nguyên nhân khá bất ngờ là do một kỹ sư của họ đã gõ sai câu lệnh.

Nền tảng điện toán đám mây AWS của Amazon hiện đang nắm giữ tới 40% thị phần. (Ảnh: Shutterstock)

Câu lệnh bị gõ sai này đã khiến cho máy chủ tại khu vực Virginia (Mỹ) của Amazon ngừng hoạt động và người dùng khó có thể truy cập hàng loạt website lớn như Instagram, Vine, Slack, Giphy, Quora, Business Insider, Verge… hay các dịch vụ IoT như Amazon Alexa.

Cho dù sự cố được khắc phục chỉ sau đó 4 giờ đồng hồ, nhưng cũng đủ khiến cổ phiếu trong S&P 500 của công ty mất đến 150 triệu USD.

Trong một tuyên bố online, Amazon đã giải thích, sáng ngày thứ Ba (28/2) các thành viên trong nhóm S3 đã tiến hành sửa một lỗi khiến hệ thống thanh toán hoạt động chậm hơn thường lệ. Trong quá trình sửa lỗi, họ sẽ phải tạm dừng một số server. Nhưng không may là một nhân viên đã nhập sai một trong số các lệnh này, vô tình khiến cho lượng lớn server nằm ngoài dự kiến bị ngừng hoạt động, và cụm server này lại đang hỗ trợ hai hệ thống phụ khác của S3.

Hai hệ thống phụ này vô cùng quan trọng. Một trong số đó có hệ thống quản lý metadata và thông tin vị trí của tất cả các dịch vụ liên quan đến hệ thống máy chủ S3 trong khu vực, không có hệ thống trên, những dịch vụ dựa vào S3 không thể thực hiện phục hồi dữ liệu và tác vụ cơ bản.

Khi các server còn lại phải chạy quá công suất thì chúng buộc phải khởi động lại và quá trình này không nhanh như khởi động một chiếc máy tính thông thường.

Năm 2015, máy chủ của Amazon Web Services tại Virginia cũng gặp lỗi khiến nhiều dịch vụ ngừng hoạt động và rất nhiều người đã không thể gọi điện hay chat video qua Skype.

Trên thực tế, Amazon có quy trình để xử lý những sự cố như thế này, nhưng vấn đề này khá phức tạp và Amazon cũng không thể phục hồi hệ thống trong thời gian ngắn. Công ty này cho biết: “S3 đã trải qua mở rộng vô cùng mạnh mẽ trong vài năm vừa qua, bởi vậy quá trình khởi động lại những server này và thực hiện các tác vụ kiểm tra an toàn để chứng thực tính toàn vẹn của metadata diễn ra lâu hơn dự kiến.”

Amazon đã xin lỗi khách hàng và cam kết sẽ có nhiều thay đổi với S3 để hệ thống này có thể hồi phục nhanh hơn nữa, đồng thời sẽ ngăn “ lỗi đánh máy” bằng cách không cho phép các nhân viên làm việc tại đây giảm hiệu năng của S3 xuống ngưỡng tối thiểu để duy trì các hệ thống phụ nữa.

An Nhiên (T/H)

Xem thêm:

An Nhiên

Published by
An Nhiên

Recent Posts

Vụ trẻ 20 tháng tuổi bị bảo mẫu bạo hành ở Quảng Nam: Chủ nhóm trẻ bị tạm giữ

Camera trong nhóm trẻ tư thục Con Cưng (tỉnh Quảng Nam) thường bị tắt từ…

1 giờ ago

Điều trị I-131: Vũ khí hiệu quả trong quản lý bệnh tuyến giáp

Nếu bạn hoặc người thân từng được chẩn đoán mắc các bệnh tuyến giáp như…

2 giờ ago

Bill Maher: Ông Trump “chừng mực và nhã nhặn” trái ngược với hình ảnh trên truyền hình

Ông Maher nói rằng ông Trump đã tỏ ra vui vẻ và lịch thiệp hơn…

2 giờ ago

Liên tiếp hai vụ cháy rừng tại Quảng Ninh: Những đồi thông, keo rực lửa

Tối đêm 12/4, tỉnh Quảng Ninh liên tiếp xảy ra 2 vụ cháy rừng. Lửa…

2 giờ ago

Ông Tập lôi kéo EU chống lại Mỹ, báo chí Pháp kêu gọi cần cảnh giác “bạn giả”

Ông Tập Cận Bình đã kêu gọi Liên minh châu Âu (EU) “cùng kháng cự”…

2 giờ ago

[VIDEO] Trung Quốc hứng chịu gió cấp 10, cát vàng ngập trời kèm mưa đá

Vào ngày 11 tháng 4, Bắc Kinh, Thiên Tân, Hà Bắc, Nội Mông... đã hứng…

2 giờ ago