
Khu vực “Data Center Alley”, trải dài 30 dặm vuông bên ngoài thủ đô Washington D.C. và là nơi đặt hơn 200 trung tâm dữ liệu, tiêu thụ lượng điện gần bằng toàn bộ thành phố Boston. Vì vậy, các công ty điện lực đã vô cùng hoảng sợ khi một phần lớn trong số các trung tâm này – khoảng 60 trung tâm – bất ngờ rời khỏi lưới điện vào một ngày hè năm ngoái và chuyển sang sử dụng máy phát điện tại chỗ.
Phản ứng đồng loạt này được kích hoạt bởi một cơ chế an toàn tiêu chuẩn trong lĩnh vực trung tâm dữ liệu, nhằm bảo vệ chip máy tính và thiết bị điện tử khỏi hư hỏng do dao động điện áp. Tuy nhiên, theo các cơ quan quản lý liên bang và các lãnh đạo ngành điện, điều này đã gây ra một lượng điện dư thừa khổng lồ trên lưới điện.
Sự mất cân bằng nghiêm trọng buộc nhà điều hành lưới điện PJM và công ty điện địa phương Dominion Energy phải cắt giảm sản lượng của các nhà máy điện để bảo vệ hạ tầng lưới điện và tránh kịch bản tồi tệ nhất là tình trạng rã lưới điện trên toàn khu vực.
Sự cố suýt gây thảm họa này – lần đầu tiên được Reuters đưa tin chi tiết – đã buộc các nhà quản lý liên bang phải thừa nhận một lỗ hổng mới trong lưới điện của Mỹ: việc các trung tâm dữ liệu ngắt kết nối khỏi lưới mà không báo trước.
“Khi các trung tâm dữ liệu ngày càng lớn hơn và tiêu thụ nhiều năng lượng hơn, lưới điện không được thiết kế để chịu đựng việc mất đi nguồn tiêu thụ từ các trung tâm dữ liệu có công suất lên đến 1.500 megawatt,” John Moura, Giám đốc Đánh giá Độ tin cậy và Phân tích Hệ thống của Tập đoàn Đảm bảo Độ tin cậy Điện Bắc Mỹ (NERC), nói với Reuters trong một cuộc phỏng vấn. “Ở một mức độ nào đó, con số này trở nên quá lớn vượt quá sức chịu đựng của lưới.”
Trước đây, các nhà điều hành lưới điện thường lập kế hoạch đối phó với tình huống các nhà máy điện lớn gặp sự cố và ngắt kết nối. Tuy nhiên, sự phát triển nhanh chóng của các trung tâm dữ liệu – nơi xử lý lượng thông tin khổng lồ phục vụ AI và khai thác tiền điện tử – đang buộc các nhà điều hành phải tính toán những kịch bản mới, khiến nhiệm vụ vốn đã phức tạp là cân bằng cung cầu điện trên toàn quốc càng thêm thách thức.
“Điều này cho chúng ta thấy rằng hành vi của các trung tâm dữ liệu có thể gây ra sự cố mất điện dây chuyền (cascading power outages) cho cả một khu vực,” Alison Silverstein, cựu cố vấn cao cấp cho Chủ tịch Ủy ban Điều tiết Năng lượng Liên bang Mỹ (FERC), cho biết.
Sự cố ngày 10-7 năm ngoái xảy ra gần vùng ngoại ô Fairfax của D.C. ở Virginia, khu vực được mệnh danh là “Thung lũng Trung tâm Dữ liệu (Data Center Alley)” vì tập trung nhiều trung tâm dữ liệu phục vụ cho Microsoft, Google và Amazon. Khoảng 70% lưu lượng internet toàn cầu đi qua khu vực này.
Một tháng sau sự cố, Tập đoàn Độ tin cậy Điện Bắc Mỹ (NERC) – cơ quan liên bang phụ trách độ tin cậy của lưới điện – đã thành lập một lực lượng đặc nhiệm để nghiên cứu hiện tượng ngắt kết nối hàng loạt của các trung tâm dữ liệu và các trang trại khai thác tiền điện tử.
Trong phóng sự này, Reuters đã xem xét hàng nghìn trang tài liệu quy định và phỏng vấn khoảng một chục lãnh đạo ngành để xác định nguyên nhân sự cố – một bộ bảo vệ chống quá áp bị hỏng trên đường dây 230 kilovolt Ox-Possum của Dominion gần Fairfax, Virginia – và cách sự cố lan rộng ra toàn khu vực.
NERC đã xem xét sự cố trong một báo cáo hồi tháng 1 nhưng không tiết lộ vị trí chính xác của sự cố, số lượng trung tâm dữ liệu bị ảnh hưởng, hoặc cách PJM và Dominion phối hợp để tái cân bằng cung cầu điện trên lưới.
Các sự cố suýt gây thảm họa ngày càng gia tăng
Số lượng các sự cố suýt gây thảm họa như sự cố ở Data Center Alley đã tăng nhanh trong 5 năm qua khi ngày càng có nhiều trung tâm dữ liệu đi vào hoạt động.
Theo một báo cáo do Phòng Thí nghiệm Quốc gia Lawrence Berkeley thực hiện cho Bộ Năng lượng Mỹ vào tháng 12, lượng điện mà các trung tâm dữ liệu tiêu thụ đã tăng gấp ba lần trong thập kỷ qua và có thể sẽ lại tăng gấp ba lần vào năm 2028.
Một cuộc rà soát của Reuters đối với các hồ sơ công khai của ERCOT – nhà điều hành lưới điện chính của bang Texas – đã xác định hơn 30 sự cố suýt gây thảm họa kể từ năm 2020, do các khách hàng tiêu thụ năng lượng lớn như trung tâm dữ liệu và các cơ sở khai thác tiền điện tử đột ngột ngắt kết nối khỏi lưới.
Vào tháng 12 năm 2022, một máy biến áp bị hỏng tại một trạm biến áp ở miền tây Texas đã khiến gần 400 cơ sở khai thác tiền điện tử, trung tâm dữ liệu và cơ sở sản xuất dầu khí đồng loạt ngắt kết nối mà không báo trước.
Lượng điện dư thừa lên tới gần 1.700 megawatt – tương đương khoảng 5% tổng nhu cầu điện của lưới – đã buộc 112 megawatt công suất phát điện phải ngừng hoạt động, theo dữ liệu từ ERCOT.
Theo một báo cáo của NERC vào tháng 12, nguy cơ mất điện sẽ ngày càng tăng lên khi các trung tâm dữ liệu mới đi vào hoạt động. Báo cáo cho biết gần như toàn bộ nước Mỹ sẽ phải đối mặt với rủi ro thiếu hụt năng lượng cao hơn trong vòng 5 đến 10 năm tới.
Cơ quan quản lý đã kêu gọi các công ty điện lực xem xét cập nhật các tiêu chuẩn độ tin cậy liên bang cho các trung tâm dữ liệu và cơ sở khai thác tiền điện tử.
Một giải pháp gây tranh cãi
Theo NERC, nhiều trung tâm dữ liệu được thiết kế để chuyển sang dùng máy phát điện tại chỗ ngay khi phát hiện dấu hiệu bất thường nhỏ nhất trên lưới điện nhằm giảm thiểu nguy cơ gián đoạn các dịch vụ như Google Search hoặc khai thác tiền điện tử.
Một số nhà điều hành lưới điện đã đề xuất yêu cầu các trung tâm dữ liệu phải tiếp tục hoạt động trên lưới khi có hiện tượng sụt áp thông thường mà không được ngắt kết nối. Tuy nhiên, các nhà vận hành trung tâm dữ liệu phản đối vì lo ngại nguy cơ làm hư hỏng thiết bị điện tử và hệ thống làm mát.
Năm ngoái, ERCOT đã rút lại đề xuất áp dụng quy định “ride-through” – yêu cầu tiếp tục duy trì kết nối khi sụt áp – đối với các trung tâm dữ liệu và cơ sở khai thác tiền điện tử sau khi vấp phải phản đối từ Liên minh các Trung tâm Dữ liệu (Data Center Coalition).
Nhóm này – bao gồm các thành viên như Amazon, Google và Meta – cho rằng quy định đó sẽ làm tăng chi phí và gia tăng nguy cơ hư hỏng chip máy tính cũng như các hệ thống làm mát khi tiếp xúc với điện áp dao động.
“Phần cứng và nguồn điện của trung tâm dữ liệu, cũng như các thiết bị điện tử khác, rất nhạy cảm với sự ổn định của nguồn điện,” liên minh này cho biết trong các ý kiến nộp lên ERCOT vào tháng 1 năm 2024.
“Việc vận hành ngoài phạm vi điện áp cho phép sẽ làm giảm hiệu suất tối ưu, rút ngắn tuổi thọ hoặc gây hư hỏng không thể sửa chữa cho các linh kiện.”
Kỹ sư vận hành Patrick Gravois của ERCOT cho biết trong một bài thuyết trình vào tháng 12 với Lực lượng Đặc nhiệm về Tải lớn của NERC rằng “có khả năng rất cao” quy mô của các sự cố ngắt kết nối này sẽ gia tăng khi các cơ sở lớn hơn kết nối vào lưới điện Texas.
Ông Gravois nói rằng ERCOT vẫn đang cố gắng xác định chính xác những yếu tố nào khiến các khách hàng tiêu thụ điện lớn ngắt kết nối khỏi lưới điện để có thể chủ động phòng ngừa.
Ari Peskoe, Giám đốc Chương trình Luật Điện của Trường Luật Harvard, cho biết các nhà quản lý có thể yêu cầu các trung tâm dữ liệu tiếp tục hoạt động khi xảy ra hiện tượng sụt áp – nhưng điều đó có thể khiến các ông lớn công nghệ rời đi đến các bang có quy định lỏng lẻo hơn.
Jim Simonelli, Giám đốc Công nghệ bộ phận năng lượng an toàn của Schneider Electric, cho biết ngành điện lực và ngành trung tâm dữ liệu có rất nhiều bài học cần rút ra từ những gì đã xảy ra bên ngoài Washington D.C. vào tháng 7 vừa qua.
“Điều mà ngành trung tâm dữ liệu hiện chưa có là cách để thân thiện với lưới điện,” ông Simonelli nói.
Các tòa nhà Trung tâm Dữ liệu của Digital Realty nằm dọc theo con phố ở Ashburn, bang Virginia, Hoa Kỳ. Ảnh: Reuters