亞馬遜AWS解釋故障原因并提出解決措施
12月13日消息,據(jù)CNBC報(bào)道,上周五,亞馬遜網(wǎng)絡(luò)服務(wù)公司發(fā)布了本月早些時(shí)候發(fā)生的長達(dá)數(shù)小時(shí)的故障的解釋,此重大故障是在網(wǎng)絡(luò)設(shè)備過載后開始的,該故障擾亂了其零售業(yè)務(wù)和第三方在線服務(wù)。該公司還表示計(jì)劃對其狀態(tài)頁面進(jìn)行修改。
該公司表示,亞馬遜在弗吉尼亞州的大型數(shù)據(jù)中心US-East-1區(qū)域的問題是在美國東部時(shí)間周二上午10點(diǎn)30分開始的。
該公司在其網(wǎng)站上的一篇文章中寫道:“為擴(kuò)大托管在AWS主網(wǎng)絡(luò)中的一項(xiàng)AWS服務(wù)的容量而進(jìn)行的自動(dòng)化活動(dòng),引發(fā)了內(nèi)部網(wǎng)絡(luò)內(nèi)大量客戶的意外行為?!苯Y(jié)果,連接亞馬遜內(nèi)部網(wǎng)絡(luò)和AWS網(wǎng)絡(luò)的設(shè)備變得過載。
一些AWS工具受到了影響,包括提供虛擬服務(wù)器容量的EC2服務(wù)。AWS的工程師努力解決這些問題,并在接下來的幾個(gè)小時(shí)內(nèi)恢復(fù)了服務(wù)。EventBridge服務(wù)可以幫助軟件開發(fā)人員建立應(yīng)用程序,對某些活動(dòng)做出反應(yīng),但直到美東時(shí)間晚上9點(diǎn)40分才完全恢復(fù)。
AWS就此次故障對其客戶造成的影響表示歉意。
據(jù)了解,此次故障使得熱門網(wǎng)站和大量使用的服務(wù)都被中斷,包括Disney+、Netflix和Ticketmaster。Roomba吸塵器、亞馬遜的Ring安全攝像頭和其他互聯(lián)網(wǎng)連接的設(shè)備,如智能貓砂盒和應(yīng)用程序連接的吊扇也因故障而被關(guān)閉。
亞馬遜自己的零售業(yè)務(wù)在美國的一些地區(qū)也陷入停滯。亞馬遜的倉庫和送貨人員使用的內(nèi)部應(yīng)用程序依賴于AWS,因此在周二的大部分時(shí)間里,員工無法掃描包裹或訪問送貨路線。第三方賣家也無法訪問用于管理客戶訂單的網(wǎng)站。
此外,客戶在中斷期間有七個(gè)小時(shí)無法創(chuàng)建支持案例。
AWS表示,我們預(yù)計(jì)在明年初發(fā)布新版本的服務(wù)健康儀表盤,這將使我們更容易了解服務(wù)的影響,以及一個(gè)新的支持系統(tǒng)架構(gòu),該架構(gòu)在多個(gè)AWS地區(qū)積極運(yùn)行,以確保我們在與客戶溝通時(shí)不會(huì)出現(xiàn)延誤。
據(jù)了解,上周,亞馬遜云計(jì)算服務(wù)的相關(guān)狀態(tài)頁面發(fā)布了一則通知,稱平臺在一些應(yīng)用編程接口(API)和云計(jì)算“管理控制臺”功能上出現(xiàn)了故障。這些故障主要影響到亞馬遜云計(jì)算服務(wù)的“美國東部1區(qū)”,數(shù)據(jù)中心位于弗吉尼亞州北部。
2、電商號平臺僅提供信息存儲服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn