อ่าน 6 นาที
เวลาหยุดทำงาน
ในด้านคอมพิวเตอร์และโทรคมนาคม ช่วงเวลาที่ ระบบ หยุดทำงาน ( หรือ ที่เรียกกันทั่วไปว่า การหยุดชะงักของระบบ ) คือช่วงเวลาที่ระบบไม่สามารถใช้งานได้ ความไม่สามารถใช้งานได้ นี้...
เวลาหยุดทำงาน
ในด้านคอมพิวเตอร์และโทรคมนาคมช่วงเวลาที่ ระบบ หยุดทำงาน ( หรือ ที่เรียกกันทั่วไปว่า การหยุดชะงักของระบบ ) คือช่วงเวลาที่ระบบไม่สามารถใช้งานได้ความไม่สามารถใช้งานได้ นี้ คิดเป็นสัดส่วนของช่วงเวลาที่ระบบไม่สามารถใช้งานได้หรือออฟไลน์โดยปกติแล้วมักเป็นผลมาจากการที่ระบบทำงานล้มเหลวเนื่องจากเหตุการณ์ที่ไม่ได้วางแผนไว้ หรือเนื่องจากการบำรุงรักษา ตามปกติ (เหตุการณ์ที่วางแผนไว้)
คำเหล่านี้มักใช้กับเครือข่ายและเซิร์ฟเวอร์สาเหตุทั่วไปของการหยุดทำงานโดยไม่คาดคิดคือความล้มเหลวของระบบ (เช่นการขัดข้อง ) หรือความล้มเหลวในการสื่อสาร (โดยทั่วไปเรียกว่าการหยุดทำงานของเครือข่ายหรือภาวะขาดแคลนเครือข่าย ) สำหรับการหยุดทำงานเนื่องจากปัญหาเกี่ยวกับระบบคอมพิวเตอร์ ทั่วไป อาจใช้ คำว่าการหยุดทำงานของคอมพิวเตอร์ (หรือการหยุดทำงานด้านไอทีหรือภาวะขาดแคลนไอที ) ได้
คำนี้ยังใช้กันทั่วไปในสภาพแวดล้อมทางอุตสาหกรรม โดยเกี่ยวข้องกับความล้มเหลวของอุปกรณ์การผลิตทางอุตสาหกรรม โรงงานบางแห่งวัดเวลาหยุดทำงานที่เกิดขึ้นระหว่างกะการทำงาน หรือในช่วงเวลา 12 หรือ 24 ชั่วโมง อีกวิธีปฏิบัติทั่วไปคือการระบุสาเหตุของการหยุดทำงานแต่ละครั้งว่าเกิดจากสาเหตุการทำงาน ระบบไฟฟ้า หรือระบบกลไก
สิ่งที่ตรงข้ามกับเวลาหยุดทำงานคือเวลาทำงานต่อเนื่อง
ประเภท
มาตรฐานอุตสาหกรรมสำหรับคำว่า "ระยะเวลาหยุดซ่อมบำรุง" หรือ "ระยะเวลาการบำรุงรักษา" อาจมีจุดเริ่มต้นและจุดสิ้นสุดที่แตกต่างกัน ดังนั้นจึงควรใช้คำชี้แจงต่อไปนี้เพื่อหลีกเลี่ยงความขัดแย้งในการดำเนินการตามสัญญา:
- "แบบครบวงจร" (Turnkey) เป็นรูปแบบการหยุดทำงานที่น่าสนใจที่สุด การหยุดทำงานหรือการบำรุงรักษาเริ่มต้นเมื่อผู้ควบคุมโรงงานหรืออุปกรณ์กดปุ่มปิดหรือปุ่มหยุดเพื่อเริ่มการทำงาน เว้นแต่จะระบุไว้เป็นอย่างอื่น การหยุดทำงานหรือการบำรุงรักษาจะถือว่าเสร็จสมบูรณ์เมื่อโรงงานหรืออุปกรณ์กลับมาทำงานตามปกติ พร้อมที่จะเริ่มการผลิต หรือพร้อมที่จะซิงโครไนซ์กับระบบหรือโครงข่ายไฟฟ้า หรือพร้อมที่จะปฏิบัติหน้าที่เป็นปั๊มหรือคอมเพรสเซอร์
- การหยุดทำงานหรือการบำรุงรักษาแบบ "เบรกเกอร์ต่อเบรกเกอร์" นี้ เริ่มต้นด้วยการที่ผู้ควบคุมโรงงานหรืออุปกรณ์ตัดวงจรไฟฟ้า (เบรกเกอร์หลักอยู่ที่ตำแหน่ง "ปิด" หรือ "ปลดการทำงาน" หรือ "เปิดเพื่อระบายความร้อน") ไม่ใช่การตัดวงจรควบคุมออกจากการทำงาน วิธีนี้จะช่วยให้สามารถระบายความร้อนให้กับอุปกรณ์หรือปรับอุณหภูมิให้เท่ากับอุณหภูมิแวดล้อมได้ เพื่อเตรียมการหรือเริ่มงานหยุดทำงาน/บำรุงรักษา ขึ้นอยู่กับประเภทของอุปกรณ์ การหยุดทำงานแบบ "เบรกเกอร์ต่อเบรกเกอร์" อาจเป็นประโยชน์หากว่าจ้างผู้รับเหมาภายนอกในการบำรุงรักษาที่เกี่ยวข้องกับระบบควบคุม เนื่องจากงานบำรุงรักษาประเภทนี้สามารถทำได้ในขณะที่อุปกรณ์หลักยังอยู่ในช่วงระบายความร้อนหรืออยู่ในโหมดสแตนด์บาย เว้นแต่จะระบุไว้เป็นอย่างอื่น การหยุดทำงานประเภทนี้จะถือว่าเสร็จสมบูรณ์เมื่อวงจรไฟฟ้าได้รับการจ่ายไฟอีกครั้งโดยการเปิดเบรกเกอร์
- "การเสร็จสิ้นการล็อกเอาต์/แท็กเอาต์ " การหยุดทำงานหรือการบำรุงรักษา (บางครั้งอาจเข้าใจผิดว่าเป็น "การระบายความร้อน" แต่ไม่ใช่สิ่งเดียวกัน) นี้เริ่มต้นด้วยผู้ควบคุมโรงงานหรืออุปกรณ์ถอดวงจรไฟฟ้า ปลดวงจรควบคุม และดำเนินการอื่นๆ เพื่อลดอันตรายและแหล่งพลังงานที่อาจเกิดขึ้น (โดยทั่วไปเรียกว่า การล็อกเอาต์/แท็กเอาต์ "LOTO") จุดนี้ของช่วงเวลาการบำรุงรักษาโดยทั่วไปเป็นขั้นตอนสุดท้ายของการเริ่มต้นการหยุดทำงานก่อนที่จะเริ่มงานจริงในโรงงาน อุปกรณ์ หรือเครื่องจักร การบรรยายสรุปด้านความปลอดภัยควรตามมาหลังจากการดำเนินการ LOTO เสมอ ก่อนที่จะเริ่มงานใดๆ เว้นแต่จะระบุไว้เป็นอย่างอื่น การหยุดทำงานประเภทนี้ถือว่าเสร็จสมบูรณ์เมื่ออุปกรณ์ถึงขั้นตอนการซ่อมแซมทางกลเสร็จสมบูรณ์และพร้อมที่จะหยุดการทำงานชั่วคราวสำหรับอุปกรณ์หมุนขนาดใหญ่หลายชนิด การทดสอบการกระแทกหรือการตรวจสอบการหมุนสำหรับมอเตอร์ ฯลฯ แต่ต้องปฏิบัติตามขั้นตอนการกลับมาทำงานหรือการขออนุญาตทำงานตามขั้นตอน LOTO
การทดสอบออนไลน์ การทดสอบประสิทธิภาพ และการปรับแต่งใดๆ ที่จำเป็น ไม่ควรนับรวมในระยะเวลาการหยุดซ่อมบำรุง เนื่องจากกิจกรรมเหล่านี้มักดำเนินการหลังจากเสร็จสิ้นการหยุดซ่อมบำรุงหรือการบำรุงรักษา และอยู่นอกเหนือการควบคุมของผู้รับเหมาบำรุงรักษาส่วนใหญ่
ลักษณะเฉพาะ
การหยุดทำงานโดยไม่ได้วางแผนไว้ล่วงหน้าอาจเป็นผลมาจากอุปกรณ์ขัดข้อง เป็นต้น
การจำแนกประเภทการหยุดชะงักของระบบโทรคมนาคม
การหยุดทำงานอาจเกิดจากความล้มเหลวของฮาร์ดแวร์ (อุปกรณ์ทางกายภาพ) (อุปกรณ์ควบคุมตรรกะ) อุปกรณ์เชื่อมต่อ (เช่น สายเคเบิล สิ่งอำนวยความสะดวก เราเตอร์...) การส่งสัญญาณ (ไร้สาย ไมโครเวฟ ดาวเทียม) และ/หรือความจุ (ข้อจำกัดของระบบ)
ความล้มเหลวอาจเกิดขึ้นได้เนื่องจากความเสียหาย ความผิดพลาดในการออกแบบ ขั้นตอนการใช้งาน (การใช้งานที่ไม่ถูกต้องโดยมนุษย์) วิศวกรรม (วิธีการใช้งานและการติดตั้ง) การโอเวอร์โหลด (ปริมาณการใช้งานหรือทรัพยากรของระบบเกินขีดจำกัดที่ออกแบบไว้) สภาพแวดล้อม (ระบบสนับสนุน เช่น ระบบไฟฟ้าและระบบปรับอากาศ) (การหยุดทำงานที่ออกแบบไว้ในระบบเพื่อวัตถุประสงค์บางอย่าง เช่น การอัปเกรดซอฟต์แวร์และการเพิ่มขนาดของอุปกรณ์) อื่นๆ (ไม่มีสาเหตุใดๆ ข้างต้นแต่ทราบสาเหตุ) หรือไม่ทราบสาเหตุ
ความล้มเหลวอาจเป็นความรับผิดชอบของลูกค้า/ผู้ให้บริการ ผู้ขาย/ผู้จัดจำหน่าย หน่วยงานสาธารณูปโภค รัฐบาล ผู้รับเหมา ลูกค้าปลายทาง บุคคลทั่วไป ภัยธรรมชาติ อื่นๆ (ไม่ใช่ข้อใดข้อหนึ่งข้างต้นแต่ทราบสาเหตุ) หรือไม่ทราบสาเหตุ
ผลกระทบ
การหยุดชะงักที่เกิดจากความล้มเหลวของระบบอาจส่งผลกระทบอย่างร้ายแรงต่อผู้ใช้ระบบคอมพิวเตอร์/เครือข่าย โดยเฉพาะอย่างยิ่งในอุตสาหกรรมที่ต้องพึ่งพาบริการตลอด 24 ชั่วโมง:
- สารสนเทศทางการแพทย์
- พลังงานนิวเคลียร์และโครงสร้างพื้นฐาน อื่นๆ
- ธนาคารและสถาบันการเงิน อื่นๆ
- การบินและอวกาศสายการบิน
- การรายงานข่าว
- อีคอมเมิร์ซและการประมวลผลธุรกรรมออนไลน์
- เกมออนไลน์ที่เล่นต่อเนื่อง
ผู้ใช้บริการอินเทอร์เน็ต (ISP)และลูกค้าอื่นๆ ของเครือข่ายโทรคมนาคม ก็อาจได้รับผลกระทบเช่นกัน
บริษัทต่างๆ อาจสูญเสียธุรกิจเนื่องจากเครือข่ายขัดข้อง หรืออาจผิดสัญญา ส่งผลให้เกิดความสูญเสียทางการเงิน จาก รายงานการจัดการข้อมูลบนคลาวด์ของ Veeamปี 2019 พบว่าองค์กรต่างๆ ประสบกับปัญหาการหยุดทำงานโดยไม่ได้วางแผนไว้ โดยเฉลี่ย 5-10 ครั้งต่อปี โดยมีค่าใช้จ่ายเฉลี่ยต่อการหยุดทำงานหนึ่งชั่วโมงอยู่ที่ 102,450 ดอลลาร์สหรัฐ[ 1 ]ค่าใช้จ่ายจริงแตกต่างกันอย่างมากในแต่ละอุตสาหกรรม บริษัทด้านบริการทางการเงินอาจสูญเสีย 500,000 ถึงมากกว่า 1 ล้านดอลลาร์สหรัฐต่อชั่วโมงเนื่องจากธุรกรรมล้มเหลวและความเสี่ยงด้านกฎระเบียบ เว็บไซต์อีคอมเมิร์ซขององค์กรอาจสูญเสีย 100,000–500,000 ดอลลาร์สหรัฐจากยอดขายที่หายไปและตะกร้าสินค้าที่ถูกทิ้งร้าง และ บริษัท SaaS ขนาดกลางอาจสูญเสีย 10,000–100,000 ดอลลาร์ สหรัฐจาก เครดิต SLAและการเลิกใช้บริการ ของลูกค้า [ 2 ]
บุคคลหรือองค์กรที่ได้รับผลกระทบจากปัญหาระบบล่ม อาจมีความอ่อนไหวต่อประเด็นเฉพาะด้านมากกว่ากลุ่มอื่น:
- บางคนได้รับผลกระทบจากระยะเวลาที่ระบบล่มมากกว่าคนอื่น เพราะระยะเวลาที่ใช้ในการแก้ไขปัญหาเป็นเรื่องสำคัญสำหรับพวกเขา
- บางคนอ่อนไหวต่อช่วงเวลาที่ไฟฟ้าดับ โดยเฉพาะช่วงเวลาที่ไฟฟ้าดับในช่วงเวลาที่มีผู้ใช้ไฟฟ้ามากที่สุด
ผู้ใช้งานที่ต้องการประสิทธิภาพสูงที่สุดคือผู้ใช้งานที่ต้องการ ความพร้อมใช้งาน ใน ระดับสูง
เหตุการณ์ไฟฟ้าดับครั้งสำคัญ
ในวันแม่วันอาทิตย์ที่ 8 พฤษภาคม พ.ศ. 2531 เกิดเพลิงไหม้ในห้องสวิตช์หลักของสำนักงานกลางฮินส์เดลของ บริษัทโทรศัพท์ อิลลินอยส์เบล ล์ ซึ่งเป็นหนึ่งใน ระบบ สวิตช์ ที่ใหญ่ที่สุด ในรัฐ โดยสิ่งอำนวยความสะดวกนี้ประมวลผลการโทรมากกว่า 3.5 ล้านสายต่อวัน ขณะที่ให้บริการลูกค้า 38,000 ราย รวมถึงธุรกิจ โรงพยาบาล และสนามบินโอแฮร์และมิดเวย์ของชิคาโก[ 3 ]
สวิตช์เครือข่าย 4ESS toll tandem ของAT&Tเกือบทั้งหมดเกิดการขัดข้องและใช้งานได้สลับกันไปมาซ้ำแล้วซ้ำเล่าในวันที่ 15 มกราคม พ.ศ. 2533 ทำให้บริการโทรทางไกลทั่วสหรัฐอเมริกาหยุดชะงัก ปัญหาดังกล่าวคลี่คลายลงเองเมื่อปริมาณการใช้งานลดลง พบว่ามีข้อบกพร่องของซอฟต์แวร์[ 4 ]
AT&T สูญเสีย เครือข่าย Frame Relayเป็นเวลา 26 ชั่วโมงในวันที่ 13 เมษายน พ.ศ. 2541 [ 5 ]เหตุการณ์นี้ส่งผลกระทบต่อลูกค้าหลายพันราย และธุรกรรมธนาคารก็ได้รับผลกระทบเช่นกัน AT&T ไม่สามารถปฏิบัติตามข้อตกลงระดับบริการตามสัญญาที่ทำกับลูกค้าได้ และต้องคืนเงิน[ 6 ]บัญชีลูกค้า 6,600 บัญชี ทำให้สูญเสียเงินไปหลายล้านดอลลาร์
Xbox Liveประสบปัญหาขัดข้องเป็นระยะในช่วงเทศกาลวันหยุดปี 2550–2551 ซึ่งกินเวลานานถึงสิบสามวัน[ 7 ]ความต้องการที่เพิ่มขึ้นจากผู้ซื้อ Xbox 360 (จำนวนผู้สมัครใช้งานใหม่มากที่สุดในประวัติศาสตร์ของ Xbox Live) ถูกระบุว่าเป็นสาเหตุของการขัดข้อง เพื่อเป็นการชดเชยปัญหาด้านบริการ ไมโครซอฟต์จึงเสนอโอกาสให้ผู้ใช้ได้รับเกมฟรี[ 8 ]
การหยุดชะงักของ PlayStation NetworkของSony ในเดือนเมษายน 2011 เริ่มขึ้นในวันที่ 20 เมษายน 2011 และค่อยๆ กู้คืนได้ในวันที่ 14 พฤษภาคม 2011 โดยเริ่มจากในสหรัฐอเมริกาการหยุดชะงักครั้งนี้เป็นช่วงเวลาที่ยาวนานที่สุดที่ PSN ออฟไลน์นับตั้งแต่เริ่มก่อตั้งในปี 2006 Sony ระบุว่าปัญหาเกิดจากการบุกรุกจากภายนอกซึ่งส่งผลให้ข้อมูลส่วนบุคคลถูกขโมย Sony รายงานเมื่อวันที่ 26 เมษายน 2011 ว่าข้อมูลผู้ใช้จำนวนมากถูกแฮ็กโดยแฮ็กเดียวกันกับที่ทำให้เกิดการหยุดชะงัก[ 9 ]
สถานีจ่ายไฟ Ryde ของ Telstraเกิดความเสียหายในช่วงปลายปี 2011 หลังจากน้ำรั่วเข้าไปในแผงสวิตช์ไฟฟ้าเนื่องจากสภาพอากาศเปียกชื้นต่อเนื่อง สถานีจ่ายไฟ Ryde เป็นหนึ่งในสถานีจ่ายไฟที่มีขนาดใหญ่ที่สุดในออสเตรเลีย และส่งผลกระทบต่อบริการมากกว่า 720,000 ราย
ศูนย์ ข้อมูล ไมอามีของ ServerAxis หยุดทำงานโดยไม่ได้แจ้งล่วงหน้าเมื่อวันที่ 29 กุมภาพันธ์ 2559 และไม่ได้รับการกู้คืนอีกเลย ส่งผลกระทบต่อผู้ให้บริการหลายรายและเว็บไซต์หลายร้อยแห่ง การหยุดชะงักนี้ส่งผลกระทบต่อการรายงานข่าวการแข่งขันบาสเกตบอลหญิง NCAA Division I ปี 2559เนื่องจาก WBBState ซึ่งเป็นหนึ่งในเว็บไซต์ที่ได้รับผลกระทบ เป็นผู้ให้บริการสถิติบาสเกตบอลหญิงที่ครอบคลุมมากที่สุด[ 10 ]
แพลตฟอร์มเกมRobloxเกิดปัญหาขัดข้องในช่วงประมาณเดือนตุลาคม 2021 ระหว่าง กิจกรรม Chipotleผู้ใช้หลายคนคิดว่าเป็นเพราะกิจกรรมดังกล่าว เนื่องจากได้รับการตอบรับอย่างล้นหลาม เพราะผู้ใช้สามารถรับเบอร์ริโต Chipotle ฟรีได้ในช่วงกิจกรรมนั้น เหตุการณ์ขัดข้องครั้งนี้ถือเป็นการหยุดทำงานที่ยาวนานที่สุดของ Roblox โดยกินเวลานานถึง 3 วัน[ 11 ] [ 12 ] [ 13 ]
เมื่อวันที่ 8 กรกฎาคม 2565 บริษัท Rogers ประสบปัญหาไฟฟ้าดับครั้งใหญ่ทั่วประเทศแคนาดาซึ่งส่งผลกระทบต่อการใช้งานโทรศัพท์มือถือและอินเทอร์เน็ตพร้อมกัน ทำให้การโทรแจ้งเหตุฉุกเฉิน 911 การทำธุรกรรมระหว่างธนาคารล้มเหลว และยังรบกวนบริการของภาครัฐอีกด้วย
เมื่อวันที่ 19 กรกฎาคม 2567 CrowdStrikeได้ออกอัปเดตไดรเวอร์อุปกรณ์ที่ผิดพลาดสำหรับซอฟต์แวร์ Falcon ส่งผลให้พีซี Windows เซิร์ฟเวอร์ และเครื่องเสมือนเกิดการขัดข้องและวนลูปการบูต เหตุการณ์นี้ส่งผลกระทบโดยไม่ได้ตั้งใจต่อ เครื่อง Windows ประมาณ 8.5 ล้าน เครื่องทั่วโลก รวมถึงโครงสร้างพื้นฐานที่สำคัญ เช่น บริการ 911 ในหลายรัฐ ถือเป็นเหตุการณ์ขัดข้องครั้งใหญ่ที่สุดในประวัติศาสตร์ของเทคโนโลยีสารสนเทศ[ 14 ] [ 15 ]
ระดับการบริการ
ในข้อตกลงระดับการให้บริการ (Service Level Agreementหรือ SLA) มักจะมีการระบุค่าเป็นเปอร์เซ็นต์ (ต่อเดือนหรือต่อปี) ซึ่งคำนวณโดยการหารผลรวมของช่วงเวลาที่เซิร์ฟเวอร์หยุดทำงานทั้งหมดด้วยระยะเวลาทั้งหมดของช่วงเวลาอ้างอิง (เช่น หนึ่งเดือน) 0% ของเวลาที่เซิร์ฟเวอร์หยุดทำงานหมายความว่าเซิร์ฟเวอร์พร้อมใช้งานตลอดเวลา
สำหรับเซิร์ฟเวอร์อินเทอร์เน็ต การหยุดทำงานเกิน 1% ต่อปีหรือแย่กว่านั้นถือว่ายอมรับไม่ได้ เนื่องจากหมายถึงการหยุดทำงานมากกว่า 3 วันต่อปี สำหรับอีคอมเมิร์ซและการใช้งานในอุตสาหกรรมอื่นๆ ค่าใดๆ ที่สูงกว่า 0.1% มักจะถือว่ายอมรับไม่ได้[ 16 ]
การตอบสนองและการลดผลกระทบ
หน้าที่ของผู้ออกแบบเครือข่ายคือการทำให้แน่ใจว่าเครือข่ายจะไม่ล่ม เมื่อเกิดเหตุการณ์ดังกล่าวขึ้น ระบบที่ออกแบบมาอย่างดีจะช่วยลดผลกระทบจากการล่มของระบบลงได้อีก โดยการจำกัดการล่มของระบบให้อยู่ในบริเวณเฉพาะที่ ซึ่งสามารถตรวจจับและแก้ไขได้โดยเร็วที่สุด
จำเป็นต้องมีกระบวนการในการตรวจจับความผิดปกติ – การตรวจสอบเครือข่าย – และการกู้คืนเครือข่ายให้กลับมาใช้งานได้ – ซึ่งโดยทั่วไปแล้วจะเกี่ยวข้องกับ ทีม ช่วยเหลือด้าน เทคนิค ที่สามารถแก้ไขปัญหาได้ โดยทีมนี้ประกอบด้วยวิศวกรที่ได้รับการฝึกอบรม ทีมช่วยเหลือด้านเทคนิคแยกต่างหากมักจำเป็นเพื่อรับข้อเสนอแนะจากผู้ใช้ ซึ่งอาจมีความต้องการสูงเป็นพิเศษในช่วงเวลาที่เครือข่ายขัดข้อง
ระบบ บริหารจัดการเครือข่ายสามารถใช้ตรวจจับส่วนประกอบที่ชำรุดหรือเสื่อมสภาพก่อนที่ลูกค้าจะร้องเรียน และสามารถแก้ไขปัญหาได้อย่างทันท่วงที
เทคนิค การบริหารความเสี่ยงสามารถนำมาใช้เพื่อประเมินผลกระทบของการหยุดชะงักของเครือข่ายต่อองค์กร และพิจารณาว่าต้องดำเนินการใดบ้างเพื่อลดความเสี่ยง ความเสี่ยงอาจลดลงได้โดยการใช้ส่วนประกอบที่เชื่อถือได้ การบำรุงรักษา เช่น การอัปเกรด การใช้ระบบสำรองหรือการมีแผนฉุกเฉินหรือแผนความต่อเนื่องทางธุรกิจ วิธีการทางเทคนิคสามารถลดข้อผิดพลาดได้ด้วยรหัสแก้ไขข้อผิดพลาดการส่งซ้ำการตรวจสอบผลรวมหรือ แผนการกระจายความเสี่ยง
สาเหตุสำคัญประการหนึ่งของการหยุดทำงานคือการกำหนดค่าผิดพลาด ซึ่งการเปลี่ยนแปลงที่วางแผนไว้เกิดผิดพลาด โดยทั่วไปองค์กรต่างๆ อาศัยความพยายามด้วยตนเองในการจัดการกระบวนการสำรองข้อมูลการกำหนดค่า แต่สิ่งนี้ต้องการวิศวกรที่มีทักษะสูงและมีเวลาในการจัดการกระบวนการดังกล่าวในเครือข่ายที่มีผู้จำหน่ายหลายราย มีเครื่องมืออัตโนมัติสำหรับการจัดการการสำรองข้อมูล แต่มีโซลูชันน้อยมากที่สามารถจัดการการกู้คืนการกำหนดค่า ซึ่งจำเป็นต่อการลดผลกระทบโดยรวมของการหยุดทำงาน[ 17 ]
การวางแผน
การหยุดให้บริการตามแผนเป็นผลมาจากการดำเนินการตามแผนโดยเจ้าของระบบและ/หรือผู้ให้บริการการหยุดให้บริการเหล่านี้มักกำหนดไว้ในช่วงเวลาการบำรุงรักษาและสามารถใช้เพื่อดำเนินการต่างๆ ซึ่งรวมถึงสิ่งต่อไปนี้:
- การบำรุงรักษาที่เลื่อนออกไป เช่น การซ่อมแซมฮาร์ดแวร์ที่เลื่อนออกไป หรือการรีสตาร์ทที่เลื่อนออกไปเพื่อล้างหน่วยความจำที่เสียหาย
- การวินิจฉัยเพื่อแยกแยะความผิดพลาดที่ตรวจพบ
- การซ่อมแซมความผิดพลาดของฮาร์ดแวร์
- แก้ไขข้อผิดพลาดหรือการละเว้นในฐานข้อมูลการกำหนดค่า หรือการละเว้นในการเปลี่ยนแปลงฐานข้อมูลการกำหนดค่าล่าสุด
- แก้ไขข้อผิดพลาดในฐานข้อมูลแอปพลิเคชัน หรือข้อผิดพลาดในการเปลี่ยนแปลงฐานข้อมูลแอปพลิเคชันล่าสุด
- การแก้ไขข้อบกพร่องของซอฟต์แวร์/การอัปเดตซอฟต์แวร์เพื่อแก้ไขข้อผิดพลาดของซอฟต์แวร์
นอกจากนี้ ยังสามารถวางแผนการตัดกระแสไฟฟ้าล่วงหน้าได้ อันเนื่องมาจากเหตุการณ์ทางธรรมชาติที่คาดการณ์ได้ เช่นภัยแล้งจากดวงอาทิตย์
ในอุตสาหกรรมที่ต้องพึ่งพาระบบคอมพิวเตอร์ จำเป็นต้องวางแผนการหยุดทำงานเพื่อบำรุงรักษาอย่างรอบคอบ ในหลายกรณี สามารถหลีกเลี่ยงการหยุดทำงานของระบบทั้งหมดได้โดยใช้สิ่งที่เรียกว่า "การอัปเกรดแบบค่อยเป็นค่อยไป" (rolling upgrade) ซึ่งเป็นกระบวนการค่อยๆ ปิดระบบบางส่วนเพื่ออัปเกรด โดยไม่ส่งผลกระทบต่อการทำงานโดยรวมของระบบ
การหลีกเลี่ยง
เว็บไซต์ส่วนใหญ่ มี บริการตรวจสอบเว็บไซต์การตรวจสอบเว็บไซต์ (แบบจำลองหรือแบบแฝง) คือบริการที่ "ตรวจสอบ" เวลาที่เว็บไซต์หยุดทำงานและจำนวนผู้ใช้งานบนเว็บไซต์นั้น
การใช้งานอื่นๆ
เวลาหยุดทำงาน (Downtime) ยังหมายถึงเวลาที่ทรัพยากรบุคคลหรือสินทรัพย์อื่นๆ หยุดทำงาน ตัวอย่างเช่น หากพนักงานติดประชุมหรือไม่สามารถทำงานได้เนื่องจากข้อจำกัดอื่นๆ ก็ถือว่าเวลาหยุดทำงาน ซึ่งอาจมีค่าใช้จ่ายสูงเช่นกัน และอาจเป็นผลมาจากการที่สินทรัพย์อื่นๆ (เช่น คอมพิวเตอร์/ระบบ) หยุดทำงานด้วยเช่นกัน โดยทั่วไปแล้วเวลาหยุดทำงานนี้เรียกว่า " เวลาสูญเปล่า " (Dead time)
เวลาว่างยังมีความหมายทั่วไปในแง่ส่วนบุคคล โดยใช้เพื่ออ้างถึงช่วงเวลาของการนอนหลับหรือการพักผ่อน[ 18 ] [ 19 ] [ 20 ]
คำนี้ยังใช้ในโรงงานหรือในอุตสาหกรรมด้วย ดูได้จากการบำรุงรักษาเชิงผลิตภาพโดยรวม (Total Productive Maintenance หรือ TPM)
การวัดเวลาหยุดทำงาน
มีบริการภายนอกมากมายที่สามารถใช้ตรวจสอบเวลาการทำงานและเวลาหยุดทำงาน รวมถึงความพร้อมใช้งานของบริการหรือโฮสต์ได้
ตัวอย่างที่น่าสนใจคือDowndetector ซึ่งเป็น เว็บไซต์ออนไลน์ที่Ookla เป็นเจ้าของ โดยจะติดตามเวลาหยุดทำงานปกติและการหยุดทำงานครั้งใหญ่ด้วยรายงานการหยุดทำงานของผู้ใช้ในเว็บไซต์ ซึ่งรวมถึงหน้าสำหรับแต่ละเว็บไซต์บน Downdetector เองและ Twitter ด้วย[ 21 ] ปัจจุบันมีให้บริการใน 45 ประเทศ (โดยมีเว็บไซต์ที่แตกต่างกันในแต่ละประเทศ) และติดตามบริการ 12,000 รายการทั่วโลก[ 22 ] [ 23 ]
ดูเพิ่มเติม
ลิงก์ภายนอก
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ เวลาหยุดทำงาน
ในด้านคอมพิวเตอร์และโทรคมนาคม ช่วงเวลาที่ ระบบ หยุดทำงาน ( หรือ ที่เรียกกันทั่วไปว่า การหยุดชะงักของระบบ ) คือช่วงเวลาที่ระบบไม่สามารถใช้งานได้ ความไม่สามารถใช้งานได้ นี้...
ประเภท
มาตรฐานอุตสาหกรรมสำหรับคำว่า "ระยะเวลาหยุดซ่อมบำรุง" หรือ "ระยะเวลาการบำรุงรักษา" อาจมีจุดเริ่มต้นและจุดสิ้นสุดที่แตกต่างกัน ดังนั้นจึงควรใช้คำชี้แจงต่อไปนี้เพื่อหลีกเลี่ยงความขัดแย้งในการดำเนินการตามสัญญา:
ลักษณะเฉพาะ
การหยุดทำงานโดยไม่ได้วางแผนไว้ล่วงหน้าอาจเป็นผลมาจากอุปกรณ์ขัดข้อง เป็นต้น
การจำแนกประเภทการหยุดชะงักของระบบโทรคมนาคม
การหยุดทำงานอาจเกิดจากความล้มเหลวของฮาร์ดแวร์ (อุปกรณ์ทางกายภาพ) (อุปกรณ์ควบคุมตรรกะ) อุปกรณ์เชื่อมต่อ (เช่น สายเคเบิล สิ่งอำนวยความสะดวก เราเตอร์...) การส่งสัญญาณ (ไร้สาย ไมโครเวฟ ดาวเทียม) และ/หรือความจุ (ข้อจำกัดของระบบ)