5 Dấu hiệu cảnh báo về sự cố thiết bị quan trọng

Tác Giả: Judy Howell
Ngày Sáng TạO: 25 Tháng BảY 2021
CậP NhậT Ngày Tháng: 23 Tháng Sáu 2024
Anonim
5 Dấu hiệu cảnh báo về sự cố thiết bị quan trọng - Công Nghệ
5 Dấu hiệu cảnh báo về sự cố thiết bị quan trọng - Công Nghệ

NộI Dung


Lấy đi:

Giảm thời gian chết thông qua kế hoạch trước tỉ mỉ có thể có nghĩa là sự khác biệt giữa tăng trưởng và suy giảm kinh doanh. Đó là thời gian có nghĩa là giữa thất bại đến.

Đừng đánh giá thấp bao nhiêu công ty ngày nay dựa vào các hệ thống quan trọng mỗi ngày. Đó là lý do tại sao ý nghĩa chung duy nhất của nó là một doanh nghiệp có thể đánh giá rủi ro hỏng hóc thiết bị. Không đảm bảo khi nào một thiết bị có thể hỏng, ít nhất phải có ước tính chính xác về thời điểm thiết bị không còn được coi là đáng tin cậy nữa.

Một thiết bị vô hình khác có vẻ không quan trọng đối với doanh nghiệp, nhưng khi một quạt làm mát bị hỏng, khiến máy phát điện từ bỏ bóng ma và gây ra hàng chục hoặc thậm chí hàng trăm ngàn người dùng gặp sự cố tốn kém trong thời gian dài, bạn có thể thấy rằng việc có thể ước tính thành phần nào trong cơ sở hạ tầng của bạn có thể thất bại - và khi nào - là điều tối quan trọng. Đó là nơi mà thời gian trung bình giữa các lần thất bại (MTBF) xuất hiện, phương pháp mà các chuyên gia CNTT dựa vào để đưa ra chính xác ước tính về khi thiết bị quan trọng sẽ thất bại. Ở đây chúng ta hãy xem những gì cuối cùng giết chết một số loại thiết bị quan trọng phổ biến, và làm thế nào MTBF có thể giúp tiết kiệm trong ngày.


MTBF là gì?

Mỗi phần của thiết bị CNTT được sản xuất được gán một số kiểu duy nhất. Những người đóng một số phần trong cơ sở hạ tầng quan trọng được cung cấp cho khách hàng với ước tính MTBF. Các tính toán phức tạp để tìm ra MTBF cho một thiết bị diễn ra trong giai đoạn thử nghiệm kéo dài trong một nghiên cứu và phát triển sản phẩm và tương đối cụ thể cho một mô hình cụ thể.

Nếu bạn đang tìm kiếm MTBF cho một thiết bị cụ thể, bạn sẽ tìm thấy nó trong bảng thông số kỹ thuật chi tiết được cung cấp bởi nhà sản xuất. Bạn cũng có thể liên hệ trực tiếp với nhà sản xuất.

định tuyến

Một bộ định tuyến cấp doanh nghiệp bao gồm nhiều bộ phận, một số di chuyển và một số khác tĩnh. Các đơn vị cung cấp điện (PSU) và quạt làm mát đều có các bộ phận chuyển động và các bộ phận của nó có xu hướng bị hỏng, đặc biệt là nếu thiết bị không được đặt trong một trung tâm dữ liệu tương đối không có bụi. Rất may, với một số đầu vào của quản trị viên, hầu hết các bộ định tuyến sẽ báo cáo cho Nhật ký hệ thống cơ sở, để bất kỳ thành phần thất bại có thể được gắn cờ.


Công tắc

Cùng một tĩnh mạch tương tự, cấp độ tiếp theo trong mạng doanh nghiệp là phần cứng chuyển mạch. Mặc dù các thiết bị chuyển mạch cấp doanh nghiệp cũng có xu hướng phụ thuộc vào quạt, nhưng thường có ít hơn so với các thiết bị chuyển mạch được tìm thấy trong khung bộ định tuyến. Nếu các cơ chế quay vòng của quạt vẫn còn nguyên vẹn, thì một công tắc bị lỗi thường sẽ hoạt động sai ở cấp phần mềm, bằng cách vô hiệu hóa cổng chuyển đổi bất ngờ hoặc, thông thường hơn, biểu hiện hành vi bất thường như làm rơi gói, gây ra sự gián đoạn lưu lượng khác nhau hoặc thay đổi không chính xác cài đặt do người dùng xác định mà không được yêu cầu làm như vậy.

Thiết bị kết nối mạng Cisco quảng cáo một trong các bộ định tuyến của mình là có MTBF là 188,574 giờ cho mẫu Cisco Catalyst 3750G-24TS. Nếu chúng ta chia số đó cho 8,765.81277 (số giờ trong một năm) thì chúng ta sẽ thấy rằng mô hình này có ước tính MTBF khoảng 21,5 năm. Con số đó là một số đảm bảo khi bạn cho rằng thiết bị này cần hoạt động tốt 24/7 mà không có lỗi, mặc dù trong thực tế, nó chỉ đơn giản là một dấu hiệu về độ tin cậy của nó. Mặc dù vậy, nó cung cấp cho người dùng một phỏng đoán có giáo dục về việc thiết bị đó có thể được sử dụng trong bao lâu.

Sức mạnh đàn hồi

Nguồn cung cấp điện liên tục (UPS) được nối với một số lượng lớn pin có thể cung cấp năng lượng dự phòng trong doanh nghiệp trong thời gian ngắn trước khi máy phát điện quay trong thời gian mất điện. Một số lỗi phần mềm cụ thể có thể xảy ra trong một UPS, như với bất kỳ thiết bị nào, nhưng nói chung, pin mà chúng sử dụng năng lượng thường sẽ gây lo ngại nhất. Nếu pin UPS thường xuyên bị tắt và sạc lại, công suất của nó sẽ giảm nhanh hơn và thời gian hoạt động của nó sẽ rút ngắn đáng kể. Không có gì đáng ngạc nhiên, cũng có thể khiến pin UPS bị hỏng hoàn toàn. Một UPS có thể báo cáo qua modem và mạng khi lỗi phát triển, nhưng thường xuyên hơn không, các UPS cũ hơn sẽ kích hoạt báo động âm thanh khi có sự cố phát sinh.

Không lỗi, không căng thẳng - Hướng dẫn từng bước của bạn để tạo ra phần mềm thay đổi cuộc sống mà không phá hủy cuộc sống của bạn

Bạn không thể cải thiện kỹ năng lập trình của mình khi không ai quan tâm đến chất lượng phần mềm.

Bảo vệ lưu trữ

Các đĩa cứng chúng ta sử dụng ngày nay và dựa vào mức độ cao như vậy đã trở nên đáng tin cậy hơn đáng kể trong thập kỷ qua hoặc lâu hơn. Tuy nhiên, chúng không thể sai được và tùy thuộc vào nghiên cứu nào bạn có thể tin, chúng dường như hoạt động chính xác trong một thời gian dài hơn tùy thuộc vào một số yếu tố. (Một ý kiến ​​tuyệt vời về điều này có thể được tìm thấy ở đây trên The Remarketer.) Nếu báo cáo chi tiết được bật và ổ đĩa đang cung cấp phản hồi về lỗi, thì các thành phần bị hỏng và lỗi đọc / ghi là chìa khóa để phát hiện ra khi một đĩa trong một mảng lưu trữ Đang thất bại. Một vấn đề phổ biến khác trong các máy chủ sử dụng một số đĩa được kết nối với bộ điều khiển RAID là bản thân bộ điều khiển sẽ bị lỗi. Thật không may, đôi khi các đĩa cứng chỉ đơn giản dừng hoạt động mà không có bất kỳ cảnh báo nào, một vấn đề khó bảo vệ chống lại.

May chủ

Ngoài các ổ đĩa được tích hợp trong máy chủ và các bộ phận chuyển động, chẳng hạn như quạt làm mát và PSU đã nói ở trên, một số vấn đề cũng có thể phát sinh trong các thành phần phần cứng của máy chủ. Báo cáo ở cấp phần mềm (thường đề cập đến BIOS hoặc chẩn đoán thành phần phần cứng cấp thấp khác) là chìa khóa để phát hiện khi mọi thứ không thành công hoặc quan trọng hơn là có dấu hiệu bị lỗi. Một vấn đề có thể không rõ ràng ngay lập tức là ảnh hưởng đến bo mạch chủ. Nó có ý nghĩa hoàn hảo rằng máy móc không thích quá nhiều nhiệt. Nhưng ngay cả ngày nay, nếu một bảng mạch hiện đại bị mất nhiệt nhanh chóng - hoặc chuyển từ chạy rất nóng sang đột nhiên trở nên lạnh - các vết nứt có thể xuất hiện, khiến bảng bị hỏng nghiêm trọng. Đây là một vấn đề cần lưu ý, đặc biệt nếu bạn di chuyển thiết bị giữa các tòa nhà trong khung thời gian bảo trì không thể tha thứ.

MTBF: Nó cũng có thể thất bại

Cũng hữu ích như dự đoán của MTBF là rất quan trọng để tính toán mức độ rủi ro chấp nhận được với bất kỳ thiết bị nào mà doanh nghiệp phải dựa vào. Thật không may, ngay cả với tất cả các đảm bảo thống kê được cung cấp bởi các nhà sản xuất, cách cụ thể duy nhất để đảm bảo tính khả dụng của thiết bị chạy các hệ thống quan trọng là nhân đôi nó để cho phép chuyển đổi thời gian chờ.

Mỗi và mọi phần cứng riêng lẻ được sử dụng trong doanh nghiệp được tạo thành từ nhiều thành phần khác nhau, do đó, MTBF thực sự khác xa với một tính toán tầm thường. Rõ ràng, điều quan trọng không phải là đặt tương lai của doanh nghiệp vào các phép đo khả năng này mà thay vào đó sử dụng chúng như một thước đo để đưa ra quyết định sáng suốt liên quan đến quy trình tiếp tục kinh doanh và khắc phục thảm họa. Rốt cuộc, giảm thời gian chết thông qua kế hoạch trước tỉ mỉ có thể có nghĩa là sự khác biệt giữa một doanh nghiệp thành công và thất bại kinh doanh.