Hệ thống tệp của Google (GFS)

Tác Giả: Robert Simon
Ngày Sáng TạO: 15 Tháng Sáu 2021
CậP NhậT Ngày Tháng: 1 Tháng BảY 2024
Anonim
Google File System
Băng Hình: Google File System

NộI Dung

Định nghĩa - Hệ thống tệp của Google (GFS) có nghĩa là gì?

Google File System (GFS) là một hệ thống tệp phân tán có thể mở rộng (DFS) được tạo bởi Google Inc. và được phát triển để đáp ứng các yêu cầu xử lý dữ liệu mở rộng của Google. GFS cung cấp khả năng chịu lỗi, độ tin cậy, khả năng mở rộng, tính khả dụng và hiệu suất cho các mạng lớn và các nút được kết nối. GFS được tạo thành từ một số hệ thống lưu trữ được xây dựng từ các thành phần phần cứng hàng hóa chi phí thấp. Nó được tối ưu hóa để đáp ứng nhu cầu lưu trữ và sử dụng dữ liệu khác nhau của Google, như công cụ tìm kiếm của nó, tạo ra lượng dữ liệu khổng lồ phải được lưu trữ.


Hệ thống tệp của Google tận dụng sức mạnh của các máy chủ sẵn có trong khi giảm thiểu các điểm yếu về phần cứng.

GFS còn được gọi là GoogleFS.

Giới thiệu về Microsoft Azure và Microsoft Cloud | Trong suốt hướng dẫn này, bạn sẽ tìm hiểu về điện toán đám mây là gì và Microsoft Azure có thể giúp bạn di chuyển và điều hành doanh nghiệp của bạn từ đám mây như thế nào.

Techopedia giải thích Hệ thống tệp của Google (GFS)

Cụm nút GFS là một bản gốc duy nhất có nhiều máy chủ khối được liên tục truy cập bởi các hệ thống máy khách khác nhau. Máy chủ Chunk lưu trữ dữ liệu dưới dạng tệp Linux trên đĩa cục bộ. Dữ liệu được lưu trữ được chia thành các khối lớn (64 MB), được sao chép trong mạng tối thiểu ba lần. Kích thước khối lớn làm giảm chi phí mạng.


GFS được thiết kế để đáp ứng các yêu cầu cụm lớn của Google mà không gây ra các ứng dụng nặng nề. Các tệp được lưu trữ trong các thư mục phân cấp được xác định bởi tên đường dẫn. Siêu dữ liệu - chẳng hạn như không gian tên, dữ liệu kiểm soát truy cập và thông tin ánh xạ - được điều khiển bởi chủ, tương tác và theo dõi các cập nhật trạng thái của từng máy chủ chunk thông qua nhịp tim theo thời gian.

Các tính năng của GFS bao gồm:

  • Chịu lỗi
  • Sao chép dữ liệu quan trọng
  • Phục hồi dữ liệu tự động và hiệu quả
  • Thông lượng tổng hợp cao
  • Giảm tương tác giữa máy khách và chủ vì kích thước máy chủ lớn
  • Quản lý không gian tên và khóa
  • Tính sẵn sàng cao

Các cụm GFS lớn nhất có hơn 1.000 nút với dung lượng lưu trữ đĩa 300 TB. Điều này có thể được truy cập bởi hàng trăm khách hàng trên cơ sở liên tục.