Kafka Apache

Tác Giả: Louise Ward
Ngày Sáng TạO: 5 Tháng 2 2021
CậP NhậT Ngày Tháng: 28 Tháng Sáu 2024
Anonim
Введение в Apache Kafka, первая тема открытого базового курса
Băng Hình: Введение в Apache Kafka, первая тема открытого базового курса

NộI Dung

Định nghĩa - Apache Kafka có nghĩa là gì?

Apache Kafka là một hệ thống đăng ký xuất bản nguồn mở được thiết kế để cung cấp xử lý nhanh chóng, có thể mở rộng và xử lý lỗi đối với các nguồn cấp dữ liệu thời gian thực. Không giống như phần mềm nhắn tin doanh nghiệp truyền thống, Kafka có thể xử lý tất cả dữ liệu chảy qua một công ty và thực hiện nó trong thời gian thực gần.


Kafka được viết bằng Scala và ban đầu được phát triển bởi LinkedIn. Kể từ thời điểm đó, một số công ty đã sử dụng nó để xây dựng các nền tảng thời gian thực.

Giới thiệu về Microsoft Azure và Microsoft Cloud | Trong suốt hướng dẫn này, bạn sẽ tìm hiểu về điện toán đám mây là gì và Microsoft Azure có thể giúp bạn di chuyển và điều hành doanh nghiệp của bạn từ đám mây như thế nào.

Techopedia giải thích Apache Kafka

Kafka có nhiều điểm tương đồng với nhật ký giao dịch và nó duy trì nguồn cấp dữ liệu của các chủ đề. Các nhà sản xuất viết dữ liệu cho các chủ đề và người tiêu dùng đọc từ các chủ đề đó, được phân vùng và nhân rộng trên nhiều nút theo định dạng hệ thống phân tán. Kafka là duy nhất ở chỗ nó coi mỗi phân vùng chủ đề là một bản ghi và mỗi phân vùng được gán một phần bù duy nhất. Nó giữ lại tất cả s trong một khoảng thời gian nhất định và người tiêu dùng có trách nhiệm theo dõi vị trí của họ trong mỗi bản ghi. Điều này khác với các hệ thống trước đây, nơi các nhà môi giới chịu trách nhiệm theo dõi này, điều này đã hạn chế nghiêm trọng khả năng mở rộng hệ thống khi số lượng người tiêu dùng tăng lên. Cấu trúc này cho phép Kafka hỗ trợ nhiều người tiêu dùng và giữ lại một lượng lớn dữ liệu với chi phí rất thấp.


Kafka có thể được sử dụng:

  • Là một nhà môi giới truyền thống
  • Để theo dõi hoạt động của trang web
  • Để tổng hợp nhật ký
  • Để xử lý luồng dữ liệu lớn

Kafka có thể được sử dụng cùng với Apache Storm, Apache HBase và Apache Spark để phân tích thời gian thực và hiển thị dữ liệu phát trực tuyến.