Phân tích thành phần chính (PCA)

Tác Giả: Roger Morrison
Ngày Sáng TạO: 22 Tháng Chín 2021
CậP NhậT Ngày Tháng: 19 Tháng Sáu 2024
Anonim
Phân tích thành phần chính (PCA) - Công Nghệ
Phân tích thành phần chính (PCA) - Công Nghệ

NộI Dung

Định nghĩa - Phân tích thành phần chính (PCA) có nghĩa là gì?

Phân tích thành phần chính (PCA) là một kỹ thuật được sử dụng để xác định một số lượng nhỏ hơn các biến không tương quan được gọi là các thành phần chính từ một tập hợp dữ liệu lớn hơn. Kỹ thuật này được sử dụng rộng rãi để nhấn mạnh sự thay đổi và nắm bắt các mẫu mạnh trong một tập dữ liệu. Được phát minh bởi Karl Pearson vào năm 1901, phân tích thành phần chính là một công cụ được sử dụng trong các mô hình dự đoán và phân tích dữ liệu thăm dò. Phân tích thành phần chính được coi là một phương pháp thống kê hữu ích và được sử dụng trong các lĩnh vực như nén hình ảnh, nhận diện khuôn mặt, khoa học thần kinh và đồ họa máy tính.


Giới thiệu về Microsoft Azure và Microsoft Cloud | Trong suốt hướng dẫn này, bạn sẽ tìm hiểu về điện toán đám mây là gì và Microsoft Azure có thể giúp bạn di chuyển và điều hành doanh nghiệp của bạn từ đám mây như thế nào.

Techopedia giải thích Phân tích thành phần chính (PCA)

Phân tích thành phần chính giúp làm cho dữ liệu dễ dàng hơn để khám phá và trực quan hóa. Đây là một kỹ thuật phi tham số đơn giản để trích xuất thông tin từ các bộ dữ liệu phức tạp và khó hiểu. Phân tích thành phần chính được tập trung vào số lượng phương sai tối đa với số lượng thành phần chính ít nhất. Một trong những lợi thế khác biệt liên quan đến phân tích thành phần chính là một khi các mẫu được tìm thấy trong dữ liệu liên quan, việc nén dữ liệu cũng được hỗ trợ. Người ta sử dụng phân tích thành phần chính để loại bỏ số lượng biến hoặc khi có quá nhiều yếu tố dự đoán so với số lượng quan sát hoặc để tránh đa cộng tuyến. Nó liên quan chặt chẽ đến phân tích tương quan chính tắc và sử dụng phép biến đổi trực giao để chuyển đổi tập hợp các quan sát có chứa các biến tương quan thành một tập hợp các giá trị được gọi là các thành phần chính. Số lượng các thành phần chính được sử dụng trong phân tích thành phần chính nhỏ hơn hoặc bằng số lượng quan sát ít hơn. Phân tích thành phần chính là nhạy cảm với tỷ lệ tương đối của các biến được sử dụng ban đầu.


Phân tích thành phần chính được sử dụng rộng rãi trong nhiều lĩnh vực như nghiên cứu thị trường, khoa học xã hội và trong các ngành công nghiệp nơi sử dụng bộ dữ liệu lớn. Kỹ thuật này cũng có thể giúp cung cấp một bức tranh chiều thấp hơn của dữ liệu gốc. Chỉ cần nỗ lực tối thiểu trong trường hợp phân tích thành phần chính để giảm tập dữ liệu phức tạp và khó hiểu thành tập thông tin hữu ích đơn giản hóa.