Học tăng cường

Tác Giả: Lewis Jackson
Ngày Sáng TạO: 11 Có Thể 2021
CậP NhậT Ngày Tháng: 15 Có Thể 2024
Anonim
học tăng cường P1
Băng Hình: học tăng cường P1

NộI Dung

Định nghĩa - Học tăng cường có nghĩa là gì?

Học tăng cường, trong con người của trí tuệ nhân tạo, là một loại lập trình động, đào tạo các thuật toán bằng cách sử dụng một hệ thống khen thưởng và trừng phạt.


Một thuật toán học tăng cường, hoặc tác nhân, học bằng cách tương tác với môi trường của nó. Các đại lý nhận được phần thưởng bằng cách thực hiện chính xác và hình phạt cho việc thực hiện không chính xác. Tác nhân học mà không cần sự can thiệp từ con người bằng cách tối đa hóa phần thưởng của nó và giảm thiểu hình phạt của nó.

Giới thiệu về Microsoft Azure và Microsoft Cloud | Trong suốt hướng dẫn này, bạn sẽ tìm hiểu về điện toán đám mây là gì và Microsoft Azure có thể giúp bạn di chuyển và điều hành doanh nghiệp của bạn từ đám mây như thế nào.

Techopedia giải thích Học tăng cường

Học tăng cường là một cách tiếp cận học máy được lấy cảm hứng từ tâm lý học hành vi. Nó tương tự như cách một đứa trẻ học cách thực hiện một nhiệm vụ mới. Học tăng cường tương phản với các phương pháp học máy khác ở chỗ thuật toán không được nói rõ ràng về cách thực hiện một nhiệm vụ, mà tự nó hoạt động thông qua vấn đề.


Là một đại lý, có thể là một chiếc xe tự lái hoặc một chương trình chơi cờ, tương tác với môi trường của nó, nhận được trạng thái phần thưởng tùy thuộc vào cách nó thực hiện, chẳng hạn như lái xe đến đích an toàn hoặc chiến thắng một trò chơi. Ngược lại, đại lý nhận một hình phạt cho việc thực hiện không chính xác, chẳng hạn như đi ra đường hoặc bị kiểm tra.

Tác nhân theo thời gian đưa ra quyết định để tối đa hóa phần thưởng của nó và giảm thiểu hình phạt của nó bằng cách sử dụng lập trình động. Ưu điểm của phương pháp này đối với trí tuệ nhân tạo là nó cho phép một chương trình AI học mà không cần lập trình viên đánh vần cách một tác nhân nên thực hiện nhiệm vụ.