Reinforcement Learning: An Introduction, 2nd Edition

Loại tài liệu: Tài liệu số - Tài nguyên giáo dục mở / Bộ sưu tập: Công nghệ thông tin

Tác giả: Sutton, Richard S., Barto, Andrew G.

Nhà xuất bản: MIT Press

Năm xuất bản: 2018

Tải ứng dụng tại các liên kết sau để xem đầy đủ tài liệu.

Tóm tắt nội dung

Ấn bản thứ hai này tập trung vào các thuật toán học trực tuyến cốt lõi, với nhiều tài liệu toán học hơn được đặt trong các ô tô bóng. Phần I đề cập đến càng nhiều càng tốt về học tăng cường mà không vượt quá trường hợp bảng mà có thể tìm thấy các giải pháp chính xác. Nhiều thuật toán được trình bày trong phần này là mới đối với ấn bản thứ hai, bao gồm UCB, Expected Sarsa và Double Learning. Phần II mở rộng các ý tưởng này sang phép xấp xỉ hàm, với các phần mới về các chủ đề như mạng nơ-ron nhân tạo và cơ sở Fourier, đồng thời cung cấp cách xử lý mở rộng về học ngoài chính sách và các phương pháp gradien chính sách. Phần III có các chương mới về mối quan hệ của học tăng cường với tâm lý học và khoa học thần kinh, cũng như một chương nghiên cứu trường hợp được cập nhật bao gồm AlphaGo và AlphaGo Zero, chơi trò chơi Atari và chiến lược cá cược của IBM Watson. Chương cuối cùng thảo luận về các tác động xã hội trong tương lai của học tăng cường.

Abstract:

This second edition focuses on core online learning algorithms, with the more mathematical material set off in shaded boxes. Part I covers as much of reinforcement learning as possible without going beyond the tabular case for which exact solutions can be found. Many algorithms presented in this part are new to the second edition, including UCB, Expected Sarsa, and Double Learning. Part II extends these ideas to function approximation, with new sections on such topics as artificial neural networks and the Fourier basis, and offers expanded treatment of off-policy learning and policy-gradient methods. Part III has new chapters on reinforcement learning's relationships to psychology and neuroscience, as well as an updated case-studies chapter including AlphaGo and AlphaGo Zero, Atari game playing, and IBM Watson's wagering strategy. The final chapter discusses the future societal impacts of reinforcement learning.

Ngôn ngữ:eng
Tác giả:Sutton, Richard S., Barto, Andrew G.
Thông tin nhan đề:Reinforcement Learning: An Introduction, 2nd Edition
Nhà xuất bản:MIT Press
Loại hình:Tài nguyên giáo dục mở / Bộ sưu tập: Công nghệ thông tin
Bản quyền:https://creativecommons.org/licenses/by-nc-sa/4.0/deed.en
Nguồn gốc:https://it-ebooks.dev/books/data-science-and-ai/reinforcement-learning-2nd-edition
Mô tả vật lý:548p.
Năm xuất bản:2018

Sử dụng ứng dụng Libol Bookworm quét QRCode này để mượn và đọc tài liệu)

(Lưu ý: Sử dụng ứng dụng Bookworm để xem đầy đủ tài liệu. Bạn đọc có thể tải Bookworm từ App Store hoặc Google play với từ khóa "Libol Bookworm”)