Nghiên cứu một số thuật toán học máy boosting và ứng dụng cho bài toán phân lớp dữ liệu

Loại tài liệu: Tài liệu số - Luận văn Thạc sĩ / Bộ sưu tập: Công nghệ thông tin

Tác giả: Đặng Văn Tuấn, GVHD: Trần Hùng Cường

Nhà xuất bản: Đại học Công nghiệp Hà Nội

Năm xuất bản: 2025

Tải ứng dụng tại các liên kết sau để xem đầy đủ tài liệu.

Tóm tắt nội dung

Nhằm ứng dụng các thuật toán Boosting (AdaBoost, Gradient Boosting, XGBoost) cho các bài toán phân loại trong nhiều lĩnh vực như y tế, tiếp thị, môi trường, an ninh mạng và tài chính. Kết quả thực nghiệm trên các bộ dữ liệu đa dạng cho thấy các mô hình Boosting, đặc biệt là XGBoost và Gradient Boosting, đạt độ chính xác cao và hiệu quả vượt trội. Nghiên cứu khẳng định tính linh hoạt, khả năng thích ứng rộng rãi của Boosting, đồng thời cung cấp phân tích chi tiết dựa trên các chỉ số đánh giá như Accuracy, F1-score và ma trận nhầm lẫn, giúp làm rõ năng lực phân loại và dự đoán của từng mô hình. Đề án Nghiên cứu một số thuật toán học máy boosting và ứng dụng cho bài toán phân lớp dữ liệu đã thực hiện ứng dụng các mô hình Boosting như AdaBoost, Gradient Boosting, và XGBoost để xây dựng hệ thống phân loại tự động. Phương pháp này bao gồm các bước chính sau: Thu thập dữ liệu: Sử dụng Secondary Mushroom Dataset từ Kaggle, bộ dữ liệu này cung cấp thông tin chi tiết khác nhau, bao gồm cả đặc điểm hình thái và sinh học. Tiền xử lý dữ liệu: Bao gồm việc làm sạch dữ liệu, điền giá trị thiếu, mã hóa dữ liệu phân loại, và chuẩn hóa dữ liệu số để chúng phù hợp với mô hình học máy. Huấn luyện mô hình: Áp dụng các kỹ thuật Boosting khác nhau để huấn luyện mô hình trên tập dữ liệu đã được tiền xử lý. Đánh giá mô hình: Sử dụng các chỉ số như độ chính xác, Precision, Recall, và F1 Score cũng như ma trận nhầm lẫn để đánh giá hiệu suất của các mô hình. Kết quả nghiên cứu được trình bày trong 3 chương, gồm: Chương 1: Tổng quan về phương pháp học máy; Chương 2: Một số phương pháp học máy Boosting; Chương 3: Kết quả và thực nghiệm. Từ kết quả nghiên cứu đó, đề án đã ứng dụng các thuật toán Boosting (AdaBoost, Gradient Boosting, XGBoost) cho các bài toán phân loại trong nhiều lĩnh vực như y tế, tiếp thị, môi trường, an ninh mạng và tài chính. Kết quả thực nghiệm trên các bộ dữ liệu đa dạng cho thấy các mô hình Boosting, đặc biệt là XGBoost và Gradient Boosting, đạt độ chính xác cao và hiệu quả vượt trội. Nghiên cứu khẳng định tính linh hoạt, khả năng thích ứng rộng rãi của Boosting, đồng thời cung cấp phân tích chi tiết dựa trên các chỉ số đánh giá như Accuracy, F1-score và ma trận nhầm lẫn, giúp làm rõ năng lực phân loại và dự đoán của từng mô hình.

Ngôn ngữ:vie
Tác giả:Đặng Văn Tuấn, GVHD: Trần Hùng Cường
Thông tin nhan đề:Nghiên cứu một số thuật toán học máy boosting và ứng dụng cho bài toán phân lớp dữ liệu
Nhà xuất bản:Đại học Công nghiệp Hà Nội
Loại hình:Luận văn Thạc sĩ / Bộ sưu tập: Công nghệ thông tin
Mô tả vật lý:62tr.
Năm xuất bản:2025

Sử dụng ứng dụng Libol Bookworm quét QRCode này để mượn và đọc tài liệu)

(Lưu ý: Sử dụng ứng dụng Bookworm để xem đầy đủ tài liệu. Bạn đọc có thể tải Bookworm từ App Store hoặc Google play với từ khóa "Libol Bookworm”)