Nghiên cứu và ứng dụng mô hình học sâu trong bài toán tóm tắt video

Loại tài liệu: Tài liệu số - Luận văn Thạc sĩ / Bộ sưu tập: Công nghệ thông tin

Tác giả: Lê Khánh Hải Đăng, GVHD: Trần Hùng Cường

Nhà xuất bản: Đại học Công nghiệp Hà Nội

Năm xuất bản: 2025

Tải ứng dụng tại các liên kết sau để xem đầy đủ tài liệu.

Tóm tắt nội dung

$a

Đề án Nghiên cứu mô hình học sâu và ứng dụng trong bài toán tóm tắt video đã tiến hành phát triển một mô hình học sâu có khả năng tóm tắt video một cách chính xác và hiệu quả. Cụ thể hơn, nghiên cứu nhằm: Khám phá và thử nghiệm các mô hình học sâu hiện đại như CNN, RNN, và Transformer trong bài toán tóm tắt video. Thiết kế một kiến trúc mô hình tối ưu, kết hợp các kỹ thuật tiền xử lý và tăng cường dữ liệu để cải thiện khả năng học tập và dự đoán của mô hình. Thực nghiệm trên các bộ dữ liệu video đa dạng để đánh giá hiệu suất của mô hình, bao gồm các chỉ số đánh giá như độ chính xác (Precision), độ nhạy (Recall), và điểm F1 (F1-score). So sánh mô hình đề xuất với các phương pháp truyền thống và hiện đại khác để xác định tính ưu việt và nhược điểm của mô hình. Từ đó vận dụng, xây dựng đề tài nghiên cứu ứng dụng mô hình Transformer trong tóm tắt video, cho thấy khả năng vượt trội trong việc khai thác quan hệ dài hạn giữa các khung hình để tạo bản tóm tắt cô đọng và đại diện nội dung tốt hơn so với các mô hình CNN-RNN truyền thống. Pipeline thử nghiệm gồm ba bước: trích xuất đặc trưng, xử lý bằng Transformer và sinh bản tóm tắt. Dù đạt kết quả khả quan, bài toán vẫn gặp thách thức như khó xác định khung hình quan trọng trong video ít thay đổi và yêu cầu cao về dữ liệu và tính toán.. Đề án được trình bày trong 3 chương, gồm: Chương 1: Tổng quan về bài toán tóm tắt video và cơ sở lý thuyết; Chương 2: Nghiên cứu các mô hình học sâu cho bài toán tóm tắt video; Chương 3: Thực nghiệm mô hình.

Ngôn ngữ:vie
Tác giả:Lê Khánh Hải Đăng, GVHD: Trần Hùng Cường
Thông tin nhan đề:Nghiên cứu và ứng dụng mô hình học sâu trong bài toán tóm tắt video
Nhà xuất bản:Đại học Công nghiệp Hà Nội
Loại hình:Luận văn Thạc sĩ / Bộ sưu tập: Công nghệ thông tin
Mô tả vật lý:84tr.
Năm xuất bản:2025

Sử dụng ứng dụng Libol Bookworm quét QRCode này để mượn và đọc tài liệu)

(Lưu ý: Sử dụng ứng dụng Bookworm để xem đầy đủ tài liệu. Bạn đọc có thể tải Bookworm từ App Store hoặc Google play với từ khóa "Libol Bookworm”)