Nghiên cứu phát triển giải pháp tạo mô tả tự động cho hình ảnh
Research on Developing an Automated Image Captioning Solution

Loại tài liệu: Tài liệu số

Tác giả: Thân Ngọc Thiện (2021602775)

Nhà xuất bản: Đại học Công nghiệp Hà Nội

Năm xuất bản: 2024

Tải ứng dụng tại các liên kết sau để xem đầy đủ tài liệu.

Tóm tắt nội dung

Nghiên cứu ứng dụng học sâu để tạo mô tả hình ảnh tự động, sử dụng mạng CNN trích xuất đặc trưng, RNNs (LSTM, GRU) sinh văn bản và cơ chế chú ý cải thiện chất lượng. Mục tiêu là tạo mô tả chính xác, đầy đủ ngữ nghĩa, hỗ trợ tìm kiếm ảnh, người khiếm thị và tương tác người-máy.


Từ khóa:

Mô tả hình ảnh; Mạng tích chập, Mạng Transformer


Abstract:

The study applies deep learning to automate image captioning, utilizing CNNs for feature extraction, RNNs (LSTM, GRU) for text generation, and the attention mechanism to enhance quality. The objective is to produce accurate, semantically rich descriptions, supporting image retrieval, aiding the visually impaired, and facilitating human-machine interaction.


Key word:

Image captioning; CNN, RNN, Transformer

Ngôn ngữ:Vie
Tác giả:Thân Ngọc Thiện (2021602775)
Người đóng góp:GVHD: Phạm Văn Hà
Thông tin nhan đề:Nghiên cứu phát triển giải pháp tạo mô tả tự động cho hình ảnh
Research on Developing an Automated Image Captioning Solution
Nhà xuất bản:Đại học Công nghiệp Hà Nội
Mô tả vật lý:69tr.
Năm xuất bản:2024

Sử dụng ứng dụng Libol Bookworm quét QRCode này để mượn và đọc tài liệu)

(Lưu ý: Sử dụng ứng dụng Bookworm để xem đầy đủ tài liệu. Bạn đọc có thể tải Bookworm từ App Store hoặc Google play với từ khóa "Libol Bookworm”)