Speech Technologies

Loại tài liệu: Tài liệu số - Tài nguyên giáo dục mở / Bộ sưu tập: Công nghệ thông tin

Tác giả: Ipsic, Ivo

Nhà xuất bản: IntechOpen

Năm xuất bản: 2019

Tải ứng dụng tại các liên kết sau để xem đầy đủ tài liệu.

Tóm tắt nội dung

Cuốn sách này đề cập đến các khía cạnh khác nhau của lĩnh vực nghiên cứu và nhiều chủ đề về xử lý tín hiệu giọng nói, nhận dạng giọng nói và xử lý ngôn ngữ. Các chương được chia thành ba phần khác nhau: Mô hình tín hiệu giọng nói, Nhận dạng giọng nói và Ứng dụng. Các chương trong phần đầu tiên đề cập đến một số chủ đề thiết yếu trong xử lý tín hiệu giọng nói được sử dụng để xây dựng hệ thống nhận dạng giọng nói cũng như tổng hợp giọng nói: tăng cường đặc điểm giọng nói, giảm kích thước vectơ đặc trưng giọng nói, phân đoạn khung giọng nói thành các phân đoạn ngữ âm. Các chương của phần thứ hai bao gồm các phương pháp và kỹ thuật nhận dạng giọng nói được sử dụng để đọc giọng nói từ các cơ sở dữ liệu giọng nói khác nhau và nhận dạng tin tức phát sóng cho các ngôn ngữ tiếng Anh và không phải tiếng Anh. Phần thứ ba của cuốn sách trình bày các ứng dụng công nghệ giọng nói khác nhau được sử dụng để nhận dạng giọng nói được thực hiện bằng cơ thể, khiếm thính, giao diện đa phương thức và nhận dạng nét mặt.

Abstract:

This book addresses different aspects of the research field and a wide range of topics in speech signal processing, speech recognition and language processing. The chapters are divided in three different sections: Speech Signal Modeling, Speech Recognition and Applications. The chapters in the first section cover some essential topics in speech signal processing used for building speech recognition as well as for speech synthesis systems: speech feature enhancement, speech feature vector dimensionality reduction, segmentation of speech frames into phonetic segments. The chapters of the second part cover speech recognition methods and techniques used to read speech from various speech databases and broadcast news recognition for English and non-English languages. The third section of the book presents various speech technology applications used for body conducted speech recognition, hearing impairment, multimodal interfaces and facial expression recognition.

Ngôn ngữ:eng
Tác giả:Ipsic, Ivo
Thông tin nhan đề:Speech Technologies
Nhà xuất bản:IntechOpen
Loại hình:Tài nguyên giáo dục mở / Bộ sưu tập: Công nghệ thông tin
Bản quyền:https://creativecommons.org/licenses/by-nc-sa/3.0/
Nguồn gốc:https://directory.doabooks.org/handle/20.500.12854/64995
Mô tả vật lý:444p.
Năm xuất bản:2019

Sử dụng ứng dụng Libol Bookworm quét QRCode này để mượn và đọc tài liệu)

(Lưu ý: Sử dụng ứng dụng Bookworm để xem đầy đủ tài liệu. Bạn đọc có thể tải Bookworm từ App Store hoặc Google play với từ khóa "Libol Bookworm”)