Data and Text Processing for Health and Life Sciences

Loại tài liệu: Tài liệu số - Tài nguyên giáo dục mở / Bộ sưu tập:  Công nghệ thông tin

Tác giả: Francisco M Couto

Nhà xuất bản: Springer Open

Năm xuất bản: 2019

Tải ứng dụng tại các liên kết sau để xem đầy đủ tài liệu.

Tóm tắt nội dung

Cuốn sách này là phần giới thiệu từng bước về cách tập lệnh shell có thể giúp giải quyết nhiều tác vụ xử lý dữ liệu mà các chuyên gia Sức khỏe và Đời sống phải đối mặt hàng ngày với mức độ phụ thuộc phần mềm tối thiểu. Các ví dụ được trình bày trong cuốn sách cho thấy cách sử dụng và kết hợp các công cụ dòng lệnh đơn giản để truy xuất dữ liệu và văn bản từ các tài nguyên web, lọc và khai thác tài liệu cũng như khám phá ngữ nghĩa được mã hóa trong các bản thể luận y sinh. Để lưu trữ dữ liệu, cuốn sách này dựa trên các định dạng tệp văn bản tiêu chuẩn mở, chẳng hạn như TSV, CSV, XML và OWL, có thể được mở bằng bất kỳ ứng dụng soạn thảo văn bản hoặc bảng tính nào. Hai chương đầu tiên, Giới thiệu và Tài nguyên, giới thiệu ngắn gọn về tập lệnh shell và mô tả các tài nguyên dữ liệu phổ biến trong Khoa học Sức khỏe và Đời sống. Chương thứ ba, Truy xuất dữ liệu, bắt đầu bằng việc giới thiệu một tác vụ xử lý dữ liệu chung liên quan đến nhiều tài nguyên dữ liệu. Sau đó, chương này giải thích cách tự động hóa từng bước của nhiệm vụ đó bằng cách giới thiệu từng công cụ dòng lệnh cần thiết. Chương thứ tư, Xử lý văn bản, trình bày cách lọc và phân tích văn bản bằng cách sử dụng các kỹ thuật khớp chuỗi đơn giản và biểu thức chính quy. Chương cuối cùng, Xử lý ngữ nghĩa, cho thấy cách các truy vấn XPath và tập lệnh shell có thể xử lý dữ liệu phức tạp, chẳng hạn như các biểu đồ được sử dụng để chỉ định các bản thể luận. Bên cạnh việc gần như bất biến trong hơn bốn thập kỷ và có sẵn trong hầu hết các máy tính cá nhân của chúng ta, tập lệnh shell còn tương đối dễ học bởi các chuyên gia Sức khỏe và Đời sống như một chuỗi các lệnh độc lập. Việc hiểu chúng cũng giống như tiến hành một quy trình thí nghiệm mới bằng cách kiểm tra và hiểu các bước quy trình cũng như các biến số của nó, đồng thời kết hợp các kết quả trung gian của chúng. Vì vậy, cuốn sách này đặc biệt phù hợp với các chuyên gia về Sức khỏe và Đời sống hoặc những sinh viên muốn dễ dàng học cách xử lý dữ liệu và văn bản, đồng thời điều này có thể tạo điều kiện và truyền cảm hứng cho họ để có được các kỹ năng tin sinh học sâu hơn trong tương lai.

Abstract:

This book is a step-by-step introduction on how shell scripting can help solve many of the data processing tasks that Health and Life specialists face everyday with minimal software dependencies. The examples presented in the book show how simple command line tools can be used and combined to retrieve data and text from web resources, to filter and mine literature, and to explore the semantics encoded in biomedical ontologies. To store data this book relies on open standard text file formats, such as TSV, CSV, XML, and OWL, that can be open by any text editor or spreadsheet application. The first two chapters, Introduction and Resources, provide a brief introduction to the shell scripting and describe popular data resources in Health and Life Sciences. The third chapter, Data Retrieval, starts by introducing a common data processing task that involves multiple data resources. Then, this chapter explains how to automate each step of that task by introducing the required commands line tools one by one. The fourth chapter, Text Processing, shows how to filter and analyze text by using simple string matching techniques and regular expressions. The last chapter, Semantic Processing, shows how XPath queries and shell scripting is able to process complex data, such as the graphs used to specify ontologies. Besides being almost immutable for more than four decades and being available in most of our personal computers, shell scripting is relatively easy to learn by Health and Life specialists as a sequence of independent commands. Comprehending them is like conducting a new laboratory protocol by testing and understanding its procedural steps and variables, and combining their intermediate results. Thus, this book is particularly relevant to Health and Life specialists or students that wan

Ngôn ngữ:En
Tác giả:Francisco M Couto
Thông tin nhan đề:Data and Text Processing for Health and Life Sciences
Nhà xuất bản:Springer Open
Loại hình:Tài nguyên giáo dục mở / Bộ sưu tập:  Công nghệ thông tin
Bản quyền:https://creativecommons.org/licenses/by/4.0/
Nguồn gốc:https://www.dbooks.org/data-and-text-processing-for-health-and-life-sciences-3030138453/
Mô tả vật lý:107p.
Năm xuất bản:2019

Sử dụng ứng dụng Libol Bookworm quét QRCode này để mượn và đọc tài liệu)

(Lưu ý: Sử dụng ứng dụng Bookworm để xem đầy đủ tài liệu. Bạn đọc có thể tải Bookworm từ App Store hoặc Google play với từ khóa "Libol Bookworm”)