ĐÀO HỒNG THU

Welcome to my blog

Từ điển ngôn ngữ học khối liệu tiếng Việt (Vietnamese Dictionary of Corpus Linguistics) – T

Posted by daothu09 on January 19, 2010

Dr. Dao Hong Thu

 

1. Tài nguyên ngôn ngữ

Là thuật ngữ chung chỉ các nguồn tài nguyên thuộc lĩnh vực ngôn ngữ như khối văn bản và khối ngôn bản, danh mục tần số xuất hiện trong hoạt động ngôn ngữ, từ điển, từ điển ngôn ngữ học máy tính và các công cụ trích dẫn kiến thức về ngôn ngữ để phát triển và tối ưu hóa sản phẩm. Tài nguyên ngôn ngữ bao gồm khối liệu, nguồn từ vựng và các công cụ.

2. Tạo đơn nghĩa

Là sự loại bỏ nghĩa không rõ ràng bằng cách lựa chọn phân tích đặc thù hoặc mã (nhãn) trong quá trình xử lí khối liệu. Trình tự tạo đơn nghĩa có thể thực hiện ở nhiều mức độ, từ mức độ loại bỏ từ có nghĩa không rõ ràng (nghĩa là một từ có thể kết hợp với các từ loại khác nhau) đến lựa chọn một cách dịch tối ưu có thể. Tạo đơn nghĩa có thể là tạo đơn nghĩa xác suất, tức là được thực hiện theo phương pháp thống kê, hoặc là tạo đơn nghĩa nguyên tắc, tức là được thực hiện theo các nguyên tắc trên cơ sở kiến thức trực giác về ngôn ngữ.

3. Tệp nhãn

Là tập hợp nhãn dưới dạng sơ đồ chú giải khối liệu.

4. Thẩm định chuẩn kĩ thuật ngôn ngữ

Xác định rõ các chuẩn trong khắc phục sự cố về ngôn ngữ các nước của EU trong máy tính, ví dụ như chú giải. Đồng thời, thẩm định chuẩn kĩ thuật ngôn ngữ cũng là bộ chỉ dẫn chi tiết cơ bản cho chú giải từ vựng.

5. Tính phục hồi

Là khả năng dành cho người sử dụng có thể phục hồi được nguyên bản từ bất kì văn bản đã được chú giải thêm thông tin.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

 
%d bloggers like this: