ĐÀO HỒNG THU

Welcome to my blog

Từ điển ngôn ngữ học khối liệu tiếng Việt (Vietnamese Dictionary of Corpus Linguistics) – D

Posted by daothu09 on January 19, 2010

Dr. Dao Hong Thu

 

Danh mục tần số sử dụng

Là danh mục được thành lập trên cơ sở tần số sử dụng của các đơn vị từ và cụm từ trong toàn bộ hệ thống dịch máy hoặc trên cơ sở thống kê các thành phần cú pháp trong một văn bản và tạo danh mục tần số xuất hiện của chúng. Hiện nay, thành lập các danh mục tần số sử dụng ngôn ngữ là không thể thiếu trong nghiên cứu và xây dựng các khối liệu ngôn ngữ.

Dịch máy

Là bộ môn của ngôn ngữ học máy tính, bao gồm toàn bộ các quá trình có liên quan đến dịch tự động. Dịch máy có nghĩa là văn bản dịch được thực hiện một cách tự động hoặc bán tự động trên máy tính. Hiện nay, dịch máy là một trợ giúp đắc lực cho biên, phiên dịch viên trong quá trình hoạt động dịch thuật. 

Dịch máy có hỗ trợ

Là hệ thống, chương trình hoặc ứng dụng máy tính bao gồm các công cụ và phương tiện thuận lợi nhằm giúp người dịch tăng năng suất và chất lượng công việc của mình. Các công cụ hỗ trợ dịch máy thường bao gồm từ điển tự động hóa đơn ngữ hoặc đa ngữ, bộ nhớ dịch thuật (để giúp máy không phải dịch hai lần các đoạn câu giống nhau trong một văn bản), bộ kiểm tra phát âm, cơ sở dữ liệu về thuật ngữ, bộ hiệu chỉnh dịch thuật, bộ sao chép thuật ngữ, bộ truy cập các văn bản đã dịch, bộ đối chiếu văn bản và v.v. 

Dẫn mục

Là dẫn mục từ hoặc cụm từ trong một ngữ cảnh. Dẫn mục là tâm điểm nghiên cứu và thực hành của ngôn ngữ học khối liệu do nó có khả năng truy cập nhiều thể loại cấu trúc ngôn ngữ trong văn bản.

Dẫn mục có thể thực hiện bằng phương pháp thủ công và trên thực tế, tồn tại đã từ rất lâu. Cho đến nay, nhiều dẫn mục như vậy vẫn còn giá trị sử dụng như các dẫn mục trong thư viện quốc gia, trong các cơ quan hành chính và v.v.

Công nghệ máy tính đã làm cho việc thực hiện dẫn mục được dễ dàng hơn rất nhiều. Các dẫn mục xuất hiện từ máy tính rất linh hoạt: ngữ cảnh của một từ hoặc cụm từ có thể được lựa chọn theo nhiều tiêu chuẩn khác nhau, ví dụ có thể thực hiện dẫn mục từ theo hình thức và ngữ nghĩa hoặc tìm ranh giới của câu v.v.

Trong khối liệu ngôn ngữ, dẫn mục thường thể hiện dưới dạng KWIC. Việc tìm kiếm các dữ liệu trong khối liệu ngôn ngữ thường cho phép sử dụng từ hoặc cụm từ bất kì để lập dẫn mục tất cả các từ hoặc cụm từ cần tìm trong ngữ cảnh với đầy đủ nguồn dẫn.

Như vậy, dẫn mục trong ngôn ngữ học khối liệu là toàn bộ dẫn mục được lựa chọn trong một khối liệu ngôn ngữ. Các tiện ích của máy tính khi sử dụng khối liệu thường được thực hiện trong chương trình dẫn mục thực hiện. Đây là phương tiện được sử dụng trong ngôn ngữ học khối liệu để kiểm tra các khối liệu ngôn ngữ.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

 
%d bloggers like this: