ĐÀO HỒNG THU

Welcome to my blog

Từ điển ngôn ngữ học khối liệu tiếng Việt (Vietnamese Dictionary of Corpus Linguistics) – B

Posted by daothu09 on May 7, 2010

Dr. Dao Hong Thu

 

1. Bộ chú giải từ vựng

Là công cụ để giải thích, nghĩa là chú giải, từ và cụm từ trong khối liệu. Bộ chú giải từ vựng tập hợp các dạng từ, cụm từ đầu vào và các diễn giải hình thái học đầu ra có khả năng thực hiện của chúng trong ngữ cảnh xuất hiện của các từ và cụm từ. Bộ chú giải từ vựng tự động hóa là ứng dụng NLP tốt nhất được sử dụng có hiệu quả hiện nay nhờ độ tin cậy cao. Cả hai kiểu chú giải từ vựng: xác suất (theo phương pháp thống kê) và cơ sở – nguyên tắc (theo phương pháp ngữ pháp truyền thống) đều đang được phát triển.       

2. Bộ kiểm định ngữ âm

Là công cụ được tạo thành trên cơ sở tập hợp các đơn vị từ và cụm từ như một khối liệu thực hoặc trên cơ sở danh mục các đơn vị từ và cụm từ được chiết xuất từ từ điển. Bộ kiểm định ngữ âm được sử dụng để tìm kiếm các lỗi về ngữ âm trong văn bản. Bộ kiểm định ngữ âm ngày nay có thể được coi là bộ ứng dụng thương mại số một. Các thành phần đơn vị từ và cụm từ trong bộ kiểm định ngữ âm thuộc loại được chuẩn hóa trong quá trình xử lí ngôn ngữ.

3. Bộ kiểm định phong cách ngôn ngữ

Là công cụ kiểm định phong cách ngôn ngữ các đơn vị từ và cụm từ trong văn bản, phân tích cú pháp để tìm kiếm và chỉnh sửa các lỗi ngữ pháp, và kiểm định dữ liệu ngữ cảnh.   

4. Bộ kiểm định văn bản chung

Là công cụ kiểm định các hoạt động của quá trình dịch máy như bắt đầu một câu mới bằng chữ viết hoa, định vị khoảng cách đặc biệt giữa các từ và v.v.

5. Bộ phân tích cú pháp

Là loại công cụ phân tích văn bản về mặt ngữ nghĩa, nghĩa là thực hiện phân tích cú pháp. Bộ phân tích cú pháp xác định thành phần lời nói trong câu được gắn với mỗi từ. Tập hợp các từ và cụm từ đã được gán nhãn tạo thành một tập hợp câu và đoạn câu ngày một lớn về mặt ngữ pháp. Kết quả phân tích là nhánh đơn hoặc đoạn nhánh, sau đó, được chuyển qua phân tích nghĩa để xác định nghĩa từng câu riêng biệt. Các nhà nghiên cứu phát triển bộ phân tích cú pháp đã thực hiện nhiều phương pháp phân tích cú pháp khác nhau. Tuy nhiên, cần lưu ý rằng tất cả các hệ thống phân tích cú pháp hiện có còn chưa đủ mạnh và độ chuẩn xác còn thấp. Vì vậy, trong ngôn ngữ học khối liệu hiện nay, bộ phân tích cú pháp chưa đóng vai trò là công cụ thực hành tích cực đối với khối liệu ngôn ngữ.         

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

 
%d bloggers like this: