ĐÀO HỒNG THU

Welcome to my blog

Từ điển ngôn ngữ học khối liệu tiếng Việt (Vietnamese Dictionary of Corpus Linguistics) – P

Posted by daothu09 on January 19, 2010

Dr. Dao Hong Thu

 

1. Phân nhỏ văn bản

Là công đoạn chia nhỏ câu thành các phân đoạn không trùng nhau trên cơ sở phân tích bên ngoài một cách đơn giản. Phân nhỏ văn bản là bước thực hiện ban đầu có ích cho công đoạn phân giải ngữ loại. Phân nhỏ văn bản bao gồm xác định phần cụm danh từ không lặp lại. Phân nhỏ văn bản còn là công đoạn có ích đối với các mục đích khác trong thực hành ngôn ngữ học khối liệu, bao gồm cả mục lục thế hệ thuật ngữ.

2. Phần đầu trang

Là phần trên cùng của một trang văn bản điện tử, thường được sử dụng để chứa thông tin của văn bản như thông tin về tác giả, đề mục, dẫn nguồn và v.v.

3. Phân tích cú pháp

Là ấn định cấu trúc cú pháp cho văn bản. Phân tích cú pháp thường được thực hiện sau khi các kiểu loại hình thái cú pháp đã được xác định trong văn bản. Quá trình phân tích cú pháp làm cho các kiểu loại hình thái cú pháp này có liên kết cú pháp ở mức độ cao hơn. Phân tích cú pháp, có lẽ, là dạng phổ biến nhất của chú giải khối liệu sau chú giải đại từ. Khối liệu đã được phân tích cú pháp, đôi khi, còn được gọi là treebank.

4. Phân tích cú pháp đầy đủ

Là dạng phân tích cấu trúc câu với mức độ chi tiết có thể.  

5. Phân tích cú pháp phần khung

Là kiểu phân tích cú pháp mang tính chất tạo bộ khung cho các bước phân tích cú pháp cụ thể văn bản khối liệu, ví dụ, phân tích cấu trúc cú pháp phần khung: cấu trúc bên trong của các thành phần cú pháp nhất định.

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google+ photo

You are commenting using your Google+ account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

w

Connecting to %s

 
%d bloggers like this: