ĐÀO HỒNG THU

Welcome to my blog

Từ điển thuật ngữ Ngôn ngữ học khối liệu Việt – Anh (Vietnamese – English Glossary of Corpus Linguistics)

Posted by daothu09 on May 18, 2011

Việt

Anh

bộ chú giải từ vựng part-of-speech tagger
bộ kiểm định ngữ âm spelling checker
bộ kiểm định phong cách ngôn ngữ style checker
bộ kiểm định văn bản chung general text checker
bộ phân tích cú pháp parser/syntactic parser
chú giải annotation
chú giải âm điệu prosodic annotation
chú giải đại từ (chú giải trùng lặp) anaphoric annotation
chú giải nghĩa semantic annotation
chú giải thuyết trình discoursal annotation
chuẩn mã hóa khối liệu CES
chuẩn mã hóa văn bản TEI
chương trình chú giải từ vựng TAGGIT
chương trình Cocoa COCOA references
chương trình đối tượng entity reference
cơ sở dữ liệu thuật ngữ terminology databases
cơ sở dữ liệu từ vựng lexical data base (LDB)
công cụ ghép tự động automatic hyphenizer
công cụ giải đáp query(ing) tools
công cụ miền thông dụng public domain tools
công cụ ngôn ngữ máy tính CL tools
công nghệ ngôn ngữ Language Engineering (LE)
dẫn mục concordance
danh mục tần số sử dụng frequency list
dịch máy Machine Translation (MT)
dịch máy có hỗ trợ computer-aided translation (CAT)
đồng ngữ cảnh co-text
đồng tệp từ collocation
đồng trật tự collocate
ghi âm phonetic transcription
hệ thống chú giải Cutting Cutting tagger
hệ thống chú giải tự động CLAWS
hệ thống quản trị thuật ngữ terminological management system (TMS)
học với sự hỗ trợ của máy tính computer-aided learning / computer-assisted language learning (CALL)
hướng dẫn chuẩn mã hóa văn bản TEI Guidelines
khoảng cách span
khối liệu corpora
khối liệu bão hòa saturated corpus
khối liệu cân bằng balanced corpus
khối liệu cấu trúc hình cây treebank
khối liệu chủ monitor corpus
khối liệu chú giải annotated corpus
khối liệu chuyên dụng special corpus
khối liệu đa ngữ multilingual corpus
khối liệu đối chiếu comparable (reference) corpus
khối liệu đơn ngữ monolingual corpus
khối liệu không chú giải unannotated corpus
khối liệu khuyến mại opportunistic corpus
khối liệu mẫu sampled corpus
khối liệu phát âm spoken corpus
khối liệu song song parallel (aligned) corpus
khối liệu tham khảo reference corpus
mã hóa encoding
mô tả hệ thống WSD
ngân hàng dữ liệu thuật ngữ terminological data bank (TDB)
ngôn ngữ học khối liệu Corpus Linguistics
ngôn ngữ học máy tính Computational Linguistics (CL)
ngôn ngữ mã hóa theo chuẩn SGML
nguồn từ vựng Lexical Resources/Data
nhãn tag
nhãn cú pháp part-of-speech tagging
nhãn cùng kiểu ditto tagging, ditto tag
nhãn định hướng problem-oriented tagging
nhãn từ kết hợp portmanteau tag
nhóm mã phục hồi cơ bản base tagset
nút từ node
phần đầu trang header
phân nhỏ văn bản Text Chunking
phân tích cú pháp parsing
phân tích cú pháp đầy đủ full parsing
phân tích cú pháp phần khung skeleton parsing
phê chuẩn validation
sản phẩm products
sản phẩm giải nén ngôn ngữ Lingware/Language Engineering Tools
tài nguyên ngôn ngữ Language/Linguistics Resources
tạo đơn nghĩa disambiguation
tệp nhãn tagset
thẩm định chuẩn kĩ thuật ngôn ngữ EAGLES
tính phục hồi recoverability
trí tuệ nhân tạo Artificial Intelligence (AI)
từ khóa trong ngữ cảnh KWAL
từ khóa và đường nối KWIC
từ vị hóa lemmatisation
từ vựng lexicon
từ vựng dành cho máy machine lexicon
từ vựng trong ngôn ngữ máy tính computational linguistic lexicon
xác định đường nối alignment
xác định kiểu văn bản DTD
xử lí khối liệu Corpus Processing
xử lí ngôn ngữ tự nhiên Natural Language Processing (NLP)

TÀI LIỆU THAM KHẢO

  1. Aarts J., Meijs W. (1990). Theory and Practice in Corpus Linguistics. Amsterdam: Rodopi.

  2. Bright W. (1992). International Encyclopedia of linguistics. New York: Oxford University Press.
  3. Carter R. (2004). Language and creativity. The art of common talk. London: Routledge.
  4. Halteren H., van den Heuvel T. (1990). Linguistic Exploitation of Syntactic Databases. Amsterdam: Rodopi.
  5. Hutchins W.J., Sommers H.L. (1986). An introduction to machine translation. London: Academic Press.
  6. Leech G. (1991). The state of art in corpus linguistics. Aijmer and Altenberg, 8-29.
  7. Mahlberg M. (2007). Corpus stylistics: bridging the gap between linguistic and literary studies. London: Continuum.
  8. McEnery T., Wilson A. (1996). Corpus Linguistics. Edinburgh: Edinburgh University Press.
  9. Nespor M., Vogel I. (1990). Prosodic Phonology. Dordrecht: Foris.
  10. Oostdijk N., de Haan P. (1994). Corpus-based research into language. Amsterdam: Rodopi.
  11. Sinclair J. (2004). Trust the Text. Language, corpus and discourse. London: Routledge.
  12. Souter C. (1993). Towards a standard format for parsed corpora. Aarts et al. 197-212.
  13. Souter C., Atwell E. (1993). Corpus Based Computational Linguistics. Amsterdam: Rodopi.
  14. Sparck Jones K. (1992). Natural language processing: an overview. Bright 1992, Vol. 3, 53-59.
  15. Scott M., C. Tribble (2006). Textual Patterns. Key words and corpus analysis in language education. Amsterdam: Benjamins.
  16. Wynne M. (2005). Developing Linguistic Corpora: a guide to good practice. Oxford: Oxbow Books.
  17. Đào Hồng Thu (2007). Ngôn ng hc khi liu (Corpus) (phn 1). Tp chí Ngôn ng và Đi sng. Số 7 (141), tr.9-13.
  18. Đào Hồng Thu (2008). Khi liu – đc trưng và phân loại. Tạp chí Ngôn ngữ và Đời sống. Số 1+2 (147+148), tr.23-26.Đào Hồng Thu. http://corling.wordpress.com

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

 
%d bloggers like this: