ĐÀO HỒNG THU

Welcome to my blog

Archive for the ‘Hậu ĐHBK Hà Nội’ Category

Lời cảm ơn

Posted by daothu09 on April 17, 2014

Ngỡ ngàng và xúc động. Nước mắt từ lâu đã chảy ngược vào trong và như đã cạn khô, giờ bỗng nhạt nhòa khi thấy được nhắc đến ở vị trí trang trọng trong cuốn sách về con: “Người gieo giấc mơ Đàm Quang Minh” của tập thể tác giả FPoly.

Xin chân thành cảm tạ các tác giả vì những bài viết thật xúc động và sâu sắc.

hình1402

Không phải ai cũng biết, phía sau Đàm Quang Minh, ngoài vợ đẹp con khôn, còn có một người mẹ rất tuyệt vời – Tiến sỹ Đào Hồng Thu, cựu giảng viên Đại học Bách khoa Hà Nội. Có nhiều từ để nói về người phụ nữ ấy, nhưng chỉ xin chọn hai chữ: Tận tụy và khảng khái. Phẩm chất đặc biệt ở hai mẹ con MinhĐQ là thường làm hoặc đạt được những cái chưa ai làm, chưa đạt được – họ, đích thị là con người của những cái đầu tiên. Sắp bước sang ngưỡng cửa bên kia cuộc đời, khi nhiều tâm nguyện đã thành, bà mẹ ấy lại hồi nhớ về những ngày tháng cũ …….

Những mẩu chuyện này là bản ghép không đầu, không cuối về những năm tháng ấu thơ buồn tủi, giấc mơ chinh phục tri thức đôi khi thật xa vời của một cậu học trò mồ côi cha ham học, thông minh, nghịch ngợm, hiếu nghĩa, sớm biết tự lập từ khi còn nhỏ. Bên cạnh đó, còn có bóng dáng một người mẹ hiền rất mực thương con, cam chịu, khảng khái, yêu tri thức, bởi chạy theo giấc mơ của mình và con, đã phải nếm trải biết bao tủi nhục, thách thức trước cái nghèo đói, sự đố kỵ, giả dối để rồi một ngày được mỉm cười kiêu hãnh khi con nên người.

Advertisements

Posted in Con học chuyên toán, Hậu ĐHBK Hà Nội, Khi con trưởng thành | Leave a Comment »

Chênh vênh giữa sườn núi

Posted by daothu09 on April 19, 2012

Hôm vừa rồi, chị hàng xóm sang nhà tôi với vẻ mặt rất vui mừng:

–         Ra Ủy ban chụp ảnh đi. Hôm nay CLB người cao tuổi chụp ảnh miễn phí cho các cụ đấy.

Tôi ngơ ngác:

–         Nhưng mà em đã là hội viên CLB đâu!

Đến lượt chị hàng xóm “ngẩn người”:

–         Ừ nhỉ. Thế em đã đến 60 tuổi chưa?

–         Chưa chị ạ. Về hưu từ 55 tuổi, tính ra cũng được mấy năm rồi, nhưng chưa đến 60.

–         Thế thì em vẫn chưa được là NGƯỜI CAO TUỔI rồi. Lửng lơ giữa hai sườn núi quá nhỉ. Nam giới thì đến tuổi là NGƯỜI CAO TUỔI mới về hưu cơ đấy. Đến khi tròn 70 tuổi thì được mừng thọ 500 000 VND / Cụ.

Rồi chị đùa:

–         Hay đợi đến gần 70 thì gia nhập CLB để được mừng thọ?

Hà Nội, ngày 16/04/2012

Posted in Hậu ĐHBK Hà Nội, Truyện ngắn và Thơ | Leave a Comment »

Chuyện nghỉ hưu

Posted by daothu09 on March 18, 2012

 

Thế là tôi nghỉ hưu từ ĐH Bách khoa Hà Nội đã được đến mấy năm rồi. Mặc dù vẫn LÁCH CÁCH làm công việc ưa thích của mình vì CÁI NGHIỆP của tôi là như vậy và muốn QUÊN chuyện cũ để SỐNG VUI, SỐNG KHỎE, SỐNG CÓ ÍCH, nhưng tôi vẫn cứ bị ám ảnh bởi chuyện nghỉ hưu và cách tính lương hưu.

“Kỳ cục” chuyện nghỉ hưu của “dân” sự nghiệp vào đầu thế kỷ XXI: “thiên biến vạn hóa” các kiểu …!!!?? Đang ở độ tuổi ĐỦ CHÍN cho sự nghiệp thì … NGHỈ HƯU. Nữ tiến sỹ mà nghỉ hưu ở tuổi 55 thì đúng là lãng phí chất xám thật. Trong khi đó, nhiều VỊ vẫn “ngon lành” hưởng lương và nhiều khoản phúc lợi từ Trường. Ví dụ:

Nam cử nhân, nguyên Bí thư Chi bộ Khoa Ngoại ngữ PNL, ở tuổi sau 55, cố tình dùng UY LỰC của mình để tiếp tục CO KÉO làm Trưởng Bộ môn Nga văn có 03 người vào những năm 2003 – 2008, khi mà số giờ dành cho tiếng Nga rất hạn chế, nhằm mục đích được thêm một bậc lương khi nghỉ hưu!!!?? Và còn không ít HỆ LỤY do PNL đã gây ra ở Khoa Ngoại ngữ này. Thật là …   

Nữ kỹ sư, nguyên Thường vụ Công đoàn Trường đã được giữ lại làm việc nhiều năm sau tuổi 55 vì “không ai có thể thay thế”!? Không hiểu “chị” Công đoàn này đã làm việc tốt đến đâu, nhưng có lần tôi đến Công đoàn Trường đề nghị về trường hợp của tôi, sau khi nghe tôi trình bày, chị bảo: “Thế còn chị đã chứ.” Tôi đã hiểu rằng KỸ SƯ như chị còn HƠN vạn lần TIẾN SỸ như tôi: Im lặng và ra về CHO KHỎE. Lần khác, đang trong Phòng Tổ chức cán bộ, thấy chị vừa đi vào phòng của Trưởng phòng, vừa “cao giọng”: “Sao anh lại làm như vậy?”. Thấy Trưởng phòng TCCB nghiêm mặt: “Chị bảo gì?”, chị Công đoàn liền mỉm cười, hạ giọng mềm mỏng: “Thì thỉnh thoảng cũng phải hỏi một câu như vậy, đùa thôi.” Botay.com ….

Nữ cử nhân, Trưởng phòng Tài vụ đương nhiên làm việc đến 60 tuổi, hưởng lương hưu như các đồng nghiệp là nam giới. Điều này là hợp lý nếu là để NAM NỮ BÌNH ĐẲNG.

Hà Nội, ngày 18/03/2012

Posted in Hậu ĐHBK Hà Nội | Leave a Comment »

Gặp người đưa ngôn ngữ khối liệu vào Việt Nam

Posted by daothu09 on January 27, 2012

(Nguoiduatin.vn) – Chị là người Việt Nam đầu tiên đã tiến hành nghiên cứu một cách có hệ thống Ngôn ngữ học khối liệu và Dịch máy (Dịch tự động) ở cấp độ thực tập sinh cao cấp tại Liên bang Nga, và sau đó, đưa Ngôn ngữ học khối liệu vào Việt Nam.

Cuối năm 2004, dưới cái rét cắt da, cắt thịt, có một phụ nữ Việt Nam trung niên, làm thủ tục nhập trường Đại học Sư phạm Quốc gia Liên bang Nga với tư cách là thực tập sinh cao cấp. Chị đã làm không ít đồng nghiệp người Nga và nhiều nước khác ngạc nhiên khi nghiên cứu đề tài Các nguyên tắc tổ chức Hệ thống dịch tự động (dịch máy) và sau đó là Ngôn ngữ học khối liệu (Corpus Linguistics).

Đề tài của chị đã được Bộ môn Ngôn ngữ học ứng dụng, khoa Ngôn ngữ, Đại học Sư phạm Quốc gia Liên bang Nga tại Saint Peterburg thông qua và công nhận tại Hội nghị Quốc tế được tổ chức tại Saint Peterburg và Hội thảo chuyên ngành Ngôn ngữ học khối liệu toàn Nga vào tháng 03/2006. Nhân dịp xuân mới, PV Nguoiduatin.vn đã có cuộc trò chuyện với tiến sỹ Đào Hồng Thu, người được đồng nghiệp gọi với cái tên thân mật: “Thu khối liệu”.

 “Thu khối liệu”

– Được biết chị là sinh viên tốt nghiệp loại ưu của Đại học Sư phạm Herzen, Leningrad, Liên Xô (cũ) năm 1977. Cảm giác của chị khi nhận tấm bằng tốt nghiệp trên tay?

Rất khó tả vì có nhiều cảm xúc trào dâng đan xen cùng một lúc: Rất vui và thoáng buồn, tự hào và thoáng lo lắng. Rất vui là vì tôi đã không phụ công cha mẹ và thầy cô đã sinh thành và nuôi dưỡng, giáo dục tôi có được kết quả mong đợi ban đầu. Thoáng buồn vì thế là tôi đã kết thúc quãng đời sinh viên tươi đẹp với bao mơ ước và dự định còn lại chưa kịp thực hiện.

Tự hào là vì kết quả học tập như vậy của chúng tôi ở nước ngoài phần nào đã mang lại một cái nhìn thiện cảm không chỉ của người Nga đối với người Việt Nam bằng xương, bằng thịt, mà còn của những người vẫn mang trên mình không ít nỗi đau của cuộc chiến tranh khốc liệt. Thoáng lo lắng bởi vì tôi chưa thể hình dung khi về nước sẽ làm được những gì trong hoàn cảnh sau chiến tranh ở Việt Nam với hành trang vào đời của những sinh viên tốt nghiệp loại ưu như chúng tôi chỉ là hàng tạ sách mang về nhà và các kiến thức được học ở trường. 

– Những năm 1983 – 1985, chị công tác tại Đại học Tổng hợp Lomonosov Moscow, Liên Xô (cũ). Điều gì khiến chị tâm đắc nhất từ trường Đại học danh giá vào bậc nhất của Liên Xô thời bấy giờ?

Năm 1983, tôi sang công tác tại Đại học Tổng hợp Lomonosov Moscow (MGU), Liên Xô với tư cách là biên, phiên dịch viên cho Đoàn cán bộ giảng dạy chính trị về chủ nghĩa Mác – Lênin của các trường Đại học Việt Nam tại Viện Nâng cao trình độ Lý luận chủ nghĩa Mác – Lênin (IPK) thuộc Đại học Tổng hợp Lomonosov Moscow, Liên Xô. Công việc của tôi là phiên dịch bài giảng trên lớp của các giáo sư người Nga, seminar, hội thảo, hội nghị, tọa đàm khoa học, các buổi thi và kiểm tra của học viên người Việt; biên dịch các bài tập, bài kiểm tra, khóa luận và v.v..

Trong hai năm làm việc và học tập tại MGU, tôi đã học hỏi được rất nhiều điều ngoài kiến thức sách vở. Điều làm tôi tâm đắc nhất và không thể quên là tình cảm chân thành và tinh thần làm việc nghiêm túc của tập thể giáo sư và cán bộ IPK nói riêng, của MGU nói chung. Tôi đã trưởng thành rất nhiều sau thời gian được làm việc và học tập tại đại học danh giá vào bậc nhất của Liên Xô thời bấy giờ.  

Tiến sỹ Đào Hồng Thu đang trao đổi với PV báo Nguoiduatin.vn

Người đầu tiên đưa ngôn ngữ khối liệu vào Việt Nam

– Chị là người Việt Nam đầu tiên nghiên cứu Ngôn ngữ học khối liệu (Corpus Linguistics) – Dịch tự động và đưa  Ngôn ngữ học khối liệu vào Việt Nam. Vì sao chị lại nghiên cứu đề tài này?

Nói một cách chính xác, tôi là người Việt Nam đầu tiên đã tiến hành nghiên cứu một cách có hệ thống Ngôn ngữ học khối liệu và Dịch máy (Dịch tự động) ở cấp độ thực tập sinh cao cấp tại Liên bang Nga, và sau đó, đưa Ngôn ngữ học khối liệu vào Việt Nam thông qua các công trình khoa học tôi đã và đang nghiên cứu ở trong và ngoài nước, trên cơ sở tiếng Việt, tiếng Anh và tiếng Nga.

Tôi đến với Ngôn ngữ học khối liệu và Dịch máy như là một điều may mắn. Năm 2004, ở tuổi 50, tôi được trở lại Thành Len (Saint Peterburg hiện nay) sau 27 năm xa cách. Đề tài nghiên cứu ban đầu của tôi là về Đối chiếu ngôn ngữ khoa học. Sang thế kỷ XXI, Thành Len ngày xưa vẫn giữ nguyên truyền thống nghiên cứu khoa học hàng đầu của Liên bang Nga.

Saint Peterburg ngày nay đã trở thành cái nôi của khoa học về Dịch máy và Ngôn ngữ học khối liệu hiện đại của Liên bang Nga. Tôi may mắn được Giáo sư, Viện sĩ Hàn lâm khoa học Liên bang Nga L.N.Belaeva (học trò xuất sắc của cố Giáo sư, Viện sĩ Hàn lâm khoa học R.G.Piotrovski, chuyên gia đầu ngành của thế giới về dịch máy) làm cố vấn khoa học và tôi được chuyển sang nghiên cứu về Dịch máy (Dịch tự động) và Ngôn ngữ học khối liệu trong thời gian hai năm nghiên cứu và học tập tại Đại học Sư phạm Herzen, Đại học Tổng hợp và Viện Ngôn ngữ Liên bang Nga tại Saint Peterburg.

Càng đi sâu nghiên cứu về Dịch máy và Ngôn ngữ học khối liệu, tôi càng thấy sự cần thiết và hữu dụng của các khoa học trên đối với việc phát triển kinh tế và xã hội không chỉ trong phạm vi mỗi quốc gia. Nhận thức được tầm quan trọng và vị trí đặc biệt của Dịch máy và Ngôn ngữ học khối liệu đối với công cuộc công nghiệp hóa và hiện đại hóa đất nước, tôi đã quyết tâm dành tâm huyết và khả năng vào nghiên cứu và phát triển Ngôn ngữ học khối liệu và Dịch máy đối với tiếng Việt và, trong tương lai, là các ngôn ngữ dân tộc Việt Nam.

 – Được biết chị có nhiều công trình nghiên cứu khoa học đã được công bố trên tập chí trong nước và Quốc tế. Chị có thể cho biết cụ thể về những công trình đó?

Trong hai năm ở Liên bang Nga, tôi đã hoàn thành nghiên cứu một số đề tài. Trong đó, bài báo về Ngôn ngữ học khối liệu đã được công bố tại Tập san của Khoa Ngôn ngữ, Đại học Sư phạm Saint Peterburg, Liên bang Nga. Đề tài “Các nguyên tắc tổ chức hệ thống dịch tự động (dịch máy)” đã được thông qua tại Bộ môn Ngôn ngữ ứng dụng, Khoa Ngôn ngữ, Đại học Sư phạm Saint Peterburg, Liên bang Nga và trình bày tại Hội nghị quốc tế được tổ chức tại Saint Peterburg và Hội thảo chuyên ngành Ngôn ngữ Corpus toàn Nga tháng 3/2006. Đồng thời, các bài báo khoa học trên các tạp chí nước ngoài và tại các hội thảo quốc tế được công bố tổng cộng là 5 bài.

Về Việt Nam, các công trình khoa học về Ngôn ngữ học khối liệu và Dịch máy đã được công bố của tôi là 15 bài.

– Sắp tới, chị có những dự kiến gì cho sự nghiệp nghiên cứu của mình?

Tôi vẫn đang tiến hành công việc của mình dưới nhiều góc độ khác nhau. Niềm vui và hạnh phúc của tôi là công việc và sức khỏe để có thể làm việc như mong muốn.

Gần chục năm qua, tôi luôn khát khao ba điều ước. Thứ nhất, Việt Nam sớm có được Khối liệu tiếng Việt và hệ thống các khối liệu chuyên dụng để phục vụ cho việc phát triển một xã hội hiện đại. Thứ hai, Việt Nam sớm có được Hệ thống dịch máy chuyên dụng đa ngôn ngữ có chất lượng cao để phục vụ cho việc phát triển và trường tồn của đất nước. Thứ ba, mong các nhà khoa học trẻ Việt Nam quan tâm nghiên cứu và phát triển các lĩnh vực khoa học mang tính ứng dụng rất cao này để có thể sau đó, chuyển giao được công nghệ ngôn ngữ tiên tiến cho các thế hệ tiếp theo.

– Xin cảm ơn tiến sĩ!                    

Lương Liễu

Ông Dương Kỳ Đức, tổng thư ký Hội Ngôn ngữ học Việt Nam: 

Ông Dương Kỳ Đức

 Thế giới phát triển với tốc độ chóng mặt, quan hệ, hội nhập giữa các nước ngày càng mở rộng, khoảng cách về địa lý sẽ không còn là rào cản nữa. Có chăng rào cản chỉ là ngôn ngữ giữa các quốc gia. Dịch tự động là dạng đặc biệt trong hoạt động dịch thuật của biên phiên dịch viên. Đồng thời, dịch tự động là phương tiện đặc biệt trong giao tiếp giữa các ngôn ngữ và cung cấp thông tin kinh tế, xã hội hiện đại cần thiết không những chỉ đối với các quốc gia trên toàn thế giới, mà còn cần thiết đối với cá nhân mỗi con người trong hoạt động đời sống xã hội của mình.

Tiến sỹ Đào Hồng Thu là người tiên phong đưa Ngôn ngữ học khối liệu vào Việt Nam. Phát triển ngôn ngữ học khối liệu qua việc viết những bài báo thuyết trình ở viện từ điển học và bách khoa thư Việt Nam và tại hội thảo ngữ học toàn quốc (diễn ra ở Đà Nẵng), đề tài này không chỉ có giá trị về mặt cung cấp thông tin kinh tế xã hội hiện đại cần thiết, mà còn có giá trị về mặt chính trị khi mà hiện nay nhiều người Việt Nam còn lơ mơ về luật quốc tế.

(Theo nguoiduatin.vn ngày 22-01-2012)

Posted in Hậu ĐHBK Hà Nội | Leave a Comment »

Nhân 55 năm kỷ niệm thành lập Trường Đại học Bách khoa Hà Nội

Posted by daothu09 on October 16, 2011

Tên Trường dịch sang tiếng Anh không đúng chuẩn

Trường Đại học Bách khoa Hà Nội

Nơi cả đời sự nghiệp của tôi

Quẩn quanh trong Trường TO nhất nước

Tròn năm mươi lăm tuổi, năm nay (2011)

Nhớ chỗ làm, sao chẳng nhớ Khoa

Nhớ chỗ làm, nhớ sân Trường rộng

Về hưu với đồng lương khiêm tốn

Ngậm ngùi thân ta, thương con cháu

Hà Nội, ngày 16/10/2011

Posted in Hậu ĐHBK Hà Nội | Leave a Comment »

Gần về HƯU, vẫn là cán bộ …. TRẺ?!!!

Posted by daothu09 on September 24, 2011

Tính đến hôm nay, tôi đã nghỉ làm theo chế độ, nghĩa là nghỉ hưu theo cách gọi ở VN từ cách đây đến cả hơn nửa thế kỷ, được đúng 01 năm, 10 tháng và 23 ngày.

Tuy đã về hưu, nhưng tôi vẫn thích làm công việc đang dở dang của mình: Dịch máy và Ngôn ngữ học khối liệu, là các lĩnh vực khoa học đang rất cần cho sự phát triển của xã hội hiện nay. Vì vậy, thỉnh thoảng tôi vẫn được mời tham gia các hội nghị, hội thảo, seminar …

Một lần, trong một buổi gặp mặt, tình cờ tôi gặp một tiến sỹ của Trường Đại học Bách khoa Hà Nội, là nơi tôi đã làm việc trọn một đời sự nghiệp của mình, nghĩa là từ khi tốt nghiệp đại học ở Liên Xô về cho đến khi về hưu, kể cả thời gian làm tiến sỹ, tôi vẫn vừa học ở ĐHNN – ĐHQG Hà Nội, vừa lên lớp ở ĐHBK Hà Nội. Rồi cũng rất tình cờ, tôi nghe tiến sỹ đó nói rằng, cho đến hiện nay, trong Trường vẫn coi cán bộ 40 tuổi là cán bộ trẻ?!

Tự nhiên, tôi liên tưởng đến trường hợp của bản thân.

Về công tác tại Trường ĐHBK Hà Nội năm 1977, tôi là cán bộ giảng dạy mới nên phải qua 02 năm tập sự, hưởng lương thời bấy giờ là 75% của 64 đồng. Tập sự là phải dự giờ nhiều, đi họp đầy đủ … Bên cạnh đó, tôi “được” phân công lên lớp 600 giờ / năm, tính ra nhiều đến gấp hơn 02 lần so với cán bộ giảng dạy có thâm niên từ 20 năm trở lên. Vì lúc đó chưa có quy định trả tiền thừa giờ nên tôi cũng chẳng nhận được tiền thừa giờ ngoài 180 giờ chuẩn của mình. Tôi còn “được” công đoàn Bộ môn phân công đi lao động xã hội chủ nghĩa vét sông khi con tôi chưa đầy 20 tháng, trong khi Quy định của Nhà nước cho mẹ được miễn lao động công ích cho đến khi con đầy 36 tháng. Tôi vẫn chăm chỉ làm theo sự phân công của TỔ CHỨC cho dù lúc bấy giờ là thời kỳ “lương thực là bo bo” và hành trang của vợ chồng tôi sau khi tốt nghiệp về nước chủ yếu là sách, cả “núi” sách! Qua 02 năm tập sự, Trưởng Bộ môn, đ/c ĐVG bảo tôi: ”Hay là em làm thêm năm tập sự nữa để không phải dạy nhiều giờ?!!!”. Năm sau đó, Trường bắt đầu có kế hoạch trả tiền dạy thừa giờ cho cán bộ giảng dạy.

Khi tôi đã 45 tuổi, Bí thư Chi bộ và Trưởng Khoa vẫn “xếp” tôi vào loại CÁN BỘ TRẺ, cần phấn đấu nhiều hơn.

Hà Nội, đêm 23/09/2011

Posted in Hậu ĐHBK Hà Nội, Kỷ niệm ĐHBK Hà Nội | Leave a Comment »

VẤN ĐỀ PHÂN TÍCH TỰ ĐỘNG THUẬT NGỮ TRONG KHỐI LIỆU NGÔN NGỮ TIẾNG VIỆT – T/c Từ điển học và BKT, số 4 (12) tháng 7 – 2011

Posted by daothu09 on July 27, 2011

Dr. Dao Hong Thu

Posted in Công trình khoa học, Dịch máy (tự động), Hậu ĐHBK Hà Nội | Leave a Comment »

Sản phẩm trong những phút nghỉ ngơi, giải trí (7)

Posted by daothu09 on July 23, 2011

 

Thảm móc Yoga, 07-2011

Thảm móc Yoga, 07-2011

Posted in Hậu ĐHBK Hà Nội, PHOTO ALBUMS | Leave a Comment »

CHƯƠNG TRÌNH THIẾT KẾ THỬ NGHIỆM TỪ ĐIỂN ẢO SONG NGỮ (Tạp chí Từ điển học và BKT, số 4 (12), 07-2011)

Posted by daothu09 on July 15, 2011

V.A. SHIROKOV, N.N. SIDORCHUK[1]

Đào Hồng Thu (dịch) 

 Lời BBT: Đây là bài báo khoa học của 2 tác giả N. N. Shirokov và N. N. Sidorchuk (từ Ukraina), do chị Victorja Musjuchuk, cán bộ của Viện Hàn lâm Khoa học Quốc gia Ucraina (đang thực hiện các chương trình hợp tác với Viện Khoa học xã hội Việt Nam) gửi cho tạp chí Từ điển học & Bách khoa thư. Bài viết đề cập tới vấn đề thiết kế thử nghiệm biên soạn từ điển song ngữ (trên cứ liệu tiếng Nga và tiếng Ucraina) dựa trên những thành tựu mới nhất của từ điển học ứng dụng công nghệ tin học. Đó là những vấn đề mới, mang tính thời sự, rất đáng tham khảo trong việc biên soạn từ điển ở Việt Nam hiện nay. Xin trân trọng giới thiệu cùng bạn đọc. 

1. Từ điển song ngữ như là cơ sở của từ điển đa ngữ

Trong hệ thống thông tin hiện nay đã thể hiện rất rõ xu hướng đưa công cụ hỗ trợ ngôn ngữ vào việc xử lí các dữ liệu và thông tin kiến thức trên máy tính. Điều này dẫn tới việc cần thiết phải nghiên cứu xây dựng và hoàn thiện các hệ thống trí tuệ nhân tạo để xử lí thông tin bằng ngôn ngữ tự nhiên. Nói riêng, trong bối cảnh hội nhập toàn cầu hiện nay và xu hướng phát triển công nghệ ngôn ngữ chung trên toàn thế giới, đã nẩy sinh vấn đề cấp thiết về việc xây dựng các hệ thống từ điển đa ngữ (L-hệ thống) có khả năng tích hợp được với mạch xử lí tự động hóa văn bản.

Lợi thế của từ điển số hóa là không hạn chế trên thực tế tiềm năng tích hợp các sự kiện ngôn ngữ khác nhau vào một thể thống nhất, khả năng thể hiện sự sống động của ngôn ngữ, hiệu quả trong chuyển dịch theo cấu trúc các hệ thống ngôn ngữ, khả năng tiến hành các thử nghiệm kĩ thuật số và hàng loạt các khả năng khác. Điều này đặc biệt quan trọng đối với các từ điển có dung lượng lớn, được trình bày dưới dạng ấn phẩm in nhiều tập, cũng như đối với các bộ từ điển song ngữ. Không kém phần quan trọng trong việc làm tăng tiến độ từ điển số hóa bằng công nghệ máy tính là khả năng thể hiện trong môi trường số hóa việc sử dụng nhiều lần các cấu trúc và các thành phần của từ điển được tạo nên một lần bởi các nhà chuyên môn như nhà ngôn ngữ, nhà công nghệ ngôn ngữ, chuyên gia khoa học nhận thức, lập trình viên và người làm xuất bản. Khả năng này đặc biệt có ý nghĩa trong mối tương quan với phát triển truyền thông trên cơ sở máy tính và hình thành xã hội đa ngôn ngữ.

Như vậy, nghiên cứu xây dựng các nguyên tắc và công cụ từ điển số hóa đa ngôn ngữ được xác định bởi sự cần thiết phải đảm bảo các chức năng ngôn ngữ dịch, so sánh, đồng bộ, thích ứng giữa các ngôn ngữ và v.v. cho các hệ thống thông tin. Các xu hướng chủ yếu trong lĩnh vực này là tăng số lượng các trường phái dịch thuật, cải thiện chất lượng định dạng thông tin cung cấp cho người sử dụng, tích hợp thông tin của từ điển từ các nguồn khác nhau. Đồng thời, khi xây dựng trực tiếp cấu trúc từ điển của L-hệ thống đa ngôn ngữ như vậy, nếu số ngôn ngữ ≥ 3, sẽ xuất hiện một số vấn đề mang tính tổ hợp. Vấn đề là như sau.

Một trong những yêu cầu cơ bản đối với từ điển đa ngữ số hóa (cũng như đối với dạng khái quát kiểu L-hệ thống của nó) là tính đối xứng. Điều này có nghĩa là nếu theo phần tử đầu vào X bằng ngôn ngữ q ta nhận được phần tử đầu ra Y bằng ngôn ngữ j thì, sau khi chọn phần tử đã nêu Y làm đầu ra, nghĩa là sau khi thực hiện xử lý hệ thống, bắt buộc cần phải chính xác tiến tới phần tử X.

Đối với trường hợp nhiều ngôn ngữ hơn, dĩ nhiên là còn phức tạp hơn. Tóm lại, trên thực tế chỉ có thể tồn tại sơ đồ tương tác cặp đôi các ngôn ngữ. Như vậy, từ điển song ngữ được xác định vị trí một cách tự nhiên là cơ sở đối với việc xây dựng L-hệ thống đa ngữ. Trong trường hợp này, đòi hỏi cả xây dựng các công cụ máy tính tương ứng để đảm bảo giải quyết có hiệu quả các vấn đề nẩy sinh đối với từ điển song ngữ. Như vậy, vai trò của các hệ thống từ điển song ngữ số hóa và các phương pháp tích hợp chúng không ngừng lớn mạnh.    

2. Khái niệm cơ bản về Lhệ thống

Ở đây, các hệ thống từ điển thuộc nhóm công cụ, nghĩa là dùng để xây dựng các nguồn tài nguyên của từ điển, đóng vai trò đặc biệt quan trọng. Để giải quyết vấn đề một cách hiệu quả, nhiệm vụ này đòi hỏi hệ thống khái niệm chính thức đồng nhất, trong đó bao gồm toàn bộ các thành phần cơ bản mô hình hóa ngôn ngữ trong từ điển bằng một số cách trình bày thống nhất.

Chúng ta dừng lại ở phần trình bày cơ sở khái niệm về công cụ hỗ trợ các hệ thống từ điển song ngữ đã và đang được nghiên cứu xây dựng tại Ban lưu trữ Thông tin và ngôn ngữ Ucraina, Viện Hàn lâm Khoa học Quốc gia Ucraina. Việc thực hiện nguyên tắc mô hình hóa khái niệm đã được chúng tôi sử dụng khi nghiên cứu xây dựng toàn bộ các hệ thống theo phân loại như vậy dẫn đến tất yếu phải sử dụng các cấu trúc L-hệ thống trong kiến trúc ANSI/X3/SPARK hoặc đơn giản là ANSI/SPARK. Chúng tôi sử dụng các thành phần kiến trúc cơ bản ANSI/SPARK trong giải trình sau đây:

Chúng ta dừng lại ở việc giải thích các phần tử kiến trúc.

Mô hình khái niệm chuyên ngành (mức độ khái niệm trình bày) là mô hình ngữ nghĩa, semiotic (hiện tượng – ND), trong đó những trình bày của các chuyên gia khác nhau theo một chuyên ngành được tích hợp dưới dạng nhất quán, hữu hạn và đơn nghĩa.

Mô hình trong (mức độ trình bày bên trong) xác định thể loại, cấu trúc và định dạng cách trình bày, lưu trữ và xử lí dữ liệu, khung thuật toán và môi trường lập trình có chứa mô hình khái niệm khi thao tác máy tính.

Mô hình ngoài (mức độ trình bày bên ngoài) phản ánh quan điểm của người sử dụng đầu cuối, và do đó, của lập trình viên ứng dụng đối với hệ thống thông tin.

Các lược đồ được xây dựng sao cho biểu đồ:

giao hoán: ξ ° ψ  = φ. Yêu cầu giao hoán biểu đồ là đáng kể, bởi vì nó đảm bảo sự phối hợp chặt chẽ của toàn bộ các mức độ kiến trúc.3. Các hệ thống từ điển chính thứcChúng tôi giả định rằng toàn bộ công cụ hỗ trợ L-hệ thống đòi hỏi truy cập từ xa, đồng bộ hóa dữ liệu và phân bổ công việc cho những người sử dụng được thiết kế và nghiên cứu xây dựng theo nguyên tắc chương trình thiết kế thử nghiệm từ điển ảo trong môi trường số[2].
Đặc điểm của chương trình thiết kế thử nghiệm từ điển ảo trong môi trường số như vậy là:
  • lưu trữ tập trung và quản lí hành chính các dữ liệu từ điển;
  • tương tác giữa các chủ thể và khách thể của chương trình thiết kế thử nghiệm từ điển ảo trong môi trường số bằng chế độ thời gian thực;
  • cô lập đối với những người sử dụng đầu cuối một vài chức năng cho phép, một mặt, chuyển đến được cho người sử dụng thông tin cần thiết mới nhất, mặt khác, loại bỏ được khả năng truy cập trái phép và những tấn công mạng độc hại nào đó.

 Thực tế của vấn đề là tạo điều kiện cho các nhà ngôn ngữ hiện đang làm việc tại các cơ quan, thành phố và thậm chí các nước khác nhau có thể truy cập được các hệ thống máy tính với mục đích thực hiện một cách tập thể các dự án lớn về ngôn ngữ. Hơn nữa, xu hướng phát triển truyền thông hiện nay trên cơ sở máy tính, và trước hết, qua internet đã kích thích tăng cường hoạt động và trao đổi đối thoại về các quá trình từ điển học trên mạng.

Tổ chức hỗ trợ

Trong quá trình nghiên cứu xây dựng các hệ thống từ điển ảo, chúng tôi đã sử dụng các nguyên tắc cơ bản của cái gọi là phương pháp tiếp cận hướng hỗ trợ.

 

Hình 1. Phương pháp tiếp cận hướng hỗ trợ đối với việc xây dựng chương trình thiết kế thử nghiệm từ điển ảo trong môi trường số

 Sự phức tạp trong tương tác giữa các hệ thống từ điển là ở hai yêu cầu đối lập. Một mặt, API (giao thức kết nối từ các ngôn ngữ lập trình để sử dụng – ĐHT) biểu thị các chức năng hệ thống cần có khả năng đạt được mức độ độc lập cao và không phụ thuộc vào môi trường thực hiện. Mặt khác, lại cần duy trì khả năng tích hợp các công cụ này, tổ chức tương tác giữa chúng, đồng thời bảo tồn được tính tự chủ của chúng. Hình 1 biểu thị sơ đồ tổ chức tương tác bằng ví dụ về hỗ trợ của hai hệ thống từ điển.

L-hệ thống có kho lưu trữ dữ liệu tách biệt. Phần hỗ trợ biểu thị API, cần thiết cho việc thao tác bằng các dữ liệu này, xử lí, lọc, cải biến chúng và v.v. Đồng thời, cùng một kho lưu trữ dữ liệu có thể tồn tại một vài giao thức hỗ trợ.

Cơ sở kiến trúc của công cụ hỗ trợ là tổ chức lưu trữ của chúng mà chức năng cơ bản của tổ chức này là lọc các yêu cầu hỗ trợ, xác lập các quyền hạn dựa vào vai trò của người sử dụng. Và trực tiếp là phụ trương khách hàng cung cấp giao thức biểu đồ đối với công việc của người sử dụng. Một phụ trương khách hàng có thể xác lập liên kết với vài công cụ hỗ trợ, hơn nữa, đồng thời tích hợp chức năng của một số hệ thống từ điển.

Phương pháp tiếp cận chung đối với việc xây dựng hệ thống song ngữ

Sơ đồ khái niệm chung về xây dựng L-hệ thống song ngữ ảo tích hợp được biểu thị ở hình 2.

Ví dụ về L-hệ thống song ngữ

Việc phân tích hàng loạt từ điển song ngữ đã xác định được, theo quan điểm chúng tôi, cấu trúc bên trong tối ưu lưu trữ nguồn dữ liệu của từ điển.
Tương ứng với các thời kì cơ bản của tiểu thiết kế hệ thống, quá trình phân loại và xác định đối tượng của L-hệ thống song ngữ đã được thiết lập, thủ tục chuẩn hóa các khái niệm cơ bản và trừu tượng đã được tiến hành. Cấu trúc bên trong được biểu thị ở hình 3.

Hình 3. Cấu trúc bên trong mục từ của từ điển

Cấu trúc của hệ thống từ điển bao gồm hàng loạt các phần tử tùy ý có thể phủ đầy nội dung trình bày bên trong phần phổ biến nhất của L-hệ thống song ngữ. Vì vậy, cấu trúc nêu trên được sử dụng như cấu trúc nền. Chúng ta dừng lại ở phần các giao diện bên ngoài của hệ thống song ngữ.

Chương trình thiết kế thử nghiệm từ điển ảo không hạn chế số lượng ngôn ngữ và có thể mở rộng nhằm bổ sung các ngôn ngữ mới cho hệ thống. 

Ngôn ngữ giao thức là chức năng trong từ điển song ngữ, khác với trong từ điển đơn ngữ, chuyển đổi từ chức năng hỗ trợ tùy ý sang dạng bắt buộc và có nhiệm vụ đảm bảo thay đổi giao diện tối thiểu bằng hai ngôn ngữ.

Xác nhận đúng là thủ tục bắt buộc, bởi vì chúng ta làm việc với hệ thống đầy đủ chức năng, cho phép hiệu chỉnh và loại bỏ thông tin từ điển.

Hình 4. Đăng kí người sử dụng

 Sau khi đăng kí sử dụng thành công, chúng ta vào cửa sổ chính chương trình của hệ thống từ điển song ngữ tương ứng.

Hình 5. Giao diện bên ngoài của hệ thống từ điển song ngữ

 Người sử dụng có thể tải vài hệ thống song ngữ trên cùng một cửa sổ giao diện.

Phía bên trái cửa sổ chính là mục từ của hệ thống. Lựa chọn đơn vị cụ thể của mục từ cho phép xem lướt các mục từ trong từ điển ở dạng bình thường, gần với mục từ của từ điển in trên giấy.

Đặc điểm của hệ thống song ngữ này là trong khoảng thời gian thực, từ cơ sở các dữ liệu hình thành thêm ba mục từ, cụ thể là: mục tập hợp từ, mục các từ dịch tương đương và mục tập hợp từ dịch tương đương. Điều này đảm bảo cho việc bổ sung các mục từ của từ điển và tạo thuận lợi bằng cách thay đổi tự động hướng dịch trong phạm vi một từ điển. Ví dụ, từ tiếng Nga «Ячейка» có trong thành phần của ba mục từ của từ điển là «комірка» (ô, ngăn), «осередок» (cơ sở, chi bộ), «чарунка» (lỗ, mắt), từ tiếng Nga «хлопотать» có trong thành phần của 10 mục từ của từ điển (hình 6). 

Hình 6. Mục các từ dịch tương đương

Do vậy, khi lựa chọn tập hợp từ, người sử dụng nhận được mục từ của từ điển có chứa tập hợp từ này.

Trong mục từ có các chức năng tìm kiếm, chức năng phân loại theo trật tự thuận nghịch và chức năng lọc.

Bộ lọc cho phép tách phần mục từ “mở đầu”, “chứa đựng”, “kết thúc” hoặc “không chứa” văn bản nào đó.

Mục từ của từ điển được thể hiện dưới dạng đánh dấu nền và thay đổi dấu nền khi chọn mục từ khác. Chúng tôi có tính đến nhu cầu của người sử dụng là mong muốn thấy được đồng thời vài mục từ trong từ điển. Để thực hiện được điều này, cần phải định hình dấu nền và nó sẽ hiển thị trên màn hình, không phụ thuộc vào mục từ khác đang được hiển thị, cho đến khi người sử dụng đóng nó lại.

Hiển nhiên là có các chức năng thay đổi cỡ chữ, tìm kiếm bên trong mục từ, thay đổi dạng nền mục từ, in văn bản và, tất nhiên, hiệu chỉnh mục từ. Khi hiệu chỉnh, mục từ được biểu thị dưới dạng cây bằng truy cập trực tiếp tới phần tử cấu trúc bất kỳ (hình 7).

Hình 7. Cửa sổ hiệu chỉnh mục từ

Phương pháp tiếp cận hiệu chỉnh như vậy cho phép giám sát thông tin đầu vào, phong chống kịp thời sự hủy hoại cấu trúc và khả năng quan sát mục từ từ vị trí khác.

Việc mở rộng hệ thống chương trình thiết kế thử nghiệm từ điển ảo được thực hiện qua trình duyệt internet bằng cách sử dụng cái gọi là công nghệ ClickOnce.

Sau khi nhận được các dữ liệu xác thực cần thiết, người sử dụng làm việc với chương trình thiết kế thử nghiệm từ điển ảo từ xa với đầy đủ các chức năng được thực hiện trong điều kiện môi trường địa phương. Hơn nữa, để điều khiển phiên bản chương trình khách hàng trong trường hợp chương trình lỗi thời, có chương trình hỗ trợ tự động cập nhật.

Toàn bộ hoạt động của người sử dụng được cung cấp tài liệu qua máy chủ. Vì vậy, tại bất kì thời điểm nào cũng đều hiện thị rõ khung cảnh phát triển thực của sản phẩm từ điển, của dung lượng công việc đã được thực hiện và các sự kiện tác giả về thay đổi dữ liệu trong từ điển.

Tích hợp với các công cụ hỗ trợ khác của hệ thống từ điển

Sử dụng phương pháp tiếp cận hướng công cụ hỗ trợ đã cho phép tích hợp với các công cụ hỗ trợ từ điển khác. Trong sản phẩm của chương trình này, đã thực hiện liên kết với các công cụ hỗ trợ là từ điển giải thích nghĩa (tiếng Ucraina và tiếng Nga), từ điển ngữ pháp (tiếng Ucraina), khối liệu ngôn ngữ quốc gia Ucraina.

Khi sử dụng menu chu cảnh đối với các đơn vị đăng kí, chúng ta có thể nhận được mục từ từ từ điển ngữ pháp biểu thị hình thái từ, mục từ của từ điển giải thích nghĩa và chu cảnh của từ (ví dụ như đối với từ «добро», hình 8). Lưu ý rằng các công cụ hỗ trợ của từ điển giải thích nghĩa, từ điển ngữ pháp và khối liệu ngôn ngữ, về nguyên tắc, không nhất thiết cần cho các chức năng của từ điển song ngữ.

Đối với mỗi công cụ hỗ trợ trong số đã nêu đều có thực hiện chương trình khách hàng truy cập, cung cấp các chức năng mở rộng.

Đặc điểm như vậy cho phép nhận dạng các sơ đồ giao diện với tập hợp bất kì các chức năng của công cụ hỗ trợ.

Phiên bản thử nghiệm chương trình ảo song ngữ được xây dựng tại Ban Lưu trữ Thông tin và Ngôn ngữ Ucraina, Viện Hàn lâm Khoa học Ucraina và có thể được sử dụng làm công cụ thiết thực để phân bố khi tiến hành thực hiện các dự án quốc tế về từ điển song ngữ và đa ngữ.

 

Hình 8. Tích hợp công cụ hỗ trợ của các hệ thống từ điển khác nhau

 ĐÀO HỒNG THU dịch từ nguyên bản tiếng Nga:  Двуязычные виртуальные лексикографические лаборатории, авторы: В.А. Широков, Н.Н. Сидорчук (Украинский языково-информационный фонд Национальной академии наук Украины)

THÔNG TIN VỀ TÁC GIẢ

Giáo sư Tiến sĩ Khoa học Vladimir Anatol’evich Shirokov (Владимир Анатольевич Широков), Viện sĩ thông tấn Viện Hàn lâm Khoa học Ukraina, Giám đốc Ban Lưu trữ Thông tin – Ngôn ngữ Ukraina. Ông là nhà khoa học nghiên cứu ngôn ngữ toán và ứng dụng, từ điển học, người đặt nền móng trường phái Công nghệ Ngôn ngữ tại Ukraina; Giải thưởng Nhà nước về Khoa học và Kĩ thuật; Tác giả lí thuyết thông tin về các hệ thống từ điển. Ông là người sáng lập và quản lí chương trình điện tử “Từ điển Ukraina” đã được đề xướng do sắc lệnh của Tổng thống Ukraina năm 1999.

Tiến sĩ Nadezhda Nikolaeva Sidorchuk (Надежда Николаевна Сидорчук), cán bộ khoa học Ban Lưu trữ Thông tin – Ngôn ngữ Ukraina thuộc Viện Hàn lâm Khoa học Ukraina.

Ban Lưu trữ Thông tin – Ngôn ngữ Ukraina Viện Hàn lâm Khoa học Ukraina thành lập 21 – 5 – 1991. Xu hướng nghiên cứu khoa học chủ yếu của Ban là:

– nghiên cứu cấu trúc ngôn ngữ tự nhiên;

– thành lập và bổ sung lưu trữ cơ bản tiếng Ukraina và những thứ tiếng khác cũng như các cơ sở tri thức ngôn ngữ;

– khai thác và sáng tạo hệ thống thông tin ngôn ngữ (từ điển và sách giáo khoa truyền thống và điện tử, hệ thống giảng dạy và chuyên gia, hệ thống khai thác tự động ngôn ngữ tự nhiên);

– phối hợp tại Ukraina tất cả các nghiên cứu trong ngành ngôn ngữ học máy tính và tri nhận, từ điển học, liên hệ với các tổ chức chuyên ngành trên thế giới;

– giữ gìn và đảm bảo hoạt động đối tượng khoa học là di sản nhà nước “Cơ sở ngữ liệu từ điển nhà nước của Ban Lưu trữ Thông tin – Ngôn ngữ”. 

     ИНФОРМАЦИЯ ОБ АВТОРЕ

Владимир Анатольевич Широков, член-корреспондент НАН Украины, доктор технических наук, профессор, директор Украинского языково-информационного фонда НАН Украины. Ученый в области математической и прикладной лингвистики и лексикографии, фундатор отечественной научной школы лингвистической технологии, лауреат Государственной премии Украины в области науки и техники, автор информационной теории лексикографических систем. Он является автором и координатором электронной программы «Словари Украины», инициированной Указом Президента Украины в 1999 г.

Надежда Николаевна Сидорчук, кандидат технических наук, научный сотрудник Украинского языково-информационного фонда Национальной академии наук Украины.

Украинский языково-информационный фонд Национальной академии наук Украины основан 21.05.1991 г. Основные научные направления Украинского языково-информационного фонда:

– исследование системной структуры естественного языка;

– создание и ведение фундаментального архива украинского языка и других языков и лингвистических баз знаний;

– разработка и создание информационно-лингвистических систем (традиционных и компьютерных словарей, учебников, учебных, экспертных систем, систем автоматизированной обработки естественного языка);

– координация в Украине исследований в отрасли компьютерной и когнитивной лингвистики и лексикографии, установление связей со специализированными организациями мира в указанной отрасли;

– сохранение и обеспечение функционирования научного объекта, который является национальным достоянием: «Национальная словарная база Украинского языково-информационного фонда».

SUMMARY

This article by the two Ukrainian authors touches upon a test design of the compilation of bilingual dictionaries (based on Russian and Ukrainian language data), with the latest achievements of lexicography applying information technology. These are novelties, topical questions , though rather complex yet very necessary and worth referring to in compiling dictionaries in Vietnam today.


[1]GS TSKH В. А. Широков, TS Н. Н. Сидорчук, Ban lưu trữ Thông tin và Ngôn ngữ Ukraina, Viện Hàn lâm Khoa học Quốc gia Ukraina. 
[2] Khái niệm chương trình thiết kế thử nghiệm từ điển ảo trong môi trường số lần đầu tiên được V.A. Shirokov sử dụng trong chuyên luận “Lí thuyết thông tin về hệ thống từ điển” [Kiev, Dovira, 1998, 331 tr.].

Posted in Công trình khoa học, Dịch văn bản KH, Hậu ĐHBK Hà Nội | Leave a Comment »

Nhớ con

Posted by daothu09 on July 13, 2011

Thu tới, Thu về, lại nhớ mong

Ngồi chơi hưu quạnh ở trong phòng

Mơ màng liên tưởng thời Thu nhỏ

Nên đã thành công Tiến sỹ xong

Bao năm lận đận nay vui vẻ

Con cháu đề huề thỏa ước mong

                       Gò Vấp, tháng 02 – 2011

                      Mẹ Văn Thúy Liên (87 tuổi)

Posted in Hậu ĐHBK Hà Nội, Truyện ngắn và Thơ | Leave a Comment »

Sản phẩm trong những phút nghỉ ngơi, giải trí (6)

Posted by daothu09 on June 7, 2011

Thảm móc từ len vụn, 05/2011

 

Thảm móc từ len vụn, 05/2011

Posted in Hậu ĐHBK Hà Nội, PHOTO ALBUMS | Leave a Comment »

Từ điển thuật ngữ Ngôn ngữ học khối liệu Việt – Anh (Vietnamese – English Glossary of Corpus Linguistics)

Posted by daothu09 on May 18, 2011

Việt

Anh

bộ chú giải từ vựng part-of-speech tagger
bộ kiểm định ngữ âm spelling checker
bộ kiểm định phong cách ngôn ngữ style checker
bộ kiểm định văn bản chung general text checker
bộ phân tích cú pháp parser/syntactic parser
chú giải annotation
chú giải âm điệu prosodic annotation
chú giải đại từ (chú giải trùng lặp) anaphoric annotation
chú giải nghĩa semantic annotation
chú giải thuyết trình discoursal annotation
chuẩn mã hóa khối liệu CES
chuẩn mã hóa văn bản TEI
chương trình chú giải từ vựng TAGGIT
chương trình Cocoa COCOA references
chương trình đối tượng entity reference
cơ sở dữ liệu thuật ngữ terminology databases
cơ sở dữ liệu từ vựng lexical data base (LDB)
công cụ ghép tự động automatic hyphenizer
công cụ giải đáp query(ing) tools
công cụ miền thông dụng public domain tools
công cụ ngôn ngữ máy tính CL tools
công nghệ ngôn ngữ Language Engineering (LE)
dẫn mục concordance
danh mục tần số sử dụng frequency list
dịch máy Machine Translation (MT)
dịch máy có hỗ trợ computer-aided translation (CAT)
đồng ngữ cảnh co-text
đồng tệp từ collocation
đồng trật tự collocate
ghi âm phonetic transcription
hệ thống chú giải Cutting Cutting tagger
hệ thống chú giải tự động CLAWS
hệ thống quản trị thuật ngữ terminological management system (TMS)
học với sự hỗ trợ của máy tính computer-aided learning / computer-assisted language learning (CALL)
hướng dẫn chuẩn mã hóa văn bản TEI Guidelines
khoảng cách span
khối liệu corpora
khối liệu bão hòa saturated corpus
khối liệu cân bằng balanced corpus
khối liệu cấu trúc hình cây treebank
khối liệu chủ monitor corpus
khối liệu chú giải annotated corpus
khối liệu chuyên dụng special corpus
khối liệu đa ngữ multilingual corpus
khối liệu đối chiếu comparable (reference) corpus
khối liệu đơn ngữ monolingual corpus
khối liệu không chú giải unannotated corpus
khối liệu khuyến mại opportunistic corpus
khối liệu mẫu sampled corpus
khối liệu phát âm spoken corpus
khối liệu song song parallel (aligned) corpus
khối liệu tham khảo reference corpus
mã hóa encoding
mô tả hệ thống WSD
ngân hàng dữ liệu thuật ngữ terminological data bank (TDB)
ngôn ngữ học khối liệu Corpus Linguistics
ngôn ngữ học máy tính Computational Linguistics (CL)
ngôn ngữ mã hóa theo chuẩn SGML
nguồn từ vựng Lexical Resources/Data
nhãn tag
nhãn cú pháp part-of-speech tagging
nhãn cùng kiểu ditto tagging, ditto tag
nhãn định hướng problem-oriented tagging
nhãn từ kết hợp portmanteau tag
nhóm mã phục hồi cơ bản base tagset
nút từ node
phần đầu trang header
phân nhỏ văn bản Text Chunking
phân tích cú pháp parsing
phân tích cú pháp đầy đủ full parsing
phân tích cú pháp phần khung skeleton parsing
phê chuẩn validation
sản phẩm products
sản phẩm giải nén ngôn ngữ Lingware/Language Engineering Tools
tài nguyên ngôn ngữ Language/Linguistics Resources
tạo đơn nghĩa disambiguation
tệp nhãn tagset
thẩm định chuẩn kĩ thuật ngôn ngữ EAGLES
tính phục hồi recoverability
trí tuệ nhân tạo Artificial Intelligence (AI)
từ khóa trong ngữ cảnh KWAL
từ khóa và đường nối KWIC
từ vị hóa lemmatisation
từ vựng lexicon
từ vựng dành cho máy machine lexicon
từ vựng trong ngôn ngữ máy tính computational linguistic lexicon
xác định đường nối alignment
xác định kiểu văn bản DTD
xử lí khối liệu Corpus Processing
xử lí ngôn ngữ tự nhiên Natural Language Processing (NLP)

TÀI LIỆU THAM KHẢO

  1. Aarts J., Meijs W. (1990). Theory and Practice in Corpus Linguistics. Amsterdam: Rodopi.

  2. Bright W. (1992). International Encyclopedia of linguistics. New York: Oxford University Press.
  3. Carter R. (2004). Language and creativity. The art of common talk. London: Routledge.
  4. Halteren H., van den Heuvel T. (1990). Linguistic Exploitation of Syntactic Databases. Amsterdam: Rodopi.
  5. Hutchins W.J., Sommers H.L. (1986). An introduction to machine translation. London: Academic Press.
  6. Leech G. (1991). The state of art in corpus linguistics. Aijmer and Altenberg, 8-29.
  7. Mahlberg M. (2007). Corpus stylistics: bridging the gap between linguistic and literary studies. London: Continuum.
  8. McEnery T., Wilson A. (1996). Corpus Linguistics. Edinburgh: Edinburgh University Press.
  9. Nespor M., Vogel I. (1990). Prosodic Phonology. Dordrecht: Foris.
  10. Oostdijk N., de Haan P. (1994). Corpus-based research into language. Amsterdam: Rodopi.
  11. Sinclair J. (2004). Trust the Text. Language, corpus and discourse. London: Routledge.
  12. Souter C. (1993). Towards a standard format for parsed corpora. Aarts et al. 197-212.
  13. Souter C., Atwell E. (1993). Corpus Based Computational Linguistics. Amsterdam: Rodopi.
  14. Sparck Jones K. (1992). Natural language processing: an overview. Bright 1992, Vol. 3, 53-59.
  15. Scott M., C. Tribble (2006). Textual Patterns. Key words and corpus analysis in language education. Amsterdam: Benjamins.
  16. Wynne M. (2005). Developing Linguistic Corpora: a guide to good practice. Oxford: Oxbow Books.
  17. Đào Hồng Thu (2007). Ngôn ng hc khi liu (Corpus) (phn 1). Tp chí Ngôn ng và Đi sng. Số 7 (141), tr.9-13.
  18. Đào Hồng Thu (2008). Khi liu – đc trưng và phân loại. Tạp chí Ngôn ngữ và Đời sống. Số 1+2 (147+148), tr.23-26.Đào Hồng Thu. http://corling.wordpress.com

Posted in Hậu ĐHBK Hà Nội, Từ điển Ngôn ngữ học khối liệu | Leave a Comment »

Niềm vui đầu tiên

Posted by daothu09 on April 26, 2011

Lần Hội thảo Ngữ học toàn quốc tháng 04/2011 này, tôi được hưởng niềm vui đầu tiên kể từ lần đầu tiên tôi công bố nghiên cứu khoa học về ngôn ngữ học khối liệu (Corpus Linguistics) tại Việt Nam vào tháng 03 năm 2007. Sau 04 năm trời vất vả vì khoa học: KHÔNG TIỀN TÀI TRỢ và v.v., tôi đã thấy có những nghiên cứu sinh về ngôn ngữ bắt đầu sử dụng các khối liệu tiếng Anh sẵn có sau khi đọc các bài báo của tôi. 

Bước đầu thành công rồi!

Hà Nội, ngày 26/04/2011

Đào Hồng Thu

Posted in Hậu ĐHBK Hà Nội, Ngôn ngữ và Văn hóa, Truyện ngắn và Thơ | Leave a Comment »

Sản phẩm trong những phút nghỉ ngơi, giải trí (5)

Posted by daothu09 on April 11, 2011

Áo đan biếu Mẹ, 02 / 2011

Áo đan biếu Mẹ, 02 / 2011

Áo đan biếu Mẹ, 02 / 2011

Áo đan biếu Mẹ, 02 / 2011

Áo đan biếu Mẹ, 02 / 2011

Posted in Hậu ĐHBK Hà Nội, PHOTO ALBUMS | Leave a Comment »

Sản phẩm trong những phút nghỉ ngơi, giải trí (4)

Posted by daothu09 on March 30, 2011

Áo móc năm 2010

Áo móc năm 2010

Áo móc năm 2010

Hà Nội, ngày 30/03/2011

Posted in Hậu ĐHBK Hà Nội, PHOTO ALBUMS | Leave a Comment »