Mễ A Luân
Đã nhiều năm nay, thuyết “chữ Hán ưu việt” rất thịnh hành ở Trung Quốc. Thuyết này trái ngược nghiêm trọng với các nguyên lí khoa học kĩ thuật, gây ra sự ngộ nhận lớn trong xã hội và cho sự phát triển khoa học và công nghệ thông tin Trung văn. Do vậy, Trung Quốc cần phải tiến hành dọn sạch các sai lầm của thuyết “chữ Hán ưu việt”.
I. Năm 1989, thuyết “chữ Hán ưu việt” bắt đầu tràn ngập đại lục Trung Quốc. Quan điểm phổ biến nhất hồi đó là: Trong các văn kiện của Liên hợp quốc, những tệp văn kiện in chữ Hán có độ dày nhỏ nhất cho nên chữ Hán ưu việt hơn các loại ngôn ngữ như Anh văn… Vì người cổ xúy cho thuyết này từng làm công tác phiên dịch tại trụ sở Liên hợp quốc nên quan điểm đó đã làm nhiều người nhầm lẫn1.
Ta đều biết, khi tiến hành bất kì sự so sánh nào phải có một tiền đề tối thiểu: điều kiện và phương thức phải như nhau. Thế nhưng cách viết tiếng Anh và cách viết chữ Hán là hai phương thức có điều kiện khác nhau: tiếng Anh dùng cách viết nối liền một dòng đơn (đơn tuyến) các kí tự chữ cái còn chữ Hán dùng cách vẽ các nét bộ thủ trên bình diện. Nếu các nét bộ thủ ấy cũng dùng cách viết liền các kí tự trên một dòng thì độ dài của dòng cần thiết cho một chữ Hán thường là lớn hơn dòng viết chữ cái tiếng Anh. Nếu các từ tiếng Anh cũng dùng cách vẽ trên bình diện thì không gian bình diện cần vẽ chẳng khác mấy so với chữ Hán.
Như vậy, quan điểm nói “trong các văn kiện của Liên hợp quốc, những tệp văn kiện in chữ Hán có độ dày nhỏ nhất, cho nên chữ Hán ưu việt hơn các loại ngôn ngữ như Anh văn” là hoàn toàn không có chút thường thức tối thiểu về so sánh, phân tích. Sự so sánh như thế là không có ý nghĩa gì hết.
II. Những người cổ xúy thuyết “chữ Hán ưu việt” nói: vì chữ Hán có lượng thông tin bình quân (平均信息量 – average information content) lớn nên chữ Hán ưu việt hơn tiếng Anh.
Nguyên lí cơ bản của khoa học thông tin cho thấy: lượng thông tin bình quân của hệ thống kí hiệu mà dữ liệu sử dụng càng lớn thì tính bất ổn định và phí tổn (tiêu hao) của hệ thống đó càng lớn, là yếu tố bất lợi cho việc quản lí và truyền thông tin.
Quan niệm cứ thấy “lớn” thì cho là tốt đã chiếm lĩnh đầu óc của nhiều người, bởi vậy khi thấy nói “chữ Hán có lượng thông tin bình quân lớn”, người ta bèn đoán mò rằng điều đó thật là “ưu việt” xiết bao. Họ đâu có biết rằng đấy chính là yếu tố bất lợi cho việc quản lí và truyền dữ liệu. Lấy “chữ Hán có lượng thông tin bình quân lớn” làm lí do cho quan điểm “chữ Hán ưu việt” là việc làm đi ngược lại nguyên lí khoa học và tri thức cơ bản của lí thuyết thông tin.
III. Những người cổ xúy thuyết “chữ Hán ưu việt” nói: trong thao tác máy tính, đưa chữ Hán vào máy tính nhanh hơn tiếng Anh, chỉ gõ vài phím là màn hình đã xuất hiện cả một cụm từ hoặc câu ngắn còn tiếng Anh phải gõ từng chữ cái, vì thế chữ Hán “ưu việt” hơn tiếng Anh.
Đây là cách nói thiếu hiểu biết về máy tính bởi nguyên lí đưa vào lấy ra từ máy tính đều biết rằng mối quan hệ giữa cách hiển thị kí tự và việc thao tác bàn phím hoàn toàn là quy định của trình tự do con người làm ra.
IV. Thuyết “chữ Hán ưu việt” còn có một phát biểu nữa: “Vì chữ Hán có đặc điểm tượng hình, biểu ý nên nó đặc biệt thích hợp dùng cho khoa học kĩ thuật hiện đại, là thứ ngôn ngữ máy tính lí tưởng”.
Nói như thế là không đúng sự thật, cũng không hợp với nguyên lí làm việc của máy tính.
Từ ngày công nghệ máy tính Trung văn bắt đầu phát triển, thời gian dùng cho việc làm ra phương pháp đưa chữ Hán vào máy tính đã tốn mất hơn 30 năm, kinh phí và nhân lực bỏ ra lại càng không thể tính toán được. Thế nhưng cho tới nay, do kho dữ liệu chữ Hán vẫn không đủ dùng, việc đăng kí hộ khẩu tại cơ quan công an, đăng kí chủ tài khoản ngân hàng từng nhiều lần xảy ra trục trặc, khó xử, vấn đề truyền và xử lí dữ liệu Trung văn xảy ra loạn mã cho đến nay cũng chưa hoàn toàn giải quyết xong. Kho dữ liệu chữ Hán hiện có là nhị tự tiết2, muốn bao gồm tất cả các chữ Hán thì tất phải dùng tứ tự tiết, khi đó chẳng nói cũng biết là giá thành sẽ cao và hiệu suất sẽ thấp. Điều đáng chú ý nữa là cứ cho rằng đã hoàn tất việc xây dựng kho dữ liệu chữ Hán đi, thì cũng không thể đáp ứng nhu cầu quản lí toàn diện dữ liệu Trung văn.
Cái gọi là “ngôn ngữ máy tính” vừa không phải là Anh văn lại cũng chẳng phải là Trung văn hoặc kí hiệu văn tự nào khác loài người đang sử dụng. Nó là ngôn ngữ hệ nhị phân do “0” và “1” hợp thành, tức “ngôn ngữ máy”. Cho dù dữ liệu thuộc chủng loại hình vẽ, âm thanh hay chữ viết, việc xử lí máy tính của chúng đều được hoàn thành bởi thao tác đóng mở công-tắc chế độ nhị phân, hoàn toàn không có quan hệ gì với việc kí hiệu văn tự nó sử dụng là tượng hình, biểu ý và với cách viết thư pháp của nó. Nếu kí hiệu chữ Hán là “ngôn ngữ máy tính lí tưởng hơn” hệ nhị phân, thế thì tại sao trên thế giới chưa có một máy tính nào (kể cả máy tính Trung Quốc sử dụng) bỏ hệ nhị phân, sử dụng hệ kí hiệu chữ Hán để thiết kế chế tạo?
V. Từ lâu Chính phủ Trung Quốc đã công bố Phương án bính âm3 Hán ngữ hiện đại (Scheme for Chinese phonetic alphabet) và các quy phạm tiêu chuẩn ngôn ngữ văn tự như Chính từ pháp (正词法 – orthography, phép chính tả, của bính âm Hán ngữ)… cùng các quy phạm tiêu chuẩn quốc tế được các tổ chức quốc tế chính thức như Liên hợp quốc tiếp nhận sử dụng trên toàn cầu. Thế nhưng những người cổ xúy thuyết “chữ Hán ưu việt” lại nói các quy phạm tiêu chuẩn đó là “tả khuynh” và “mù quáng phương Tây hóa”. Họ chủ trương trở về “Chú âm chữ Hán” (汉字注音) cách nay ngót trăm năm. Do sự dẫn dắt sai lầm nghiêm trọng của thuyết “chữ Hán ưu việt”, hiện nay hầu hết tài liệu Trung văn và nhiều tài liệu chữ viết phát hành trong, ngoài Trung Quốc đều dùng phương pháp “Chú âm chữ Hán”, đem lại hậu quả tiêu cực nghiêm trọng cho công tác quản lí dữ liệu Trung văn. Ví dụ câu “Bắc Kinh là thủ đô Trung Quốc”, theo phương thức viết bính âm Hán ngữ hiện đại của quy phạm tiêu chuẩn quốc gia, viết là: “Beijing shi Zhongguo de shoudu” nhưng phương thức viết “Chú âm chữ Hán” do thuyết “chữ Hán ưu việt” chủ trương lại viết “bei jing shi zhong guo de shou du”, đến khi xử lí dữ liệu thì phương thức là “beijingshizhongguodeshoudu”. Chẳng cần nói nhiều, dùng phương thức này để xử lí dữ liệu Trung văn sẽ đem lại phí tổn lớn hoàn toàn không cần thiết cho việc phán đoán ranh giới từ (词界 – word boundary), khiến cho những việc xử lí dữ liệu như tra cứu, xếp thứ tự, tự động phiên dịch sẽ xảy ra nhiều sai lầm khác nghĩa, làm giảm đáng kể hiệu suất công việc, thậm chí làm cho công tác quản lí vốn dĩ có thể hoàn thành một cách thoải mái lại trở nên khó hoàn thành. Hơn nữa, cho dù có thể thể tất chuyện khác nghĩa thì vấn đề giá thành cao vẫn vượt quá sức tưởng tượng. Chính vì thế mà bao năm nay, việc nghiên cứu các công nghệ đọc tự động và dịch tự động của Trung Quốc hầu như không có tiến triển thực chất nào.
Xét từ góc độ lịch sử văn hóa, cách viết Trung văn đã nhập khẩu phương pháp đánh dấu chấm câu của phương Tây, làm cho văn tự chữ Hán biểu đạt rõ ràng, chuẩn xác và dễ đọc hơn, tạo điều kiện cho việc xóa nạn mù chữ và giúp nhiều người hưởng cơ hội học tập. Cũng với lí lẽ như vậy, việc sử dụng các phương pháp như Chính từ pháp để xác định ranh giới từ đã làm cho cách viết Hán ngữ tiến thêm một bước theo hướng rõ ràng, chuẩn xác và dễ đọc, có ý nghĩa tích cực quan trọng đối với việc phát triển công nghệ thông tin Trung văn và hiện đại hóa văn hóa. Việc áp dụng cách “Chú âm chữ Hán” như chủ trương của thuyết “chữ Hán ưu việt” chẳng những là sự thụt lùi văn hóa và tạo trở ngại con người gây ra cho nhiệm vụ phát triển công nghệ thông tin Trung văn, mà hơn nữa, xét từ góc độ đời sống quốc gia, việc chưa trải qua trình tự pháp lí đã phủ định, thậm chí có hành động chống đối các quy phạm tiêu chuẩn liên quan Chính từ pháp nhà nước đã ban hành, là một việc vô lí.
Thuyết “chữ Hán ưu việt” đi ngược lại sự thật và trái với nguyên lí khoa học nhưng nhiều năm nay đã lan tràn khắp xã hội Trung Quốc, đầy rẫy trên các báo đài. Thậm chí không ít quan chức, viện sĩ, danh nhân, học giả và nhà văn cũng theo nhau ai nói sao ta bào hao nói vậy.
Muốn tự chủ sáng tạo phát triển công nghệ thông tin Trung văn, nắm quyền chủ động chiến lược thì Trung Quốc phải dọn sạch các sai lầm nghiêm trọng do thuyết “chữ Hán ưu việt” gây ra.
1 Tỉ lệ sử dụng 6 ngôn ngữ để soạn thảo các văn kiện ban đầu ở Liên hợp quốc như sau: Anh 80%, Pháp 15%, Tây Ban Nha 4%, còn lại 1% cho Nga, Ả Rập, Trung Quốc (theo nhà ngôn ngữ Châu Hữu Quang).
2 Nhị tự tiết: dùng 2 bytes để mã hóa 1 kí tự. Tứ tự tiết: dùng 4 bytes để mã hóa 1 kí tự.
3 Bính âm (pīnyīn): Cách thức sử dụng chữ cái Latin để thể hiện cách phát âm các chữ Hán trong tiếng phổ thông Trung Quốc.
Mễ A Luân(米阿仑) là bút danh của một học giả được Nhân dân nhật báo Trung Quốc giới thiệu là “nông dân số hóa” sống ở Mỹ, nhiều khả năng là chuyên gia máy tính. Mạng people.com.cn cho biết Mễ A Luân còn đóng vai trò chủ chốt trong chuyên mục “Xóm Mễ A Luân” do Chinabyte (của Nhân dân nhật báo và Tập đoàn Tin tức cùng tổ chức) chủ trì. Các bài viết ở chuyên mục này nhẹ nhàng nhưng sâu sắc, đều nhằm chấn chỉnh những xu hướng sai lầm lớn trong đời sống văn hóa xã hội Trung Quốc.
(Nguyễn Hải Hoành biên dịch và chú thích)
Nguồn: http://tiasang.com.vn/-van-hoa/Cac-sai-lam-cua-thuyet-%E2%80%9Cchu-Han-uu-viet%E2%80%9D-10858