Bạn đang ở: Trang chủ / Tài liệu / Báo cũ / Số 13 / Bỏ dấu ở đâu?

Bỏ dấu ở đâu?


Bỏ dấu ở đâu?
Chính tả tiếng Việt, máy vi tính
và chương trình tự động bỏ dấu


Nguyễn Ngọc Giao

 

Chữ dấu trong tựa đề bài này là dấu thanh của tiếng Việt (sắc, huyền, hỏi, ngã, nặng, không kể... dấu không). Ở đâu nghĩa là ở trên-dưới (dưới trong trường hợp dấu nặng) con chữ nào. Thí dụ: (1) dấu sắc trong chữ dấu nhất thiết phải ở trên con chữ â: dấu, chứ không ai viết là dâú; (2) song đến dấu huyền của chữ hoà là ta thấy có hai trường phái. Nhìn chung báo chí Việt ngữ hải ngoại, ta thấy phần đông bỏ dấu huyền trên con chữ o: hòa ; số ít (Diễn Đàn ở Pháp, Thế kỷ 21 ở Mỹ, với sự ủng hộ của nhà ngôn ngữ học Nguyễn Đình Hoà) chủ trương viết hoà. Điều này phản ánh tình trạng chính tả của sách báo trong nước, cũng như của các cuốn từ điển. Phần đông các cuốn từ điển Việt-Việt hoặc song ngữ đều viết theo lối thứ nhất. Ngược lại, phần lớn các cuốn từ điển chính tả lại chủ trương cách thứ hai: dù là tác giả Sài Gòn như Lê Ngọc Trụ (1) hay tác giả Hà Nội như Nguyễn Kim Thản (2). Từ điển Hoàng Phê (3) in năm 1985 theo lối thứ nhất, khi tái bản năm nay đã dứt khoát chủ trương lối thứ hai (thông tin của Ngô Thanh Nhàn). Điều này có ý nghĩa, trong bài chúng tôi sẽ có dịp trở lại.

Trước mắt, xin trả lời ngay một vài câu hỏi có thể được một số bạn đọc đặt ra, như: (a) bỏ dấu ở trên (hay ở dưới) con chữ nào là chuyện chi tiết vặt vãnh, sao mấy anh trí thức còn bày trò chẻ tóc làm tư vào lúc này? (b) cho dù có vấn đề, thì cũng là vấn đề ý kiến, chỉ có cách là qui ước theo đa số, chứ tranh cãi phải trái thì bao giờ mới xong?

Trả lời câu hỏi (a) tương đối nhanh: đúng là vấn đề vị trí dấu chỉ là chi tiết trong vấn đề chữ viết tiếng Việt, nhưng hiện nay, và từ nay trở đi, do sự chiếm lĩnh của máy tính trong các ngành in, xuất bản, báo chí và sự thâm nhập của máy tính vào mọi hoạt động dùng tới chữ viết và xử lý văn bản (khoa học, kỹ thuật quản lý, ngân hàng, kế toán, bưu điện...) việc thống nhất vị trí dấu thanh cho đúng chính tả trở thành cần thiết nếu ta muốn tránh nhiễu loạn, mất thời giờ trong việc thông tin. Xin lấy một thí dụ: hoà hòa đối với người chỉ là một chữ, nhưng đối với máy tính, lại là hai chữ khác nhau, không thể lẫn lộn, nếu người lẫn lộn, đoạn trước viết hoà, đoạn sau viết hòa, bảo máy đi tìm, rà soát thì máy sẽ bỏ sót, người ở Hà Nội viết hoà, muốn thông tin qua mạng lưới điện tử với người ở Los Angeles quen viết hòa, nếu không xảy ra chiến tranh, thì đường thông tin cũng bị nhiễu loạn, tắc nghẽn.

Còn câu hỏi (b), mới trông tưởng có căn cứ, nhưng xét kỹ, vì chữ quốc ngữ tuân theo các nguyên tắc của ngữ âm học, và các dấu thanh trong tiếng Việt lại có những quy luật mà mọi người đều đồng ý, nên rốt cuộc, có thể đi đến thống nhất về việc bỏ dấu. Và với khả năng của các chương trình tin học, hoàn toàn có thể bỏ dấu tự động theo đúng nguyên tắc thống nhất, vừa đỡ mất thời giờ cho người đánh máy, vừa tạo điều kiện cho việc trao đổi văn bản.

Vấn đề lại có mặt cấp bách, vì việc bỏ dấu hiện nay trên sách báo Việt ngữ (trong nước và ngoài nước) đang trở nên loạn: những chữ như qũy, cữơi, hòai... đang đua nhau nhảy nhót trên trang giấy, như thách thức khả năng thức tỉnh của những ai còn thiết tha với tiếng Việt và chữ Việt.


Những quy luật cơ bản

Bài này viết cho độc giả biết đọc và biết viết (bằng máy tính) tiếng Việt, không cần có hiểu biết về ngôn ngữ học (linguistique) hay tin học (informatique); người viết cũng không biết gì về tin học, chỉ biết lõm bõm về ngôn ngữ học. Cho nên bài viết sẽ tránh đi vào chuyên môn và chỉ nhắm hai mục đích. Mục đích chính là trình bày cho số đông bạn đọc một vài mẹo luật đơn giản, dễ áp dụng, để bỏ dấu cho đúng. Mục đích phụ là thuyết phục tác giả mấy chục chương trình tiếng Việt hiện có hãy gấp rút ứng dụng chương trình bỏ dấu tự động (đã có) để mọi người được nhờ!

Trước tiên, xin nêu ra một vài qui luật cơ bản mà mọi người sử dụng chữ quốc ngữ đều chấp nhận và tuân theo:

(L1) Dấu thanh bao giờ cũng đặt trên (hoặc dưới) những con chữ nguyên âm (a, ă, â, e, ê, i, o, ô, ơ, u, ư, y), không bao giờ đặt trên (hoặc dưới) các con chữ phụ âm (b, c, d, đ..., v, w, x, z ).

Do đó, một chữ nào chỉ có một nguyên âm (a, ba, mi...) việc bỏ dấu không có gì phải do dự: trên (hay dưới) con chữ nguyên âm (duy nhất). Thí dụ : à, bạ, mì... Vấn đề chỉ đặt ra cho những chữ có hai hay ba con chữ nguyên âm viết liền nhau (mỗi chữ trong Việt ngữ có nhiều nhất là 3 con chữ nguyên âm). Thí dụ: hoi, khuyên, rượu...

(L2) Trong những trường hợp này, dấu thanh bao giờ cũng đặt trên (hoặc dưới) con chữ nguyên âm chót hoặc áp chót.

Thí dụ: hỏi, khuyến, rượu. Quy luật này giảm bớt số trường hợp khiến ta do dự, nhưng tự nó chưa cho phép giải quyết mọi vấn đề. Tuy nhiên, phối hợp với những mẹo luật dưới đây, nó sẽ giúp ta giải quyết khá nhiều trường hợp:

(L3) Ư u thế của những con chữ nguyên âm có dấu phụ.

Trong 12 con chữ nguyên âm của chữ Việt, chúng tôi gọi 6 con chữ ă, â, ê, ô, ơ, ư là những nguyên âm có dấu phụ, phân biệt với 6 con chữ kia (a, e, i, o, u, y) không đội “nón”, không mang “râu”. Luật (L3) quy định như sau: khi một nguyên âm có dấu phụ (thí dụ: ê) đi với một hay hai nguyên âm không dấu phụ, thì dấu thanh bao giờ cũng đặt ở nguyên âm có dấu phụ. Thí dụ: lều bều, thuế, khuyến, miễn, hoàng.

(L4) Con chữ u đi sau q chỉ là một âm đệm.

Mọi người đều biết chữ quốc ngữ của chúng ta do các giáo sĩ tạo ra theo các nguyên tắc ngữ âm học, nên nói chung khá hợp lý. Một vài điểm (nhỏ) không hợp lý là do họ là người Bồ Đào Nha, Tây Ban Nha, hay Pháp, nên đã mang những thói quen không hợp lý của văn tự mấy nước này vào tiếng Việt. Thí dụ như những con chữ phụ âm g và q. Do đó, con chữ u có hai qui chế khác nhau. Khi nó không đi với q, con chữ nguyên âm u cũng không “thua kém” gì các nguyên âm (không dấu phụ) khác: của (dấu hỏi đặt trên chữ u), nhưng cáu (dấu thanh đặt trên chữ a), khi hơn khi kém con chữ a, như vậy là nó “ngang hàng” với a. Ngược lại, khi con chữ u đi sau q, nó chỉ là một âm đệm, nó lép vế đối với các con chữ nguyên âm khác: không bao giờ bỏ dấu thanh ở con chữ u khi nó đi theo q. Thí dụ : (kết) quả nhưng ta lại viết của (cải), quỵ luỵ...

(L5) Con chữ i đi sau g cũng (hầu như) là một âm đệm.

Thật vậy, do lý do lịch sử đã nhắc lại ở trên, hai con chữ gi khi đi trước một nguyên âm khác thật ra chỉ là kí hiệu của âm vị (phonème) z (nếu phát âm giọng Bắc). Cho nên, dấu thanh bao giờ cũng đặt trên một nguyên âm khác: giặt, giã, gié, giò... Bạn đọc tinh mắt chắc đã để ý tới hai chữ trong ngoặc trong luật (L5): hầu như. Chúng tôi thêm hai chữ này vì có một ngoại lệ. Đó là trường hợp của hai chữ cùng viết bằng ba con chữ g, i, a (theo thứ tự đó) và bằng dấu nặng: giạ (lúa) và gịa (trong giặt gịa). Gọi là biệt lệ vì các quy luật nêu ra là những quy luật về chữ viết, chứ khi ta phát âm, thì rõ ràng trong chữ gịa, có sự kết hợp của âm vị gi và nguyên âm kép ịa (như trong bịa, phịa): gi-ịa. Cho nên biệt lệ này cũng là hậu quả của câu chuyện g và gi mà lịch sử đã để lại. Chính vì vậy mà trong các đề nghị cải tổ chữ viết, nhiều người đề nghị viết giạ (lúa) là jạ hoặc zạ, còn gịa (trong giặt gịa) gỵa, jịa, zịa...

Với 5 qui luật nêu trên, ta có thể giải quyết một số khá lớn các trường hợp chính tả về vị trí dấu thanh, nhưng còn bỏ sót hai loại trường hợp chính:

(a) những cặp nguyên âm: ai, ấy, ao, au, eo, ia, iu, oa, oe, oi, oo, ôô, ua, ui, uy, ươ (bạn đọc chú ý: những cặp 1 nguyên âm có dấu phụ và 1 nguyên âm không dấu phụ, chúng tôi không liệt kê ở đây, vì luật (L3) đã giải quyết rồi).

(b) những chuỗi 3 nguyên âm (cũng như đã nói trên, chúng tôi bỏ qua trường hợp chỉ có 1 nguyên âm có dấu phụ) : oai, oay, oeo, uya, ươi.

Thật ra, trong trường hợp (b), các từ điển (và có lẽ đa số người sử dụng) đều nhất trí bỏ dấu ở con chữ đứng giữa: loài, xoáy, khoèo, muýa (?), người.

Trong trường hợp (a) cũng thế, có sự thống nhất chính tả đối với các cặp ai, ay, ao, au, eo, ia, iu, oi, ua, ui (dấu thanh đặt ở chữ đầu). Thí dụ : khái, tày, mão, mèo, khía, dịu, túa, xúi.... Tương tự, trường hợp các âm kép oo, ôô, mọi người cùng chấp nhận bỏ dấu ở chữ thứ nhì: xe goòng, tiếng côồng. Cũng vậy, trong trường hợp uơ, mọi người đồng ý bỏ dấu ở con chữ ơ: cười, rượu...

Sự bất đồng rốt cuộc chỉ còn giới hạn vào trường hợp các cặp con chữ nguyên âm sau đây: oa, oe, uy. Cách giải quyết duy nhất là dựa trên nguyên tắc ngữ âm học: trong một cặp hai nguyên âm, dấu thanh phải để vào nguyên âm chính (xem (4)(5), hai tác giả (5) gọi nguyên âm chính chủ âm). Âm kép oa (trong hoa) cũng là một âm với ua trong qua ; oe trong loe cũng là một âm vơi ue trong que ; uy trong huy cũng là một với uy trong quy. Nói cách khác, trong các cặp nguyên âm kể trên, a, e và y là những nguyên âm chính. Do đó, với giải pháp thống nhất này, hoà bình, khoé mắt, huý kị là cách viết đúng. Những người chủ trương bỏ dấu trên chữ o hay u trong ba trường hợp trên (hòa, khóe, thủy) lại sẵn sàng đổi chỗ bỏ dấu ngay khi có một con chữ khác đi tiếp những tiếng trên: ho àn, khoét, hu ýt. Qua thí dụ cụ thể này, chúng ta có thể lý giải được hiện tượng nói ở đầu bài: các nhà ngôn ngữ học chú ý tới chính tả như Lê Ngọc Trụ, Nguyễn Kim Thản, và ngày nay cả Hoàng Phê, đều nhất trí với cách bỏ dấu thống nhất vừa trình bày. Còn tác giả các cuốn từ điển phổ thông khác lại tập trung vào ngữ nghĩa; về chính tả, họ chỉ quan tâm tới những lỗi chính tả hỏi-ngã, s-x, ch-tr, có g hay không có g ở cuối, c hay t ở cuối, còn vị trí dấu thanh, họ để cho nhà in (và thói quen) quyết định. Không phải ngẫu nhiên mà ngày nay, lại nhà in (lần này, dưới dạng nhà in tại gia, là máy vi tính) đặt ra vấn đề này và đòi hỏi một giải pháp thống nhất.


Chương trình bỏ dấu tự động

Những quy luật và nguyên tắc vừa kể trên có thể làm cơ sở ngôn ngữ học cho một chuỗi 8 quy tắc về dấu phụ và dấu thanh của tiếng Việt, và từ đó, soạn chương trình bỏ dấu tự động. Công trình (6) của Ngô Thanh Nhàn, James Đỗ và Nguyễn Hoàng vừa công bố trên Tạp chí Ngôn Ngữ đã triển khai hướng đi mà Ngô Thanh Nhàn vạch ra trong (7). Cụ thể hơn, ba tác giả đã soạn ra 2 thuật toán (algorithme) khác nhau để xử lý vấn đề này. Với 600 dòng, viết bằng ngôn ngữ C cho Unix, Turbo++ cho PC và ThinkC cho Macintosh, họ có thể thoải mái bấm phím: đoí, dọa, daò, khuyủ, khúyên..., chương trình bỏ dấu tự động sẽ sửa hộ thành: đói, doạ, dào, khuỷu, khuyến ... Trong nước, chương trình chữ Việt BKED của Khoa tin học Trường đại học Bách khoa Hà Nội (do Quách Tuấn Ngọc chủ trì) cùng đi theo hướng này.

Với việc thống nhất bảng mã tiếng Việt VSCII (xem bài của James Đỗ trong số này), mong rằng tác giả các chương trình chữ Việt hiện có ở ngoài nước cũng như trong nước sẽ sớm cung cấp cho công chúng những sản phẩm tương thích, dễ dùng (chuyển đổi được, bỏ dấu tự động...), cạnh tranh với nhau trên chất lượng mĩ thuật (hình vẽ chữ...).


Trong khi chờ đợi, một mẹo đơn giản

Trong khi chờ đợi các chương trình bỏ dấu tự động bày bán trên thị trường, chúng ta đành tốn công bỏ dấu đúng chỗ. Những quy luật kể trên, dù hợp lý đến đâu, cũng quá rườm rà, khó nhớ mà có thuộc thì mỗi lần áp dụng cũng tốn thời giờ.

Vậy xin cung cấp cho các bạn một mẹo nhỏ, ai biết tiếng Việt cũng có thể áp dụng: dấu thanh bao giờ cũng đặt ở nguyên âm chính, muốn biết nguyên âm nào là nguyên âm chính thì chỉ cần tìm xem, tiếp theo nó, có thể thêm con chữ nào nữa không, nếu có, thì nó là âm chính, nếu không thể có, thì nhất quyết nó không phải là nguyên âm chính.

Nguyên tắc này áp dụng cho mọi nguyên âm, có dấu phụ hay không. Dùng lại những thí dụ ở trên: trong cặp oa, a là nguyên âm chính, vì tiếp theo đó, ta có thể thêm c, m, n, t (ngoạc, ngoạm, hoàn, hoành); trong chuỗi uyê, ê là nguyên âm chính, vì ta có uyển, chuyền... Bạn đọc có thể kiểm tra điều này với tất cả các chuỗi nguyên âm có trong tiếng Việt, sẽ không thấy ngoại lệ nào.

Nguyễn Ngọc Giao

 

[l] Lê Ngọc Trụ, Việt-ngữ chánh-tả tự vị, Nhà sách Khai Trí, Sài Gòn, tái bản lần thứ I, 1972.

[2] Nguyễn Kim Thản, Sổ tay chính tả, Nhà xuất bản Thành phố Hồ Chí Minh, tái bản 1991.

[3] Hoàng Phê, Lê Anh Hiền và Đào Thản, Từ điển chính tả tiếng Việt, Nhà xuất bản Giáo dục, Hà Nội, 1985.

[4] Đoàn Thiện Thuật, Ngữ âm tiếng Việt, Nhà xuất bản Đại học và Trung học chuyên nghiệp, Hà Nội, 1980.

[5] Trương Văn Chình, Nguyễn Hiến Lê, Khảo luận về ngữ pháp Việt Nam, Đại học Huế, Sài Gòn, 1963.

[6] Ngô Thanh Nhàn, James Đỗ, Nguyễn Hoàng, Một số kết quả và cách đặt tự động đóng dấu phụ và chữ tiếng Việt, Tạp chí Ngôn ngữ số 86 (1992).

[7] Nhàn NT., Một số vấn đề về chuẩn chính tả tự động trong tiếng Việt - không dùng từ điển, Đất Việt (6-86)

Các thao tác trên Tài liệu

Các số đặc biệt
Ủng hộ chúng tôi - Support Us
Kênh RSS
Giới thiệu Diễn Đàn Forum  

Để bạn đọc tiện theo dõi các tin mới, Diễn Đàn Forum cung cấp danh mục tin RSS :

www.diendan.org/DDF-cac-bai-moi/rss