+4

Xử lý tiếng nói: Các thành của tiếng việt trong xử lý tiếng nói

Abstract: Tổng hợp tiếng nói trên thế giới đã phát triển từ rất lâu. Và Tiếng Việt mới phát triển được trong vòng 20 năm gầy đầy. Để tổng hợp tiếng nói chuẩn xác, ta cần phải tìm được các đặc điểm về ngữ điệu của ngôn ngữ đó. Và mục đích của bài viết này để giới thiệu về các đặc điểm của Tiếng Việt.

II. Đặc điểm Tiếng Việt

Như chúng ta đã biết, tiếng Việt là ngôn ngữ vô định hình và có thanh điệu. Tiếng Việt có các thuộc tính như sau:

  • Các từ trong tiếng Việt là vô định hình. Chúng không thay đổi phụ thuộc vào ngữ pháp của câu. Ví dụ, trong tiếng Pháp có danh từ đực và danh từ cái: étudiant - étudiante, nouveau - nouvelle, danh từ số ít và danh từ số nhiều: amie - amies.
  • Cấu trúc từ trong tiếng Việt không có các phụ tố (tiền tố, hậu tố, trung tố). Ví dụ trong tiếng Anh hay tiếng Pháp, các từ trái nghĩa được tạo ra bằng cách thêm tiền tố “im-”, “ir-”, “un-”: impolite, unreadable, irregular…
  • Các từ tiếng Việt sử dụng rất ít hình vị. Tiếng Việt có tối đa 20000 âm tiết để tạo nên các hình vị.
  • Tiếng Việt là ngôn ngữ có thanh điệu.
  • Một từ trong tiếng Việt có 5 phần: âm đầu (phụ âm), âm đệm (bán nguyên âm), âm chính (nguyên âm), âm cuối (phụ âm hoặc bán nguyên âm) và thanh.
  • Trong tiếng Việt, ranh giới của hình vị và của âm tiết là một. Một âm tiết là một hình vị.
  • Hầu hết từ vựng tiếng Việt tạo ra bởi một hoặc hai hình vị. Chúng là những từ một âm tiết, hai âm tiết hoặc đôi khi là đa âm tiết. 80% số từ vựng là hai âm tiết.
  • Sự khác biệt về luật ngữ pháp và luật phát âm giữa nói và viết là không lớn.
  • Tiếng Việt nhận khá nhiều từ nước ngoài, như là từ tiếng Hán và tiếng Pháp.

II.Cấu trúc âm tiết Tiếng Việt

Cấu trúc âm tiết Tiếng Việt được thể hiện như trong bảng sau:

Capture.PNG

Một âm tiết tiếng Việt gồm 3 thành phần chính: phụ âm chính (initial), vần (final) và thanh điệu (tone). Trong đó phần vần lại được chia làm 3 phần nhỏ hơn là nguyên âm chính (nucleus), nguyên âm đệm (median), và phần cuối cùng (final).

Ví dụ: âm tiết “TOÁN” có phiên âm /twan-5/ trong đó phần trước là /t/, bán nguyên âm /w/, nguyên âm chính /a/, phần cuối /n/ và thanh 5 (thanh sắc).

Phần cuối chỉ có thể là:

  • 6 phụ âm, còn được gọi là các phụ âm cuối: / p /, / t /, / m /, / n /, / k /, / ŋ /
  • 2 bán nguyên âm: / i /, / w /
  • Dựa theo phần cuối người ta có thể chia âm tiết thành bốn loại như sau:
    • Âm tiết mở: những âm tiết mà không có phần cuối. Ví dụ: ta /ta-1/, bố /bo-5/
    • Âm tiết bán mở: những âm tiết có phần cuối là một bán nguyên âm. Ví dụ: tai /taj-1/, vài /vaj-2/.
    • Âm tiết đóng: những âm tiết có phần cuối là một phụ âm câm (voiceless consonant). Ví dụ: át /at-5/, áp /ap-5/, ác /ak-5/.
    • Âm tiết bán đóng: những âm tiết có phần cuối là một phụ âm mũi (nasal consonant). Ví dụ: am /am-1/, êm /em-1/.

III. Ngữ điệu Tiếng Việt

Do là một ngôn ngữ có thanh điệu nên ngữ điệu tiếng Việt gồm hai thành phần, được gọi là ngữ điệu cục bộ và ngữ điệu toàn cục.

  • Ngữ điệu cục bộ: là sự biến thiên của cao độ, trường độ và cường độ của từng từ hoặc từng âm tiết. Với ngôn ngữ thanh điệu, ngôn điệu cục bộ rất quan trọng để nhận ra được thanh của âm tiết đó. Vì thế nên ý nghĩa từ vựng của câu phụ thuộc nhiều vào ngôn điệu cục bộ.
  • Ngữ điệu toàn cục: là ngôn điệu áp dụng vào cả một ngữ đoạn hoặc một câu. Chúng phụ thuộc vào loại câu, mục đích của người nói, cảm xúc, ... Vì thế, độ tự nhiên của câu tổng hợp phụ thuộc vào khả năng điều khiển ngôn điệu toàn cục trong quá trình tổng hợp tiếng nói

Các thanh điệu và ngữ điệu cục bộ trong Tiếng Việt.

Trong tiếng Việt, ngữ điệu cục bộ phụ thuộc lớn vào thanh của âm tiết. Sự đóng góp của các thanh có thể tạo nên hình vị và ý nghĩa cho âm tiết. Các thanh này làm cho các tiếng Việt có thuộc tính ngữ điệu và các câu có nhịp điệu và giai điệu.

Hệ thống thanh của tiếng Việt tương đối phức tạp. Nó thay đổi theo từng vùng miền. Số lượng các thanh có thể thay đổi từ 6 (giọng Hà Nội) đến 5 (giọng thành phố Hồ Chí Minh) hoặc đến 4 (giọng miền Trung). Bởi vì giọng Hà Nội được coi là phương ngữ chuẩn của Việt Nam, nên phần sau sẽ chỉ quan tâm đến các thuộc tính của giọng Hà Nội.

Sáu thanh của tiếng Việt được trình bày trong bảng sau:

Capture2.PNG

Một khó khăn trong việc nghiên cứu thuộc tính của các thanh trong tiếng Việt là có sự pha trộn giữa ngữ điệu nhỏ của các thanh với ngữ điệu lớn của từng đoạn. Khi đề cập đến thuộc tính của thanh, chúng ta cần quan tâm đến trạng thái tĩnh và trạng thái động của thanh. Trạng thái tĩnh của âm tiết là khi ta đọc lên từng âm tiết riêng biệt, trong trạng thái này, các thuộc tính của thanh tương đối ổn định. Trong khi đó trạng thái động của âm tiết là ta đọc các âm tiết một cách liên tục trong một câu nói, và các thuộc tính của thanh trong trạng thái này không ổn định bởi chúng phụ thuộc vào ngữ cảnh của âm tiết.

Thuộc tính tĩnh của các thanh đã được nghiên cứu từ lâu. Các nghiên cứu khác cũng có những kết quả tương tự.

Các thanh được chia làm 2 loại: thanh có quãng âm cao và thanh có quãng âm thấp. Tiêu chí phân loại là dựa vào độ cao của điểm cuối trong đường tần số cơ bản F0 của thanh đó. Theo đó các thanh 1, thanh 3 và thanh 5 là các thanh có quãng âm cao; còn thanh 2, thanh 4 và thanh 6 là các thanh có quãng âm thấp.

  1. Thanh 1 – Thanh ngang

    Thanh ngang là một thanh cao. Điểm bắt đầu đường F0 của thanh này cao hơn các thanh khác. Thanh ngang xuất hiện trong tất cả các âm tiết.ngoại trừ các âm tiết đóng. Một ví dụ về dáng điệu của đường F0 của âm tiết /ba/ với thanh ngang được mô tả trong Hình 2 2. Hai đường trong hình bên phải thể hiện đường ngữ điệu của hai giọng nữ cao nhất và thấp nhất.

Capture3.PNG

  1. Thanh 2 – Thanh huyền

    Điểm bắt đầu của thanh huyền thấp hơn đáng kể so với thanh 1, thanh 3 và thanh 5. Giá trị của F0 giảm dần dần cho đến cuối âm tiết. Thanh huyền xuất hiện trong tất cả các âm tiết ngoại trừ các âm tiết đóng. Dáng điệu đường F0 của âm tiết /ba/ với thanh huyền được mô tả trong hình.

Capture4.PNG

  1. Thanh 3 – Thanh ngã

    Giá trị bắt đầu của thanh ngã cũng cao như của thanh 5, và cao hơn của thanh huyền. Đoạn giữa của thanh ngã bị gãy, điều này được giải thích theo [4] là do có sự di chuyển co thắt thanh môn. Dáng điệu đường F0 của âm tiết /ba/ với thanh ngã được mô tả trong Hình

    Capture5.PNG

  2. Thanh 4 – Thanh hỏi

    Giá trị khởi đầu F0 của thanh hỏi là nhỏ nhất trong 6 thanh. Giá trị F0 giảm dần dần cho đến hơn 2/3 âm tiết, sau đó bắt đầu tăng trở lại cho đến cuối âm tiết. Dáng điệu đường F0 của âm tiết /ba/ với thanh hỏi đựơc mô tả trong Hình.

    Capture6.PNG

  3. Thanh 5 – Thanh sắc

    Điểm bắt đầu của F0 là cao. Thanh sắc có 2 dạng: thanh 5a trong các âm tiết mở và thanh 5b trong các âm tiết đóng. Đường F0 của thanh 5b chỉ là một đoạn ngắn. Giá trị F0 khởi đầu của thanh 5b là cao hơn so với của thanh 5a.

    Capture7.PNG

  4. Thanh 6 – Thanh nặng

    Tương tự như thanh 5, thanh 6 cũng có 2 dạng: thanh 6a cho các âm tiết mở và thanh 6b cho các âm tiết đóng. Giá trị F0 đầu của thanh 6a thường cao hơn của thanh 2 và thanh 4, nhưng thấp hơn nhiều so với thanh 1, thanh 3 và thanh 5. Dáng điệu của đường F0 lúc đầu là đi ngang, sau đó nhanh chóng giảm xuống.

Capture8.PNG

Ví dụ về dáng điệu của 6 thanh trong Tiếng Việt được chỉ ra trong Hình 2 10. Ta có thể thấy đường cao độ của 6 thanh có sự khác biệt đáng kể.

Capture9.PNG

IV. Phân loại câu trong Tiếng Việt

  1. Theo mục đích
  • Câu khẳng định: đây là loại phổ biến nhất, mô tả một sự việc. Ví dụ: Hôm nay tôi đi chơi.
  • Câu hỏi/nghi vấn: thường dùng để yêu cầu thông tin. Ví dụ: Ban đã làm báo cáo chưa?
  • Câu cầu khiến (mệnh lệnh): thường dùng khi đề nghị hoặc yêu cầu. Ví dụ: Lên trên nhà đi!
  • Câu cảm thán: một dạng nhấn mạnh của câu khẳng định. Ví dụ: Bài tập hôm nay khó quá!
  1. Theo cấu trúc

    Theo cấu trúc câu: câu cũng có thể phân loại dựa theo cấu trúc (bởi số lượng và loại của mệnh đề)

V. Ngữ điệu toàn cục trong Tiếng Việt

Như đã trình bày ở trên, ngữ điệu toàn cục của câu phụ thuộc vào loại câu, mục đích và cảm xúc của người nói. Trong bài viết này, chúng tôi quan tâm đến ảnh hưởng của loại câu tới ngữ điệu Tiếng Việt.

Trong ghiên cứu "Modeling the prosody of Vietnamese language for speech Synthesis" của thầy Mạc Đăng Khoa, cùng chỉ ra rằng câu nghi vấn được phát âm với một quãng âm cao hơn câu khẳng định. Bằng cách nghiên cứu từng cặp câu khẳng định và phủ định, nhận thấy phần lớn sự khác nhau ngữ điệu nằm ở phần cuối của câu.(phần sau vạch đỏ Hình): phần ngữ điệu của âm tiết cuối hoặc nửa âm tiết cuối của câu nghi vấn có xu hướng cao hơn so với câu khẳng định..

Capture10.PNG

Tiếng Việt là ngôn ngữ có thanh điệu, mỗi âm tiết được đi kèm với một thanh. Ngôn điệu tiếng Việt bao gồm hai thành phần chính là ngôn điệu cục bộ và ngôn điệu toàn cục. Ngôn điệu cục bộ gắn với thanh của âm tiết còn ngôn điệu toàn cục gắn với loại câu. Dựa vào những đặc điểm về ngữ điệu tiếng Việt, nội dung chương sau sẽ trình bày về mô hình ngữ điệu đề xuất và quá trình đi tìm tham số cho mô hình này..

Trong bài viết này, tôi xin phép dừng lại ở việc giới thiệu tổng quan về Tiếng Việt, trong phần tiếp theo, tôi sẽ trình bày về việc xây dựng dữ liệu.

Cảm ơn các bạn đã theo dõi!


All rights reserved

Viblo
Hãy đăng ký một tài khoản Viblo để nhận được nhiều bài viết thú vị hơn.
Đăng kí