+43

Một số loại Regex cho tiếng Nhật thường sử dụng

Khi tham gia vào các dự án cho khách hàng Nhật Bản, chắc hẳn không ít người từng phải lên mạng tìm kiếm các Regular expression để thực hiện validate dữ liệu tiếng Nhật. Dưới đây là một số Regular expression thông dụng.

Trường hợp chữ số

Tất cả đều là chữ số (fullwidth)

/^[0-9]+$/

Tất cả đều là chữ số (halfwidth)

/^[0-9]+$/

Tất cả đều là chữ số (fullwidth, halfwidth)

/^[0-90-9]+$/

Tất cả các số fullwidth (kể cả số âm, số thập phân)

/^[ー]?[0-9]+(\.[0-9]+)?$/

Tất cả các số halfwidth (kể cả số âm, số thập phân)

/^[-]?[0-9]+(\.[0-9]+)?$/

Trường hợp ký tự thường

Ký tự alphabet halfwidth (chữ thường)

/^[a-z]+$/

Ký tự alphabet halfwidth (chữ in hoa)

/^[A-Z]+$/

Ký tự alphabet halfwidth (chữ in hoa và chữ thường)

/^[a-z0-9]+$/

Ký tự alphabet halfwidth và chữ số (chữ in hoa, chữ thường, chữ số)

 /^[a-zA-Z0-9]+$/

Ký tự Hiragana fullwidth

/^[ぁ-ん]+$/

Ký tự Katakana fullwidth

/^([ァ-ン]|ー)+$/

Ký tự Hiragana và Katakana fullwidth

/^[ぁ-んァ-ン]+$/

Ký tự Kana halfwidth

/^[ァ-ン゙゚]+$/

Ký tự Kanji

/^[一-龥]+$/

Ký tự Hiragana fullwidth và Kanji

/^[一-龥ぁ-ん]/

Ký tự Hiragana, Katakana fullwidth và Kanji

/^[ぁ-んァ-ン一-龥]/

Trường hợp Email

/^\S+@\S+\.\S+$/

URL

/^http(s)?:\/\/([\w-]+\.)+[\w-]+(\/[\w-.\/?%&=]*)?/

Trường hợp số điện thoại

Số điện thoại (không có dấu gạch ngang, 10 ký tự)

/^\d{10}$/

Số điện thoại (không có dấu gạch ngang, 11 ký tự)

/^\d{11}$/

Số điện thoại (không có dấu gạch ngang, 10 hoặc 11 ký tự)

/^\d{10}$|^\d{11}$/

Trường hợp số thẻ tín dụng

/^(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|6011[0-9]{12}|3(?:0[0-5]|[68][0-9])[0-9]{11}|3[47][0-9]{13})$/

Trường hợp Mã bưu chính (postal code)

Mã bưu chính (Có dấu gạch ngang, 3, 5 hoặc 7 chữ số)

/^\d{3}[-]\d{4}$|^\d{3}[-]\d{2}$|^\d{3}$/

Mã bưu chính (Không có dấu gạch ngang, 3 chữ số)

/^\d{3}$/

Mã bưu chính (Có dấu gạch ngang, 5 chữ số)

/^\d{3}[-]\d{2}$/

Mã bưu chính (Có dấu gạch ngang, 7 chữ số)

/^\d{3}[-]\d{4}$/

Mã bưu chính (Có hoặc không có dấu gạch ngang)

/^\d{3}[-]\d{4}$|^\d{3}[-]\d{2}$|^\d{3}$|^\d{5}$|^\d{7}$/

Kết luận

Khi bạn đã biết về Regular expression, trong nhiều trường hợp ở trên bạn hoàn toàn có thể tự viết được đoạn code của mình (trừ các trường hợp liên quan đến Hiragana hay Katakana). Hi vọng bài có thể giúp bạn đỡ mất thời gian tìm hiểu các đoạn Regular expression của mình

Tham khảo

https://qiita.com/fubarworld2/items/9da655df4d6d69750c06


All rights reserved

Bình luận

Đăng nhập để bình luận
Avatar
@huytvomi
thg 9 13, 2021 9:29 SA

Thanks bác

Avatar
@NVT
thg 10 25, 2021 8:04 SA

cho hỏi bác có biết validate full size space của tiếng nhật không, em đang bị bí

Avatar
@giangnkt2k
thg 12 21, 2021 8:26 SA

thanks bac, đúng cấn mình cài

Avatar
@trinhminhan
thg 9 30, 2022 7:06 SA

Ký tự alphabet halfwidth (chữ in hoa và chữ thường) /^[a-z0-9]+$/ Hình như đang bị nhầm bác ơi!

Avatar
@misa198
thg 12 21, 2022 6:56 SA

Chuỗi kata full width theo thứ tự nó như này ァアィイゥウェエォオカガキギクグケゲコゴサザシジスズセゼソゾタダチヂッツヅテデトドナニヌネノハバパヒビピフブプヘベペホボポマミムメモャヤュユョヨラリルレロヮワヰヱヲンヴヵヶ Nên kata fullwidth thì phải như này mới đúng chứ bác /^([ァ-ヶ]|ー)+$/

Avatar
+43
Viblo
Hãy đăng ký một tài khoản Viblo để nhận được nhiều bài viết thú vị hơn.
Đăng kí