trying to understand how to create a pattern for Unicode chars, using the hex codes
mình tìm được cái này:
Spent a few days, trying to understand how to create a pattern for Unicode chars, using the hex codes. Finally made it, after reading several manuals, that weren't giving any practical PHP-valid examples. So here's one of them:
For example we would like to search for Japanese-standard circled numbers 1-9 (Unicode codes are 0x2460-0x2468) in order to make it through the hex-codes the following call should be used:
preg_match('/[\x{2460}-\x{2468}]/u', $str);
Here $str is a haystack string
\x{hex} - is an UTF-8 hex char-code
and /u is used for identifying the class as a class of Unicode chars.
Hope, it'll be useful.
vậy pattern của bạn:
Code:
/[\x{80}-\x{A0}\x{AD}\x{2000}-\x{200F}\x{2028}-\x{202F}\x{205F}-\x{206F}\x{FEFF}\x{FF01}-\x{FF60}\x{FFF9}-\x{FFFD}\x{0}]/u
sẽ xử lý chuỗi kí tự ở dạng UTF-8, mã UTF-8 này có thể là tiếng Nhật or Hàn .... và trong pattern được viết ở dạng \x{hex}
từ xử lý dùng k chuẩn lắm, có thể nói là nhận dạng
hoặc dùng tiếng Anh: cái hàm preg_match sẽ match to the regular expression given in pattern cái biến $name của bạn