1.3 原子
一、概念
正则表达式的最小的匹配单位,Unicode编码表的某个字符
可见原子
Unicode编码表中用键盘输出后肉眼可见的字符
内容:
标点:
;、"、?、.等等英文字母与数字:
a-z、A-Z、0-9汉子、日文、阿拉伯文等其他语言文字
数理化公式符号:
∑、ƒ、ß等其他可见字符
不可见原子
Unicode编码表中用键盘输出后肉眼不可见的字符
内容:
换行符:
回车:
制表符:
空格
其他不可见符号
二、演示
匹配某一个明确的字符:
D匹配汉字:需要转换成Unicode编码,然后进行匹配
如果匹配的符号恰好是正则表达式的运算符,则通过前置
\进行转义即可匹配空格:使用一个空格即可
Last updated