1.3 原子

一、概念

  1. 正则表达式的最小的匹配单位,Unicode编码表的某个字符

  2. 可见原子

    1. Unicode编码表中用键盘输出后肉眼可见的字符

    2. 内容:

      1. 标点:;"?.等等

      2. 英文字母与数字:a-zA-Z0-9

      3. 汉子、日文、阿拉伯文等其他语言文字

      4. 数理化公式符号:ƒß

      5. 其他可见字符

  3. 不可见原子

    1. Unicode编码表中用键盘输出后肉眼不可见的字符

    2. 内容:

      1. 换行符:

      2. 回车:

      3. 制表符:

      4. 空格

      5. 其他不可见符号

二、演示

  1. 匹配某一个明确的字符:D

  2. 匹配汉字:需要转换成Unicode编码,然后进行匹配

  3. 如果匹配的符号恰好是正则表达式的运算符,则通过前置\进行转义即可

  4. 匹配空格:使用一个空格即可

Last updated