如何快速系统的掌握正则表达式

来源：未知原创
时间：2018-04-19
阅读：次
本文标签：

正则表达式是一个程序员经常用到的基础技能，很多需要字符串检验的地方都会用到正则表达式，开始用正则表达式都是用的稀里糊涂的，用完算完，反正是匹配上了。这是不对的，所以还是需要系统的掌握一下正则表达式，在慕课网上有一门课专门讲如何使用正则表达式，之前学习了以后，感觉讲的比较系统和专业，特别总结如下:第一部分：原子匹配，所有的可见的不可见的字符都可以直接书写用于匹配，注意1：对于不可见的字符和正则表达式的使用的特殊字符使用反斜杠转义。注意2：对于中文最好使用unicode编码.

第二部分：原子筛选1点：“|” 表示前后都匹配，或者 ab|bc ab和bc都可以匹配成功。2点：[abc] 匹配其中任何一个。（注：”-” 表示区间，例如a到z所有字母可以写成[a-z]）3点：[^abc] 不包含任何一个。第三部分：原子集合（类似于快捷键一样）第1点：. 匹配换行符之外的所有字符第3点：s 匹配不可见的字符和[]等价，S是s的补集第4点：w 匹配字母数字和下划线和[0-9a-zA-Z_]等价，W是w的补集第四部分：量词(修饰匹配前面的原子的个数)第1点：{n} 恰好出现n次第2点:{n,} 大于等于n次第3点:{n,m} 大于等于n次，小于等于m次第4点：* 匹配0次 1次或者多次，相当于{0,}第5点：+ 匹配1次或者多次,相当于{1,}第6点：? 匹配0次或者1次，相当于{0,1}第五部分：边界控制和模式单元第1点：^表示以后面的原子作为开头，前面没有任何东西第2点：$表示以前面的原子作为结尾，后面没有任何东西第3点：() 括起来的内容作为一个原子例如(ab){2},就表示匹配2个ab，(aa|bb)cd, 就表示匹配aacd或者bbcd第六部分：修正类型（为了消除正则表达式的歧义）修正类型有好多种，我觉得最重要一个就是关于贪婪模式和懒惰模模式的修正，也是和第四部分相关的。

例如：正则表达式是：(ab){2,3}，匹配对象是：ababab那匹配的结果是abab，还是ababab呢，前面的就是懒惰模式，后面的就是贪婪模式。为了消除这种歧义，你要指定你所使用的模式。不同的正则引擎，指定方式不一样：例如：php的是在正则表达式后面加个U或者u，分别表示懒惰模式和贪婪模式例如’/[0-9]*/U’java使用的正则引擎是支持在有歧义的量词后面加个？表示懒惰模式，默认是贪婪模式。[0-9]+? 就表示匹配到尽量少的内容就返回。正则表达式还有一些其它内容和细节，但是我觉得掌握这些概念，在实际应用中可以构造任何想要的匹配形式了。

藏在正则表达式里的陷阱 0

Python正则表达式详解 5

正则表达式起源 148

本文来自电脑技术网（www.it892.com），转载本文请注明来源.
本文链接：http://www.it892.com/content/web/regexp/041bW022018.html

打印全文

Python正则表达式详解

python正则表达匹配开始 $ 匹配行尾，匹配出换行符以外的任何单个字符，使用-m选项允... [详细]

如何快速系统的掌握正则表达式

相关文章

Python正则表达式详解