学习Grep,Sed中的正则

正则要是几天不学习不用功,肯定会忘得一干二净,下面聊聊Grep,Sed中的正则。

问题:从一个文本文件里筛选出含有电话号码的行,电话号码是由七位或者八位阿拉伯数字组成(开头不是零),并且被单引号或者双引号包裹。

鉴于问题的需要,先杜撰一份数据:

shell> cat /path/to/data.txt
'7654321'
'7654321"
"87654321"
"87654321'

失败的尝试

shell> grep "(['\"])[1-9][0-9]{6,7}\1" /path/to/data.txt
grep: Invalid back reference
shell> sed -n "/(['\"])[1-9][0-9]{6,7}\1/p" /path/to/data.txt
sed: -e expression #1, char 25: Invalid back reference

成功的尝试

使用Basic Regular Expressions (BRE)

shell> grep "\(['\"]\)[1-9][0-9]\{6,7\}\1" /path/to/data.txt
'7654321'
"87654321"
shell> sed -n "/\(['\"]\)[1-9][0-9]\{6,7\}\1/p" /path/to/data.txt
'7654321'
"87654321"

使用Extended Regular Expressions (ERE)

shell> grep -E "(['\"])[1-9][0-9]{6,7}\1" /path/to/data.txt
'7654321'
"87654321"
shell> sed -n -r "/(['\"])[1-9][0-9]{6,7}\1/p" /path/to/data.txt
'7654321'
"87654321"

总结:Grep和Sed同时支持BRE和ERE两种正则,缺省情况下,Grep和Sed使用的都是BRE正则,通过增加命令参数(grep -E / sed -r),Grep和Sed可以支持ERE正则。

BTW:Regular expression From Wikipedia, the free encyclopedia

学习Grep,Sed中的正则》上有2条评论

  1. grep的新版本好像可以支持PREG正则,而且速度很快,但支持的貌似不是特别完全,需要复杂的正则的时候我都喜欢用perl -lane来代替grep和sed

    • 恩,grep支持PCRE(Perl-compatible regular expressions),而且有一个独立的pcregrep命令。

      man grep:

      -P, –perl-regexp
      Interpret PATTERN as a Perl regular expression.

发表评论

电子邮件地址不会被公开。 必填项已用*标注