`

shell脚本regex正则表达式 和 字符串替换

阅读更多

转自:http://hi.baidu.com/yangyangye2008/blog/item/fafb00d54b504211a18bb78c.html

任意字符
^行首匹配
$行尾匹配
^$表示空行,不含字符的行
^ $匹配只有单个空格的行
[0-9]
[a-zA-Z]
^[A- Z]搜索以大写字母开头的行
[^A-Z]匹配大写字母意外的任意字符
*表示匹配0个或若干个字符,如:a*,表示匹配0个或若干个a; aa*表示匹配至少1个a
.*来表示0或若干个任意字符
e.e*表示匹配第一个e和最后一个e之间的任意字符
[-0-9]匹配一 个连字符或数字
[]a-z]匹配一个]或者字母
\{min,max\}匹配任意数目的字符串
[a-z]\{10\}只匹配10个 a-z字符的字符串
s/.\{5\}$// 删除每行的最后5个字符
\(...\),n是1到9的数字,表示存储用的寄存器,用\n来引 用存在寄存器中的内容
^\(.\)\1匹配行首的第一个字符,并将该字符存到1号寄存器中,然后匹配1号寄存器中的内容,这由\1的描述。该正则 表达式的最终效果是,如果一行的头两个字符相同,就匹配他们。
^\(.\).*\1$匹配一行中的头一个字符(^.)跟最后一个字符(\1$)相 同的行。.*匹配中间的所有内容
^\(...\)\(...\)行中头三个字符存在1号寄存器,接着的三个字符存在2号寄存器.
s/\(.*\) \(.*\)/\2 \1/g 交换两个字段

.任何字符
^行首
$行尾
*前导的正则表达式重复0或若干次
[字 符表]字符中的任一字符
a..表示a后的2个字符
^wood表示行首的wood
x$表示行为的x
^INSERT$只包含 字符串INSERT的行
^$不包含任何字符的行
x*表示0或若干个连续的x
xx*表示1或多个连续的x
.*表示0活若干 个字符
w.*s表示以w开始,s结尾的任何字符串
[tT]小写或大写的t

[^字符表]表示任一不在字符表中的字符 [^0-9] [^a-zA-Z]
\{min,max\}表示前导的正则表达式重复只烧min次,至多max次[0-9]\{3,9\}表示3到 9个数字
\(...\)表示将小括号中匹配的字符串存储到下一个寄存器中(1-9),
^\(.\)表示行中第1个字符存到1号寄存器
^\ (.\)\1表示行首恋歌字符,且他们相同

cut -c5 file把file文件中没行的第5个字符析取出来;
用逗号分割的数 值列表,如-c1,13,50把第1,13,50个字符析取出来
cut -c20-50把第20到50之间的字符析取出来

who | cut -c1-8
who | cut -c1-8,18- 析取行中的第1到8个字符(用户名)和第18到行尾的字符(登录时间)

cut -ddchar -ffields file其中,dchar是数据中分割各字段的分割符,fields表示要从文件file中析取出来的字段.
字 段编号从1开始,而且格式跟以前将的用来指定字符位置的数字一样(如-f1、2、8、-f1-3、-f4-)。
cut -d: -f1 /etc/passwd
如果已知字段之间使用制表符分隔的,就可以给cut命令用-f选项而不用-c选项,好多了!还记得吧,这里用不着用-d选 项来指定分割符,因为
cut把制表符默认为分割符。

paste和cut正好相反,它不是把行分离开,而是把多行合并在一起。

paste names numbrs文件names中的每一行都和numbers中的对应行显示在一起,中间用制表符分割。
如果不想用制表符作默认分割, 可以使用-dchars指定分割符
paste -d'+' names addresses numbers
-s选项告诉paste把同 一文件中的行粘贴在一起,而不是从其他文件。如果只指定一个文件名,其效果是把文件中的所有行合并成一行,原来隔行之间用制表符或者有-d选项指定的分割 符分割。

sed是用来编辑数据的程序,意指流编辑器(stream editor)。与ed不同,sed不能用于交互,
-n选 项,然后使用p命令显式指定
sed -n '1,2p' file只显示前2行
sed -n '/Unix/p' file只打印包含Unix的行
删除行
d删除整行文件
sed '1,2d' file删除1和2行
记住sed默认把输入 的所有行写入标准输出,所以生于行的文字,也就是从第3行到结尾,都被写入标准输出。
sed '5d'删除第5行
sed '/[Tt]est/d'删除包含test或Test的行
sed -n '20,25p' test只显示文件test的第20行到第25行
sed '1,10s/unix/UNIX/g' intro报intro前10行中的unix改为UNIX
sed '/jan/s/-1/-5/'将所有包含jan的行中第1个-1改为-5
sed 's/...//' data删除data文件每一行的前3个字符
sed 's/...$//' data删除data文件每一行的最后3个字符
sed -n 'I' text显示文件text的所有行,把所有不可打印字符显示为\nn,制表符显示为\t

过滤器tr用来转换来自标准输入的字 符,tr命令的一般格式为
tr from-chars to-chars

tr e x < intro把所有字母e转换成x
tr命令的输入必须重定向到文件intro,因为tr总是从标准输入获得输入;转换的结果写入标准输出,而原始文 件保持不变。
cut -d: -f1,6 /etc/passwd | tr : '  ' 通过在管道线的最后加上适当的tr命令,就可以把冒号转换成制表符,这样产生的输出更容易看
单引号中括的是制表符(尽管你看不到)。必须将它括在 引号中,以便穿过shell,使tr有机会看到它。
使用\nnn来给tr提供8进制表示的字符
一些ascii字符的八进制值
响 铃     7
退格     10
制表符  11
新行     12
换行     12
换页     14
回 车     15
转义     33

date | tr ' ' '\12'此例中,tr接受date命令的输出,并把所有的空格转换成换行
tr '[a-z]' '[A-Z]' <intro将所有小写转换为大写
-s选项,tr命令中的-s选项用来压缩to-chars中重复的字符,换句话说,如果转换完成后,有 to-chars中的某个字符连续出现多次,则这些连续相同的字符被替换为一个字符。
如下面的命令将冒号转换为制表符,并将多个连续制表符替换为 单个制表符:
tr -s ':' '\11\'
tr -s ' ' ' ' <lotspaces通过-s将多个空格全部压缩为单个空格
-d选项用来删除掉输入流中的字符,其一般格式为
tr -d from-chars任何列在from-chars中的字符都会被从标准输入中删除。下例用tr来删除文件intro中的所有空格:
tr -d ' ' <intro
当然sed 's/ //g' intro也可以得到同样的效果

tr 'X' 'x'      把大X专成小x
tr '()' '{}'    把所有左小括号转换成左大括号,右小括号专成右大括号
tr '[a-z]' '[A-Z]' 把小写转大写
tr '[A-Z]' '[N-ZA-M]' 把A-M字母分别专成N-Z把N-Z转成A-M
tr '     ' ''把所有制表符转换成空格
tr -s ' ' ''把多个空格转换成单个空格
tr -d '\14' 删除所有换页字符(八进制14)
tr -d '[0-9]'删除所有数字

grep '[A-Z]' list list中包含一个大写字母的行
grep '[0-9]' data中包含数字的行
grep '[A-Z]...[0-9]' list list中包含以大写字母开始、数字结尾的5个字符组合的行
grep '\.pic$' filelist filelist中以.pic结尾的行


uniq in_file out_file该格式中,uniq把in_file复制到out_file,处理过程中,去掉其中的重复行。如果不指定第2个参数out_file,结 果就写入标准输出;如果in_file没有指定,那么uniq就成了一个过滤器,从标准输入读取输入。

>或<     重定向,覆盖原有的内容
>>或<<  重定向,想文件末尾追加内容
tee      显示在终端上的内容存储到文件 ls | tee >glx

-d  目录
-e  存在
-f  普通文件
-r  进程可读文件
-s  长度不为0
-w  进程可写文件
-x  可执行
-L  链接文件


$#  传给程序的参数个数,或者执行set命令设置的参数个数
$*  对位置参数等的集中引用
$@  跟$*相似,区别在于当加入双引号后("$@"),集中引用位置参数"$1","$2"...等
$0  正执行的程序名
$$  正执行程序的进程id
$!  最后一个发生后台运行的程序的进程id
$?  最后一个在前台执行的程序的退出状态
$-  当前有效选项标志

`command`符号之间的内容为需要执行的命令
make -C /lib/modules/`uname -r`/build M=`pwd`

使用echo可以显示字符串,但是不能格式化字符串,可以使用printf实现
printf "format" arg1 arg2 ...

ln -s from to 把from链接到to上,所以to是from的符号链接

tree -d只显示目录
tree -L 2显示2级目录

字符串比较
s1  = s2     s1等于s2
s1 != s2     s1不等于s2
s1           s1不为空
-n s1        s1不为空
-z s1        s1为空
整数比较操作
-eq 等于
-ge 大于或等于
-gt 大于
-le 小于或等于
-lt 小于
-ne 不等于

[ "$x1" = 5 ]字符串比较
[ "$x1" -eq 5 ]整数比较

-a  逻辑与操作
-o  逻辑或操作


command1 && command2
则先执行command1,如果返回的退出状态 为0,则执行command2;如果command1返回的退出状态非0,则跳过command2

command1 || command2
和上边的&&差不多,只是,仅仅当command1返回非0时,才执行command2


#!/bin/sh
append2=0
include_lib=1

if [ -f cscope_i ];then
     rm cscope_i
fi

for cscope_file in $*; do 
if [ -f "$cscope_file" ] || [ -d "$cscope_file" ];then
#    if [ $cscope_file = '-a' ];then
#     append2=1
#     continue
#    fi
#
#    if [ $cscope_file = '-n' ];then
#     include_lib=0<F11>
#     continue
#    fi
    if [ "$append2" = "1" ];then
     find $cscope_file -maxdepth 1 -name '*.[cChH]' -o -name '*.[cC][pP][pP]'>>cscope_i
    else
     find $cscope_file  -name '*.[cChH]' -o -name '*.[cC][pP][pP]'>>cscope_i
    fi
else
    if [ $cscope_file = '-a' ];then
     append2=1
    elif [ $cscope_file = '-n' ];then
     include_lib=0
    else
     echo "Error: cannot read file $cscope_file"
    fi
fi
done

if [ -f cscope_i ];then
     if [ "$include_lib" = "1" ];then
         cscope -bi cscope_i
     else
         cscope -bki cscope_i
     fi
     rm cscope_i
fi

分享到:
评论

相关推荐

    jJAVA正则表达式替换字符

    本资源文件是我自己总结的,其中包括5个类,这5个类的代码基本...用正则表达式替换字符串内容,使用正则表达式切割字符串,字符串匹配,将字符串“&lt;msg&gt;ha&gt;ve modif”中的&gt;替换为&gt;将&lt;替换为&lt;将&替换为2. 等等情况!

    C++正则表达式-regex类(不依赖其他库)

    提取了boost::regex里边的几个正则表达式匹配搜索接口,打包成DLL,以在不依赖于boost的情况下独立编译运行

    很强大美观的Regex正则表达式测试工具

    很强大美观的Regex正则表达式测试工具,使用请见博文:https://editor.csdn.net/md?not_checkout=1&articleId=122675018

    Regex正则表达式生成工具

    正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。 这里有一些可能会遇到的正则表达式示例: Visual Basic Scripting Edition VBScript 匹配 /^\[ \t]*$/ "^\[ \t]*$" 匹配一个空白行。 /\d{2}-\...

    python基础 36 RegEx 正则表达式 (教学教程tutorial)

    python基础_36_RegEx_正则表达式_(教学教程tutorial)

    [c++]获取linux命令返回, 并通过正则表达式过滤字符串

    获取linux命令返回, 并通过正则表达式过滤字符串 在linux下可用. #include &lt;regex.h&gt;

    C#字符串和正则表达式参考手册.pdf

    在很多文本编辑器或其他工具里,正则表达式通常被用来检索和/或替换那些符合某个模式的文本内容。许多程序设计语言都支持利用正则表达式进行字符串操作。例如,在Perl中就内建了一个功能强大的正则表达式引擎。正则...

    csharp正则表达式参考手册

    许多程序设计语言都支持利用正则表达式进行字符串操作。例如,在Perl中就内建了一个功能强大的正则表达式引擎。正则表达式这个概念最初是由Unix中的工具软件(例如sed和grep)普及开的。正则表达式通常缩写成"regex",...

    T-Regex正则表达式验证工具

    T-Regex正则表达式验证工具

    C++Regex正则表达式

    C++Regex正则表达式

    .net Regex 正则表达式测试工具

    说明:.Net正则表达式测试工具,这下测试正则表达式方便多啦,不用麻烦得调试了

    regex正则表达式插件

    eclipse regex正则表达式插件

    正则表达式之道

    许多程序设计语言都支持利用正则表达式进行字符串操作。例如,在Perl中就内建了一个功能强大的正则表达式引擎。正则表达式这个概念最初是由Unix中的工具软件(例如sed和grep)普及开的。正则表达式通常缩写成"regex",...

    正则表达式之道.pdf

    许多程序设计语言都支持利用正则表达式进行字符串操作。例如,在Perl中就内建了一个功能强大的正则表达式引擎。正则表达式这个概念最初是由Unix中的工具软件(例如sed和grep)普及开的。正则表达式通常缩写成“regex...

    java-regex正则表达式

    本文当是java正则表达式实例教程,从入门语法开始,结合源代码实例,详细讲解了java正则表达式用法和相关细节

    linux shell 正则表达式(BREs,EREs,PREs)差异比较.docx

    在很多文本编辑器或其他工具里,正则表达式通常被用来检索和/或替换那些符合某个模式的文本内容。许多程序设计语言都支持利用正则表达式进行字符串操作。例如,在Perl中就内建了一个功能强大的正则表达式引擎。正则...

    RegeX正则表达式 测试小工具

    RegeX 正则表达式 测试小工具 很实用的工具

    45 - Nginx中的正则表达式.mp4

    许多程序设计语言都支持利用正则表达式进行字符串操作。例如,在Perl中就内建了一个功能强大的正则表达式引擎。正则表达式这个概念最初是由Unix中的工具软件(例如sed和grep)普及开的。正则表达式通常缩写成“regex...

    正则表达式介绍

    许多程序设计语言都支持利用正则表达式进行字符串操作。例如,在Perl中就内建了一个功能强大的正则表达式引擎。正则表达式这个概念最初是由Unix中的工具软件(例如sed和grep)普及开的。正则表达式通常缩写成“regex...

    C++代码实例:正则表达式

    可以采用正则表达式来实现字符串匹配功能。一种简单的正则表达式是由英文字母(区分大小写)、数字及通配符“*”和“?”任意组合而成的。“?”代表任意一个字符,“*”代表零个或任意多个字符。例如,a*b可以匹配acb...

Global site tag (gtag.js) - Google Analytics