shell實(shí)現(xiàn)模糊匹配與正則?相信很多沒有經(jīng)驗(yàn)的人對此束手無策,為此本文總結(jié)了問題出現(xiàn)的原因和解決方法,通過這篇文章希望你能解決這個(gè)問題。
正則表達(dá)式
正則表達(dá)式主要是用來描述一個(gè)句法規(guī)則的模式。其實(shí)說的通俗一點(diǎn),就是利用字符和元字符的組合,對一些符合既定句法的模式進(jìn)行模糊匹配。它的主要功能是文本查詢和字符串操作。
正則表達(dá)式的基本元素包括普通字符和元字符,在Linux shell里面,常用的正則表達(dá)式元字符集為:S={* . ^ $ [] \ \<\> \{\} \{n,\} \{n,m\} },每一個(gè)元字符都有自己在正則表達(dá)式中的含義,下面來介紹一下:
“ * ”符號:表示匹配前面一個(gè)普通字符0次或多次。注意這里是一個(gè)普通字符,即如果是JO*B的話,那么*就匹配字符“O”任意次,而不是匹配“JO”串。
“ . ”符號:表示匹配任意一個(gè)字符。字符“ . "就表示一個(gè)字符,這個(gè)字符可以是任意字符。例如字符串 ...73 就表示前面3個(gè)字符為任意字符(包括空格),第4個(gè)和第5個(gè)字符分別是7和3。
“ ^ ”符號:表示匹配行首。例如:^cloud就表示匹配以cloud字符串開頭的所有行。與上面匹配一個(gè)字符不一樣,這里匹配的是后面跟著的整個(gè)字符串。
” $ "符號:表示匹配行尾。例如:cloud$ 就表示匹配以cloud字符串結(jié)尾的所有行。結(jié)合上面的匹配行首,^$表示匹配空行。
“ [] "符號:表示匹配方括號里面的字符集中的一個(gè)。例如:數(shù)字0-9中的任意一個(gè)數(shù)字都滿足[0-9]這個(gè)表達(dá)式。值得注意的是,當(dāng)^放在[]里面的時(shí)候,^就不再表示行首,而是表示取反。如:[^7-9]則表示非7-9中的任意一個(gè)數(shù)字才滿足這個(gè)表達(dá)式。
” \ “符號:是轉(zhuǎn)義字符。如果你寫的正則表達(dá)式里面包括元字符,而你又想將它當(dāng)做普通字符用的話,就要在前面加上轉(zhuǎn)義符號" \ "了。例如:\$就表示一個(gè)普通字符”$"。
“\<\>"符號:表示精確匹配<>內(nèi)的字符,” \ “是用來轉(zhuǎn)義<>這兩個(gè)字符的。例如:\<the\>表示匹配包含”the“的行,由于精確匹配,所以,”them“,”theory“這些單詞所在的行并不會被匹配到。
”\{\}"符號:與" * "類似,表示匹配前面的一個(gè)字符任意多次。但是“\{\}”可以指定重復(fù)的次數(shù),如\{3\}則表示重復(fù)前面的字符3次;\{3,\}表示重復(fù)前面的字符至少3次;\{3,5\}表示重復(fù)3到5次。例如:JO\{3\}B則表示重復(fù)字符O三次,即JOOOB;JO\{3,\}B則表示至少重復(fù)O三次,即JOOOB,JOOOOB等都符合;\{3,5\}則匹配JOOOB,JOOOOB,JOOOOOB這幾個(gè)字符串。
通配符
初學(xué)的時(shí)候?qū)τ谡齽t表達(dá)式和通配符的理解很模糊,兩個(gè)都是可以進(jìn)行模糊匹配的,到底什么時(shí)候用才是正則表達(dá)式,什么時(shí)候用是通配符呢?其實(shí),我們登錄系統(tǒng)之后,系統(tǒng)的bash shell并不支持正則表達(dá)式的,也就是說,我們?nèi)绻褂胋ash shell的某些命令時(shí)使用正則表達(dá)式,shell可能會認(rèn)不出來,只有當(dāng)我們使用類似grep,sed,awk等工具的時(shí)候才有效。所以,我們在使用bash shell的時(shí)候也想達(dá)到模糊匹配的目的的話,就要使用通配符了。
通配符是使用正則表達(dá)式的一些元字符來的,常用的元字符集:E={? * [] {} ^ }。不過,這個(gè)通配符的元字符意義跟正則表達(dá)式里面的不太一樣。例如:
“ * "字符不再表示匹配前面一個(gè)字符任意多次,而是表示任意位置的任意字符。例如:phi*ip,則可以匹配philip,phillip,philsaip等開始三個(gè)是phi和結(jié)尾兩位是ip的任意字符。例如ls -l *.awk表示匹配以.awk結(jié)尾的所有文件,*表示任意長度任意字符組合。
" ? ”字符才表示任意一個(gè)字符。同正則表達(dá)式元字符的" . "
" {} “字符不需要轉(zhuǎn)義。在{}表示的是表達(dá)式集合。如:ls -l {[a-h]*.awk,0?.pem}則表示列出所有以a-h字符開頭的.awk文件的和以0開頭,后面接一個(gè)任意字符的.pem文件
" ^ "字符也不是表示行首,而是代表取反。
正則表達(dá)式和通配的應(yīng)用環(huán)境上有些不一樣,但是都能夠達(dá)到模糊匹配的效果。在后面介紹到的使用grep,sed和awk等工具對于文件的查找以及各種操作中,正則表達(dá)式的匹配作用更加明顯。
范例:
檢測文件名是否符合規(guī)范:
#!/bin/bash RED='\033[31m' GREEN='\033[32m' awk '{printf("%s",$0)}' $1 | egrep "^#[[:digit:]]*-(docs|unittest|pseudocode|msg-[^ ].*)$" > /dev/null 2>&1 if [ $? -ne 0 ];then echo -e "message check ${RED}fail${NORMAL}" exit 1 fi echo -e "message check ${GREEN}success${NORMAL}" exit 0
文章題目:shell實(shí)現(xiàn)模糊匹配與正則-創(chuàng)新互聯(lián)
文章網(wǎng)址:http://www.rwnh.cn/article12/dohsdc.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供ChatGPT、動態(tài)網(wǎng)站、虛擬主機(jī)、外貿(mào)建站、外貿(mào)網(wǎng)站建設(shè)、微信小程序
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容