中文字幕日韩精品一区二区免费_精品一区二区三区国产精品无卡在_国精品无码专区一区二区三区_国产αv三级中文在线

正則表達(dá)式之前后查找lookaround的示例分析-創(chuàng)新互聯(lián)

這篇文章主要為大家展示了“正則表達(dá)式之前后查找lookaround的示例分析”,內(nèi)容簡而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領(lǐng)大家一起研究并學(xué)習(xí)一下“正則表達(dá)式之前后查找lookaround的示例分析”這篇文章吧。

成都創(chuàng)新互聯(lián)是一家集網(wǎng)站建設(shè),灤平企業(yè)網(wǎng)站建設(shè),灤平品牌網(wǎng)站建設(shè),網(wǎng)站定制,灤平網(wǎng)站建設(shè)報價,網(wǎng)絡(luò)營銷,網(wǎng)絡(luò)優(yōu)化,灤平網(wǎng)站推廣為一體的創(chuàng)新建站企業(yè),幫助傳統(tǒng)企業(yè)提升企業(yè)形象加強(qiáng)企業(yè)競爭力??沙浞譂M足這一群體相比中小企業(yè)更為豐富、高端、多元的互聯(lián)網(wǎng)需求。同時我們時刻保持專業(yè)、時尚、前沿,時刻以成就客戶成長自我,堅持不斷學(xué)習(xí)、思考、沉淀、凈化自己,讓我們?yōu)楦嗟钠髽I(yè)打造出實(shí)用型網(wǎng)站。

一、問題引入

在HTML頁面中,匹配出一對標(biāo)簽之間的文本,如匹配出頁面的標(biāo)簽,即<title>與</title>之間的文本:

文本:<head><TITLE>welcome to my page</title></head>

正則表達(dá)式:<[Tt][Ii][Tt][Ll][Ee]>.*?</ [Tt][Ii][Tt][Ll][Ee]>

結(jié)果:<head>【<TITLE>welcome to my page</title>】</head>

分析:<[Tt][Ii][Tt][Ll][Ee]>表示不區(qū)分大小寫,這個模式匹配到了title標(biāo)簽以及它們之間的文本,但是并不完美,因?yàn)槲覀冎幌胍猼itle標(biāo)簽之間的文本,而不包括標(biāo)簽本身。解決這個問題我們就需要用到前后查找(lookaround)。

二、向前查找

向前查找指定了一個必須匹配但不在結(jié)果中返回的模式。向前查找實(shí)際上就是一個子表達(dá)式,它以?=開頭,需要匹配的文本跟在=的后面。

看一個匹配出一個URL地址中協(xié)議部分的例子:

文本:http://blog.csdn.net/mhmyqn

正則表達(dá)式:.+(?=:)

結(jié)果:【http】://blog.csdn.net/mhmyqn

分析:URL地址中協(xié)議部分是在:之前的部分,模式.+匹配任意文本,子表達(dá)式(?=:)匹配:,但是被匹配到的:并沒有出現(xiàn)在結(jié)果中。我們使用?=向正則表達(dá)式引擎表明,只要找到:就行了,但不包括在最終的返回結(jié)果里。這里如果不使用向前匹配(?=:),而是直接使用(:),那么匹配結(jié)果就會是http:了,它包括了:,并不是我們想要的。

注意:前后查找中的前、后是指模式與被查找文本的相對位置而言的,左為前,右為后。即向前查找為:xxx(?=xxx),而向后查找為(?<=xxx)xxx,向后查找在接下來會介紹到。

三、向后查找

向后查找操作符是?<=。但是并不是所有的正則表達(dá)式實(shí)現(xiàn)都支持向后查找,JavaScript就不支持,java語言支持向后查找。

比如要查找文本當(dāng)中的價格(以$開頭,后面跟數(shù)字),結(jié)果不包含貨幣符號:

文本:category1:$136.25,category2:$28,category3:$88.60

正則表達(dá)式:(?<=\$)\d+(\.\d+)?

結(jié)果:category1:$【136.25】,category2:$【28】,category3:$【88.60】

分析:(?<=\$)模式匹配$,\d+(\.\d+)?模式匹配整數(shù)或小數(shù)。從結(jié)果可以看出,結(jié)果不沒有包括貨幣符號,只匹配出了價格。如果不使用向后查找,情況會是什么樣呢?使用模式$\d+(\.\d+)?,這樣會把$包含在結(jié)果中。使用模式\d+(\.\d+)?,又會把categery1(23)中的數(shù)字也匹配出來,都不是我們想要的。

注意:向前查找模式的長度是可變的,它們可以包含.、*、+之類的元字符;而向后查找模式只能是固定長度,不能包含.、*、+之類的元字符。

四、把向前查找和向后查找結(jié)合起來

把向前查找和向后查找結(jié)合起來使用,即可解決前面HTML標(biāo)簽之間的文本的問題:

文本:<head><TITLE>welcome to my page</title></head>

正則表達(dá)式:(?<=<[Tt][Ii][Tt][Ll][Ee]>).*?(?=</ [Tt][Ii][Tt][Ll][Ee]>)

結(jié)果:<head><TITLE>【welcome to my page】</title></head>

分析:從結(jié)果可以看出,問題完美的解決了。(?<=<[Tt][Ii][Tt][Ll][Ee]>)是一個向后操作,它匹配<title>但不消費(fèi)它,(?=</[Tt][Ii][Tt][Ll][Ee]>)是一個向前操作,它匹配</title>但不消費(fèi)它。最終返回的匹配結(jié)果只包含了標(biāo)簽之間的文本了。

五、對前后查找取非

前面說到的向前查找和向后查找通常都是用來匹配文本,其目的是為了確定將被返回的匹配結(jié)果的文本的位置(通過指定匹配結(jié)果的前后必須是哪些文本)。這種用法叫正向前查找和正向后查找。還有一種負(fù)向前查找和負(fù)向后查找,是查找那些不與給定模式相匹配的文本。

前后查找的操作符:

(?=)正向前查找
(?!)負(fù)向前查找
(?<=)正向后查找
(?<!)負(fù)向后查找

比如一段文本中即有價格(以$開頭,后面跟數(shù)字)和數(shù)量,我們要找出價格和數(shù)量,先來看查找價格:

文本:I paid $30 for 10 apples, 15 oranges, and 10 pears. I saved $5 onthis order.

正則表達(dá)式:(?<=\$)\d+

結(jié)果:I paid 【$30】 for 10 apples, 15 oranges, and 10 pears. I saved 【$5】 on thisorder.

查找數(shù)量:

文本:I paid $30 for 10 apples, 15 oranges, and 10 pears. I saved $5 onthis order.

正則表達(dá)式:\b(?<!\$)\d+\b

結(jié)果:I paid $30 for 【10】 apples, 【15】 oranges, and 【10】pears. I saved $5 on this order.

分析:(?<!\$)表示一個負(fù)向后查找,它使得結(jié)果只包含那些不以$開頭的數(shù)值。

以上是“正則表達(dá)式之前后查找lookaround的示例分析”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對大家有所幫助,如果還想學(xué)習(xí)更多知識,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道!

網(wǎng)站標(biāo)題:正則表達(dá)式之前后查找lookaround的示例分析-創(chuàng)新互聯(lián)
當(dāng)前URL:http://www.rwnh.cn/article18/dcpjdp.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站建設(shè)網(wǎng)站收錄、微信公眾號ChatGPT、響應(yīng)式網(wǎng)站、App開發(fā)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

成都定制網(wǎng)站網(wǎng)頁設(shè)計
淮阳县| 化隆| 万载县| 昭平县| 泊头市| 秭归县| 东至县| 礼泉县| 页游| 柘城县| 绥德县| 漠河县| 龙泉市| 宣威市| 沂水县| 甘泉县| 山西省| 边坝县| 策勒县| 溧水县| 分宜县| 响水县| 台南市| 延安市| 广南县| 黑河市| 广昌县| 丰镇市| 信宜市| 宜阳县| 克拉玛依市| 罗甸县| 夏津县| 苏尼特左旗| 襄汾县| 宁都县| 介休市| 霸州市| 寿阳县| 朝阳区| 临洮县|