如何在Linux中使用正則表達式搜索文件中的文本

本篇文章為大家展示了如何在Linux中使用正則表達式搜索文件中的文本，內(nèi)容簡明扼要并且容易理解，絕對能使你眼前一亮，通過這篇文章的詳細介紹希望你能有所收獲。

專注于為中小企業(yè)提供成都做網(wǎng)站、網(wǎng)站建設服務,電腦端+手機端+微信端的三站合一,更高效的管理,為中小企業(yè)河東免費做網(wǎng)站提供優(yōu)質的服務。我們立足成都，凝聚了一批互聯(lián)網(wǎng)行業(yè)人才，有力地推動了數(shù)千家企業(yè)的穩(wěn)健成長，幫助中小企業(yè)通過網(wǎng)站建設實現(xiàn)規(guī)模擴充和轉變。

正則表達式是一種符號表示法，用于識別文本模式。Linux處理正則表達式的主要程序是grep。grep搜索與正則表達式匹配的行，并將結果輸送至標準輸出。

1. grep匹配模式

grep按下述方式接受選項和參數(shù)(其中，regex表示正則表達式)

復制代碼代碼如下:

grep [options] regex [files]

其中options主要為下表：

選項	含義	功能描述
-i	ignore case	忽略大小寫
-v	invert match	不匹配匹配的
-l	file-with-match	輸出匹配的文件名
-L	file-without-match	輸出不匹配的文件名
-c	count	輸出匹配的數(shù)目（行數(shù)）
-n	number	輸出匹配行的同時在前面加上文件名及在文件名中的行數(shù)
-h	no-filename	抑制文件名的輸出

作為一個Linux管理員，您需要對文本文件進行處理。您可以使用不同的工具如grep、awk以及sed去查找包含特定文本串的文件。這里，我將介紹一種使用正則表達式，以靈活的方式，去搜索文件中的文本的方法。

讓我們考慮一個正則表達式發(fā)揮作用的例子。比如，當你嘗試使用命令grep –r host /時，其返回的結果會很龐大。因為每一個包含host這個文本串的字(像ghostscript這樣的字)都會匹配。采用正則表達式，你可以更好地定制你要查找什么。例如，你可以使用正則表達式'^host'，告訴grep僅僅查找以host開始的行。

正則表達式并不是在所有命令中都可用，您使用的命令必須已經(jīng)事先編好程序，以便能夠使用正則表達式。這些命令中最普遍使用的命令是grep、tr以及vi。其它的工具，像sed和awk，也可以使用正則表達式。

使用正則表達式的一個例子為：

復制代碼代碼如下:

grep 'lin.x' *

正則表達式'lin.x'中的點有特殊的含義。它會匹配處于該位置的任意字符。為了防止解釋性的問題，我建議您總是將正則表達式置于單引號間，這樣就可以防止shell對正則表達式進行解釋。

使用正則表達式

您可以使用正則表達式做很多事情。在以下的列表中，您可以找到一些最普通、最常用的正則表達式的例子。

    * ^：表示文本串必須在一行的開頭。所以，當查找行的開頭只為“hosts”的行，可以使用命令：grep -ls '^hosts'
    * $：代表了一行的結尾。所以，當查找行的結尾只為“hosts”的行，可以使用命令：grep -ls 'hosts$'
    * 　　你可以在一個正則表達式中結合^和$，去查找僅僅包含"yes"的行，使用的命令為grep -ls '^yes$'
    * .：一個可以指代除了換行符以外任意字符的通配符。為了查找包含tex、tux、tox或者tix的行，可以使用：grep -ls 't.x'
    * [ ]：表示在一個正則表達式中，方括號之間的字符是可選的。為了查找名字為pinda或者linda的用戶，可以使用命令：grep -ls '[pl]inda'
    * [^ ]：忽略掉方括號中^之后的所有字符。為了查找包含文本linda的行，并忽略掉其中僅包含linda或者pinda的行，命令為：grep -ls '[^pl]inda'
    * -：代表一類或者一個范圍內(nèi)的字符。在像tr這樣的命令中，這是非常有用的。以下的命令可以將所有的小寫字母轉為大寫字母：tr a-z A-Z < mytext。同樣地，你可以使用正則表達式grep -ls '^0-9'去查找其中有一些行是以數(shù)字開頭的文件。
    * \< 和 \>：查找一個字的開頭或者結尾的模式。查找行的開頭的字以"san"為起始的命令為： grep \<SAN< code>。這些正則表達式有兩個缺點—他們并不查找以指定的正則表達式開頭的行，并且他們并不被所有的工具所支持。但是，vi和grep是支持這種用法的。
    * \：確保在正則表達式中有特殊含義的字符不被解釋。查找以任何字符開始，后面跟著文本"host"的文本串的命令為grep -ls '.host'。而如果你需要查找以點為第一個字符，緊接著為"host"的文本串，可以用命令：grep -ls '\.host'

這些正則表達式可以幫助您找到包含特定文本串的字。您也可以使用正則表達式去指定,在一個字中，該字符串出現(xiàn)的頻率。比如，您可以使用正則表達式去搜索剛好包含用戶名"linda"三次的文件。為了達到這一目的，您需要使用正則表達式的重復算子，并保證整個正則表達式位于引號中。沒有引號的話，您可能會導致shell去解釋您的重復算子。

最重要的重復算子的列表如下：

    * *：表示前述的正則表達式可能出現(xiàn)一次、多次或者根本不出現(xiàn)。注意：不要和shell中的*混淆—在shell中，*表示任意字符，而在正則表達式中，*表示之前的正則表達式可能存在。
    * ?：表示在該位置可能是一個字符（但并不是必須是）。例如，同時查找color和colour的命令為：grep -ls 'colo.r'
    * +：表示之前的字符或者正則表達式至少要出現(xiàn)一次
    * \{n\}：表示之前的字符或者正則表達式至少要出現(xiàn)n次。當你查找一個介于100到999之間的數(shù)字時，這是很有用的：grep -ls '0-9\{3\}'

上述內(nèi)容就是如何在Linux中使用正則表達式搜索文件中的文本，你們學到知識或技能了嗎？如果還想學到更多技能或者豐富自己的知識儲備，歡迎關注創(chuàng)新互聯(lián)行業(yè)資訊頻道。

當前名稱：如何在Linux中使用正則表達式搜索文件中的文本
轉載來源：http://www.rwnh.cn/article16/jieogg.html

成都網(wǎng)站建設公司_創(chuàng)新互聯(lián)，為您提供微信小程序、商城網(wǎng)站、外貿(mào)網(wǎng)站建設、標簽優(yōu)化、虛擬主機、移動網(wǎng)站建設

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉載內(nèi)容為主，如果涉及侵權請盡快告知，我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場，如需處理請聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉載，或轉載時需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容

内射老阿姨1区2区3区4区_久久精品人人做人人爽电影蜜月_久久国产精品亚洲77777_99精品又大又爽又粗少妇毛片

如何在Linux中使用正則表達式搜索文件中的文本