本篇文章給大家分享的是有關(guān)awk的操作是怎么樣的,小編覺得挺實(shí)用的,因此分享給大家學(xué)習(xí),希望大家閱讀完這篇文章后可以有所收獲,話不多說(shuō),跟著小編一起來(lái)看看吧。
awk是一種用于處理文本、模式匹配的編程語(yǔ)言。與sed和grep,俗稱 Linux 下的三劍客。學(xué)會(huì) awk 等于你在 Linux 命令行里,又多了一種處理文本的選擇。這篇文章重點(diǎn)教你如何使用,看完這篇文章,就大致知道如何使用了,力求簡(jiǎn)單使用。 |
術(shù)語(yǔ)鋪墊
在awk的文本處理規(guī)則里,awk將文本文件視為由字段和記錄組成的文本數(shù)據(jù)庫(kù)。默認(rèn)情況下,awk將每一行視為一個(gè)記錄,也就是說(shuō)記錄的分隔符是 ,記錄的分隔符可以通過(guò)內(nèi)置變量RS更改。
在每一個(gè)記錄中,又把記錄分為若干個(gè)字段,即記錄由字段組成,而字段的默認(rèn)分隔符為空格或制表符。
一、基礎(chǔ)用法
和我們平常使用的 Linux 命令一樣, awk 也是遵循著某種格式來(lái)使用,格式如下:
# 使用格式
awk 執(zhí)行的事件 文件
# 例如:
root@jaking-virtual-machine:~# awk '{print $0}' test.txt My first language:Python My second language:Shell My third language:Java My fourth language:C
其中,print 表示打印,$0 表示一整個(gè)記錄,test.txt 表示一個(gè)文件。所以
awk '{print $0}' test.txt
表示把 test.txt 文件里面的每行記錄都打印出來(lái)。
$0 表示整個(gè)記錄,不過(guò) $1, $2, $3.....則表示整個(gè)記錄中的第一個(gè)字段,第二個(gè)字段......。
root@jaking-virtual-machine:~# awk '{print $1}' test.txt My My My My root@jaking-virtual-machine:~# awk '{print $2}' test.txt first second third fourth root@jaking-virtual-machine:~# awk '{print $3}' test.txt language:Python language:Shell language:Java language:C
剛才我們說(shuō)字段的默認(rèn)分隔符是空格或者制表符這些,默認(rèn)意味著我們可以自己顯式著指定分隔符。下面我們用“:”來(lái)作為我們的分隔符吧。
root@jaking-virtual-machine:~# awk -F ':' '{print $2}' test.txt Python Shell Java C
上面我們用參數(shù) -F 指定了我們的分隔符,即如果想要指定字段的分隔符,可以用參數(shù) -F 指定分隔符。
二、條件限制
在打印文本的時(shí)候,我們可以指定一些條件。格式如下:
awk 參數(shù) 條件 要執(zhí)行的動(dòng)作 文件
例如我們指定分隔符為“:”,條件為第二個(gè)字段為"Java"的記錄。
# 打印第二個(gè)字段為"Java"的文本
root@jaking-virtual-machine:~# awk -F ':' '$2 == "Java" {print $2}' test.txt Java
打印奇數(shù)行的的第二個(gè)字段:
# 打印奇數(shù)行的記錄
root@jaking-virtual-machine:~# awk -F ':' 'NR % 2 == 1 {print $2}' test.txt Python Java
其中,NR 是一個(gè)內(nèi)置的變量,表示當(dāng)前正在處理的記錄,即當(dāng)前的記錄是第幾個(gè)記錄。
三、條件語(yǔ)句
和我們平常的編程一樣,awk 也提供了 if, else, while 等這些條件語(yǔ)句。
例如,打印第二個(gè)及其之后的記錄:
root@jaking-virtual-machine:~# awk '{if(NR > 1) print $2}' test.txt second third fourth
注意,上面的字段分隔符是空格了,并且 if 語(yǔ)句是在“{}” 里指定的。
再看一個(gè)例子:
root@jaking-virtual-machine:~# awk '{if($1 < "s") print $1; else print $2}' test.txt # 如果第一個(gè)字段小于“s",則打印第一個(gè)字段,否則打印第二個(gè)字段 My My My My root@jaking-virtual-machine:~# awk '{if($1 > "s") print $1; else print $2}' test.txt first second third fourth root@jaking-virtual-machine:~# awk '{if($1 < "l") print $1; else print $2}' test.txt My My My My root@jaking-virtual-machine:~# awk '{if($1 > "l") print $1; else print $2}' test.txt first second third fourth root@jaking-virtual-machine:~# awk '{if($1 > "c") print $1; else print $2}' test.txt first second third fourth root@jaking-virtual-machine:~# awk '{if($1 > "d") print $1; else print $2}' test.txt first second third fourth root@jaking-virtual-machine:~# awk '{if($1 > "p") print $1; else print $2}' test.txt first second third fourth root@jaking-virtual-machine:~# awk '{if($1 < "p") print $1; else print $2}' test.txt My My My My root@jaking-virtual-machine:~# awk '{if($3 < "s") print $3; else print $2}' test.txt language:Python language:Shell language:Java language:C root@jaking-virtual-machine:~# awk '{if($2 < "s") print $3; else print $2}' test.txt language:Python second third language:C root@jaking-virtual-machine:~# awk '{if($2 < "s") print $1; else print $2}' test.txt My second third My
四、函數(shù)
awk 提供了一些內(nèi)置函數(shù)來(lái)供我們使用,一下常用的函數(shù)如下:
tolower():字符轉(zhuǎn)為小寫。 toupper():字符轉(zhuǎn)為大寫 length():返回字符串長(zhǎng)度。 substr():返回子字符串。 sqrt():平方根。 rand():隨機(jī)數(shù)。
root@jaking-virtual-machine:~# awk '{print toupper($1)}' test.txt MY MY MY MY root@jaking-virtual-machine:~# awk '{print tolower($1)}' test.txt my my my my root@jaking-virtual-machine:~# awk -F ':' '{print toupper($2)}' test.txt PYTHON SHELL JAVA C root@jaking-virtual-machine:~# awk -F ':' '{print tolower($2)}' test.txt python shell java c
五、變量
剛才我們說(shuō) NR 是一個(gè)表示當(dāng)前正在處理的記錄是第幾個(gè)記錄的內(nèi)置變量,常用的內(nèi)置變量如下:
NR:表示當(dāng)前處理的是第幾行 NF:表示當(dāng)前行有多少個(gè)字段 FILENAME:當(dāng)前文件名 FS:字段分隔符,默認(rèn)是空格和制表符。 RS:行分隔符,用于分割每一行,默認(rèn)是換行符。 OFS:輸出字段的分隔符,用于打印時(shí)分隔字段,默認(rèn)為空格。 ORS:輸出記錄的分隔符,用于打印時(shí)分隔記錄,默認(rèn)為換行符。
例如我們要打印每一個(gè)記錄的最后一個(gè)字段,就可以使用變量 NF 了。
root@jaking-virtual-machine:~# awk '{print $NF}' test.txt language:Python language:Shell language:Java language:C
對(duì)了,剛才那個(gè) NR 的變量也是挺好用的,例如:
root@jaking-virtual-machine:~# awk '{print NR ". " $0}' test.txt 1. My first language:Python 2. My second language:Shell 3. My third language:Java 4. My fourth language:C
以上就是awk的操作是怎么樣的,小編相信有部分知識(shí)點(diǎn)可能是我們?nèi)粘9ぷ鲿?huì)見到或用到的。希望你能通過(guò)這篇文章學(xué)到更多知識(shí)。更多詳情敬請(qǐng)關(guān)注創(chuàng)新互聯(lián)-成都網(wǎng)站建設(shè)公司行業(yè)資訊頻道。
網(wǎng)頁(yè)名稱:awk的操作是怎么樣的-創(chuàng)新互聯(lián)
網(wǎng)站網(wǎng)址:http://www.rwnh.cn/article12/dosjgc.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供品牌網(wǎng)站建設(shè)、移動(dòng)網(wǎng)站建設(shè)、云服務(wù)器、營(yíng)銷型網(wǎng)站建設(shè)、動(dòng)態(tài)網(wǎng)站、微信小程序
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容