c # c 是a和b的合集 cat a b | sort | u...">
瀏覽量:11次
這里說(shuō)的“瑞士軍刀”是指那些簡(jiǎn)單的一句命令就能完成其它高級(jí)語(yǔ)言一大片代碼才能完成的工作。
下面的這些內(nèi)容是Quora網(wǎng)站上Joshua Levy網(wǎng)友的總結(jié):
通 過(guò)sort/uniq獲取文件內(nèi)容的交集、合集和不同之處:假設(shè)有a、b兩個(gè)文本文件,文件本身已經(jīng)去除了重復(fù)內(nèi)容。下面是效率最高的方法,可以處理任何 體積的文件,甚至幾個(gè)G的文件。(Sort對(duì)內(nèi)存沒(méi)有要求,但也許你需要用 -T 參數(shù)。)可以試著比較一下,你可以看看如果用Java來(lái)處理磁盤上文件的合并,需要用多少行代碼。
復(fù)制代碼 代碼如下:
cat a b | sort | uniq > c # c 是a和b的合集 cat a b | sort | uniq -d > c # c 是a和b的交集 cat a b b | sort | uniq -u > c # c 是a和b的不同
匯總一個(gè)文本內(nèi)容里第三列數(shù)字的和(這個(gè)方法要比用Python來(lái)做快3倍并只需1/3的代碼量):
復(fù)制代碼 代碼如下:
awk ‘{ x += $3 } END { print x }' myfile
如果你想查看一個(gè)目錄樹(shù)里的文件的體積和修改日期,用下面的方法,相當(dāng)于你挨個(gè)目錄做”ls -l”,而且輸出的形式比你用”ls -lR”更可讀:
復(fù)制代碼 代碼如下:
find . -type f -ls
使用xargs命令。這個(gè)命令非常的強(qiáng)大。注意每行上你可以控制多少個(gè)東西的執(zhí)行。如果你不確定它是正確的執(zhí)行,先使用xargs echo。同樣,-I{} 也非常有用。例子:
復(fù)制代碼 代碼如下:
find . -name *.py | xargs grep some_function cat hosts | xargs -I{} ssh root@{} hostname
假設(shè)你有一個(gè)文本文件,比如一個(gè)web服務(wù)器日志,在某些行上有一些值,比如URL中的acct_id參數(shù)。如果你想統(tǒng)計(jì)每個(gè)acct_id的所有請(qǐng)求記錄:
復(fù)制代碼 代碼如下:
cat access.log | egrep -o ‘a(chǎn)cct_id=[0-9]+' | cut -d= -f2 | sort | uniq -c | sort -rn ]
[聲明]本網(wǎng)轉(zhuǎn)載網(wǎng)絡(luò)媒體稿件是為了傳播更多的信息,此類稿件不代表本網(wǎng)觀點(diǎn),本網(wǎng)不承擔(dān)此類稿件侵權(quán)行為的連帶責(zé)任。故此,如果您發(fā)現(xiàn)本網(wǎng)站的內(nèi)容侵犯了您的版權(quán),請(qǐng)您的相關(guān)內(nèi)容發(fā)至此郵箱【779898168@qq.com】,我們?cè)诖_認(rèn)后,會(huì)立即刪除,保證您的版權(quán)。
官網(wǎng)優(yōu)化
整站優(yōu)化
渠道代理
400-655-5776