數(shù)據(jù)清洗常用的2個小trick分別是什么

今天就跟大家聊聊有關(guān)數(shù)據(jù)清洗常用的2個小trick分別是什么，可能很多人都不太了解，為了讓大家更加了解，小編給大家總結(jié)了以下內(nèi)容，希望大家根據(jù)這篇文章可以有所收獲。

成都創(chuàng)新互聯(lián)公司-專業(yè)網(wǎng)站定制、快速模板網(wǎng)站建設(shè)、高性價比硚口網(wǎng)站開發(fā)、企業(yè)建站全套包干低至880元,成熟完善的模板庫,直接使用。一站式硚口網(wǎng)站制作公司更省心,省錢,快速模板網(wǎng)站建設(shè)找我們，業(yè)務(wù)覆蓋硚口地區(qū)。費用合理售后完善，10年實體公司更值得信賴。

Pandas 巧用 `str.split` 和 `str.cat`

因為以上兩個方法，直接按列操作，所以省掉一層 for 循環(huán)，下面直接看例子。

df = pd.DataFrame({'names':["Geordi La Forge", "Deanna Troi", "Jack"],'IDs':[1,2,3]})
df

列分割

對 names 列，按照第一個空格分割為兩列：

df["first_name"] = df["names"].str.split(n = 1).str[0]
df["last_name"] = df["names"].str.split(n = 1).str[1]
df

結(jié)果如下：

列合并方法 1

分割列搞定，接下來再合并回去，使用 cat 方法：

df["names_copy"] = df["first_name"].str.cat(df["last_name"], sep = " ")
df

合并兩列得到一個新列 names_copy 搞定！

列合并方法 2

還有別的合并方法嗎，直接使用 + 連接字符串：

df["names_copy2"] = df["first_name"] + " "+ df["last_name"]
df

效果是一樣的：

Pandas 多條件篩選可讀性較好的寫法

有特征上百個，根據(jù)多個特征篩選 DataFrame 時，如果這么做，可讀性不太友好：

df[(df["continent"] == "Europe") & (df["beer_servings"] > 150) & (df["wine_servings"] > 50) & (df["spirit_servings"] < 60)]

連續(xù)多個篩選條件寫到一行里。

更好可讀性的寫法

cr1 = df["continent"] == "Europe"
cr2 = df["beer_servings"] > 150
cr3 = df["wine_servings"] > 50
cr4 = df["spirit_servings"] < 60

df[cr1 & cr2 & cr3 & cr4]

看完上述內(nèi)容，你們對數(shù)據(jù)清洗常用的2個小trick分別是什么有進(jìn)一步的了解嗎？如果還想了解更多知識或者相關(guān)內(nèi)容，請關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道，感謝大家的支持。

分享名稱：數(shù)據(jù)清洗常用的2個小trick分別是什么
文章地址：http://www.rwnh.cn/article28/gjhhcp.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián)，為您提供定制網(wǎng)站、網(wǎng)站營銷、云服務(wù)器、做網(wǎng)站、小程序開發(fā)、微信公眾號

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請盡快告知，我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場，如需處理請聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容

内射老阿姨1区2区3区4区_久久精品人人做人人爽电影蜜月_久久国产精品亚洲77777_99精品又大又爽又粗少妇毛片