中文字幕日韩精品一区二区免费_精品一区二区三区国产精品无卡在_国精品无码专区一区二区三区_国产αv三级中文在线

python讀取docx文件,就是如此簡(jiǎn)單-創(chuàng)新互聯(lián)

中文編碼問(wèn)題總是讓人頭疼(尤其是mac本),想要用 Python讀取word中的內(nèi)容。用open()經(jīng)常報(bào)錯(cuò),通過(guò)百度搜索+問(wèn)身邊小伙伴發(fā)現(xiàn)了 Python有專門讀取.docx的模塊python_docx。本篇文章主要來(lái)解決一個(gè)讀取docx文件的基本操作。希望感興趣的小伙伴可以堅(jiān)持看下去同時(shí)歡迎提出寶貴的意見(jiàn)讓我們一起進(jìn)步!

創(chuàng)新互聯(lián)建站長(zhǎng)期為近千家客戶提供的網(wǎng)站建設(shè)服務(wù),團(tuán)隊(duì)從業(yè)經(jīng)驗(yàn)10年,關(guān)注不同地域、不同群體,并針對(duì)不同對(duì)象提供差異化的產(chǎn)品和服務(wù);打造開(kāi)放共贏平臺(tái),與合作伙伴共同營(yíng)造健康的互聯(lián)網(wǎng)生態(tài)環(huán)境。為驛城企業(yè)提供專業(yè)的網(wǎng)站制作、成都網(wǎng)站設(shè)計(jì),驛城網(wǎng)站改版等技術(shù)服務(wù)。擁有十年豐富建站經(jīng)驗(yàn)和眾多成功案例,為您定制開(kāi)發(fā)。
01:?jiǎn)栴}拋出與引入
import docx

path = "C:\\Users\\qin\\Desktop\\1.docx"
file_object=open(path,'rb')
print(file_object.read())
#輸出結(jié)果如下所示:
b'PK\\x03\\x04\\x14\\x00\\x06\\x00\\x08\\x00\\x00\\x00!\\x00J\\xbc\\x02qm\\x01\\x00\\x00
(\\x06\\x00\\x00\\x13\\x00\\x08\\x02[Content_Types].xml \\xa2\\x04\\x02(\\xa0\.....

一個(gè)很簡(jiǎn)單的docx文件,打印出來(lái)的結(jié)果卻不是我們想要的。對(duì)此引入一個(gè)十分好用的docx模塊,下面就詳細(xì)介紹該模塊的一些基本操作。

02:安裝docx模塊
pip install python_docx

03:新建文檔對(duì)象
import docx

from docx import Document
# 新建文檔,并將其保存名為“test.docx”的文件
document = Document()
document.save('test.docx')
04:添加文檔內(nèi)容
import docx

from docx import Document
from docx.shared import Inches
document = Document('C:\\Users\\qin\\Desktop\\1.docx')
document.add_heading('I like python', 0)#插入標(biāo)題:0表示樣式為title標(biāo)題
document.add_heading('一級(jí)標(biāo)題', level=1)#插入1級(jí)標(biāo)題
p = document.add_paragraph('Python是一種計(jì)算機(jī)程序設(shè)計(jì)語(yǔ)言 ')#插入段落
document.add_picture('C:\\Users\\qin\\Desktop\\1.png', width=Inches(1.25)) #添加圖片并指定寬度
table = document.add_table(rows=1, cols=3)  #添加一個(gè)表格,每行三列
hdr_cells = table.rows[0].cells  #獲取第一行的單元格列表對(duì)象
hdr_cells[0].text = 'ID'    #為每一個(gè)單元格賦值
hdr_cells[1].text = 'Name'
hdr_cells[2].text = 'Age'
new_cells = table.add_row().cells #為表格添加一行
new_cells[0].text = '1'
new_cells[1].text = 'Tom'
new_cells[2].text = '15'
document.add_page_break()   #添加分頁(yè)符
05:保存文檔內(nèi)容

名字相同則將修改的文件內(nèi)容 保存; 名字不同則將修改的文件內(nèi)容 另存為。

import docx

from docx import Document
document.save('C:\\Users\\qin\\Desktop\\1.docx')#保存
document.save('C:\\Users\\qin\\Desktop\\2.docx')#另存為
06:讀取文本內(nèi)容
import docx

from docx import Document
path = "C:\\Users\\qin\\Desktop\\1.docx"
document = Document(path)
for paragraph in document.paragraphs:
   print(paragraph.text)
07:讀取表格內(nèi)容
import docx

from docx import Document
path = "C:\\Users\\qin\\Desktop\\1.docx"
document = Document(path)  # 讀入文件
tables = document.tables   # 獲取文件中的表格集
table = tables[0]  # 獲取文件中的第一個(gè)表格
for i in range(0, len(table.rows)):  # 從表格第一行開(kāi)始循環(huán)讀取表格數(shù)據(jù)
   result = f'{(table.cell(i, 0).text):<5}' + "" + f'{(table.cell(i, 1).text):<5}' + "" + f'{(table.cell(i, 2).text):<5}'
   # cell(i,0)表示第(i+1)行第1列數(shù)據(jù),以此類推
   print(result)

想要知道docx模塊更多資料參考:https://python-docx.readthedocs.io/en/latest/

當(dāng)前題目:python讀取docx文件,就是如此簡(jiǎn)單-創(chuàng)新互聯(lián)
本文地址:http://www.rwnh.cn/article16/dcddgg.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供App開(kāi)發(fā)網(wǎng)站收錄、標(biāo)簽優(yōu)化、App設(shè)計(jì)微信公眾號(hào)、企業(yè)建站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

商城網(wǎng)站建設(shè)
马尔康县| 米脂县| 梅州市| 邵阳县| 安达市| 桓仁| 庆安县| 南安市| 惠州市| 永善县| 基隆市| 白城市| 正阳县| 禹州市| 邢台县| 河南省| 松原市| 缙云县| 祥云县| 蓬安县| 龙陵县| 上虞市| 肥西县| 镇康县| 凤山县| 铜川市| 钦州市| 慈溪市| 吴川市| 许昌市| 万宁市| 龙游县| 大同县| 武夷山市| 贺兰县| 天津市| 堆龙德庆县| 中山市| 宕昌县| 绵竹市| 乌兰县|