内射老阿姨1区2区3区4区_久久精品人人做人人爽电影蜜月_久久国产精品亚洲77777_99精品又大又爽又粗少妇毛片

用python爬取歷史天氣數(shù)據(jù)的方法示例-創(chuàng)新互聯(lián)

某天氣網(wǎng)站(www.數(shù)字.com)存有2011年至今的天氣數(shù)據(jù),有天看到一本爬蟲教材提到了爬取這些數(shù)據(jù)的方法,學習之,并加以改進。

創(chuàng)新互聯(lián)建站堅持“要么做到,要么別承諾”的工作理念,服務領域包括:成都網(wǎng)站設計、成都網(wǎng)站建設、企業(yè)官網(wǎng)、英文網(wǎng)站、手機端網(wǎng)站、網(wǎng)站推廣等服務,滿足客戶于互聯(lián)網(wǎng)時代的澄城網(wǎng)站設計、移動媒體設計的需求,幫助企業(yè)找到有效的互聯(lián)網(wǎng)解決方案。努力成為您成熟可靠的網(wǎng)絡建設合作伙伴!

爬之前先分析url。左上有年份、月份的下拉選擇框,按F12,進去看看能否找到真正的url:


很容易就找到了,左邊是儲存月度數(shù)據(jù)的js文件,右邊是文件源代碼,貌似json格式。

雙擊左邊js文件,地址欄內出現(xiàn)了url:http://tianqi.數(shù)字.com/t/wea_history/js/54511_20161.js

url中的“54511”是城市代碼,“20161”是年份和月份代碼。下一步就是找到城市代碼列表,按城市+年份+月份構造url列表,就能開始遍歷爬取了。

城市代碼也很誠實,很快就找到了:

下一步得把城市名稱和代碼提取出來,構造一個“城市名稱:城市代碼”的字典,或者由元組(城市名稱,城市代碼)組成的列表,供爬取時遍歷。考慮到正則提取時,構造元組更便捷,就不做成字典了。

def getCity():
  html = reqs.get('https://tianqi.2345.com/js/citySelectData.js').content
  text = html.decode('gbk')
  city = re.findall('([1-5]\d{4})\-[A-Z]\s(.*?)\-\d{5}',text)  #只提取了地級市及以上城市的名稱和代碼,5以上的是縣級市  
  city = list(set(city))                    #去掉重復城市數(shù)據(jù)
  print('城市列表獲取成功')
  return city

網(wǎng)頁題目:用python爬取歷史天氣數(shù)據(jù)的方法示例-創(chuàng)新互聯(lián)
當前URL:http://www.rwnh.cn/article36/csjdsg.html

成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供App開發(fā)動態(tài)網(wǎng)站、云服務器、微信公眾號面包屑導航、全網(wǎng)營銷推廣

廣告

聲明:本網(wǎng)站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)

網(wǎng)站托管運營
会昌县| 隆子县| 红原县| 陆川县| 乌拉特后旗| 舞钢市| 修武县| 五莲县| 古浪县| 西安市| 华宁县| 许昌县| 临武县| 黄龙县| 蒙自县| 仙居县| 监利县| 广昌县| 连江县| 黑山县| 蒙城县| 冀州市| 曲麻莱县| 衢州市| 沾化县| 古田县| 绿春县| 盐边县| 尼勒克县| 岐山县| 祁东县| 商水县| 石首市| 尼玛县| 汤原县| 商洛市| 五寨县| 剑河县| 昔阳县| 汝阳县| 东乌珠穆沁旗|