數(shù)據(jù)管理。利用網(wǎng)絡(luò)爬蟲工具從不同目標(biāo)政府網(wǎng)站中采集獲取的網(wǎng)頁(yè)是海量且無(wú)序的,還應(yīng)對(duì)其實(shí)施整理、分類、著錄、編目、鑒定等數(shù)據(jù)管理操作,實(shí)現(xiàn)信息的規(guī)則排序,使其具備增值的潛能,為后續(xù)的資源存儲(chǔ)和訪問(wèn)利用奠定基礎(chǔ)。
首先,資源分類。根據(jù)采集網(wǎng)頁(yè)資源的特點(diǎn),可以按照來(lái)源機(jī)構(gòu)、資源主題、格式類型等分類標(biāo)準(zhǔn),將其中具有某種共同屬性特征的網(wǎng)頁(yè)資源進(jìn)行歸類和整合,建立規(guī)范統(tǒng)一的政府網(wǎng)站網(wǎng)頁(yè)資源分類體系,通過(guò)不同類別的屬性特征來(lái)對(duì)海量的政府網(wǎng)頁(yè)內(nèi)容進(jìn)行區(qū)分。其次,編目著錄。對(duì)分類后的網(wǎng)頁(yè)資源還應(yīng)基于統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)對(duì)其內(nèi)容及結(jié)構(gòu)、來(lái)源、背景等特征進(jìn)行揭示和描述,并在相關(guān)元數(shù)據(jù)之間建立聯(lián)系,形成政府網(wǎng)站網(wǎng)頁(yè)資源目錄體系,實(shí)現(xiàn)對(duì)海量無(wú)序網(wǎng)頁(yè)信息的序化組織。最后,鑒定整理。政府網(wǎng)頁(yè)的鑒定整理主要包括內(nèi)容的識(shí)別以及內(nèi)容的可用性判斷,其中內(nèi)容的識(shí)別就是確保實(shí)現(xiàn)政府網(wǎng)頁(yè)長(zhǎng)期可存取的元數(shù)據(jù)、保存策略等信息要素齊全。
內(nèi)容的可用性判斷即是通過(guò)人工干預(yù)來(lái)對(duì)政府網(wǎng)頁(yè)的形成背景、內(nèi)容質(zhì)量、重要程度等屬性特征進(jìn)行全面分析,并根據(jù)保管期限表對(duì)要?dú)w檔的政府網(wǎng)頁(yè)標(biāo)記相應(yīng)的鑒定標(biāo)識(shí)。
文章名稱:行業(yè)動(dòng)態(tài)數(shù)據(jù)管理
新聞來(lái)源:http://www.rwnh.cn/news22/149922.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)頁(yè)設(shè)計(jì)公司、小程序開發(fā)、網(wǎng)站維護(hù)、搜索引擎優(yōu)化、全網(wǎng)營(yíng)銷推廣、網(wǎng)站導(dǎo)航
廣告
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源:
創(chuàng)新互聯(lián)