GG資源網

如何採集招投標類網站數據?(招投標信息採集是幹嘛的)

可以使用ForeSpider數據採集系統進行採集,正好新出了一個採集招投標網的教程,希望能夠幫助到你:

l 採集網站

【場景描述】採集招標網上的所有的招標數據。

【源網站介紹】

招標網是招標採購領域的招投標資訊和招投標服務平台,為各級政府採購、招標代理機構、招標企業、供應商、採購業主提供強大的專業招標採購信息查詢和相關招投標服務。

【使用工具】前嗅ForeSpider數據採集系統,免費下載:

ForeSpider免費版本下載地址www.forenose.com/view/forespider/view/download.html

【入口網址】http://www.bidchance.com/channel-userggcharge-1.html

【採集內容】

採集招標網上所有的招標數據。

【採集效果】如下圖所示:

l 思路分析

配置思路概覽:

l 配置步驟

1. 新建採集任務

選擇【採集配置】,點擊任務列表右上方【+】號可新建採集任務,將採集入口地址填寫在【採集地址】框中,【任務名稱】自定義即可,點擊下一步。

2.獲取翻頁鏈接

①使用定位過濾鏈接的方法,將分類鏈接過濾出來。具體步驟如下所示:

②關聯模板,翻頁鏈接關聯自身模板,即模板01。

3.獲取列錶鏈接

①在模板01下新建一個鏈接抽取,可修改名稱為列錶鏈接,採集預覽,觀察列錶鏈接的規律。

②發現列錶鏈接的規律為http://www.bidchance.com/info-userggcharge-一串數字.html

使用地址過濾的方法,將列錶鏈接過濾,如下圖所示:

4.數據抽取

①新建模板02,在該模板下新建一個數據抽取。

關聯模板

②採集預覽,打開列錶鏈接預覽界面,複製任意一條列錶鏈接,粘貼在模板02的示例地址處。

③新建一個數據表單,具體步驟和欄位屬性如下所示:

④關聯表單

⑤使用欄位定位取值,來獲取欄位數據。

Title欄位:

Pubtime欄位:

Pubper欄位:

Text欄位:

⑥採集預覽,雙擊直至進入最後數據頁,如下圖所示,說明數據抽取成功。

l 採集步驟

模板配置完成,採集預覽沒有問題後,可以進行數據採集。

①首先要建立採集數據表:

選擇【數據建表】,點擊【表單列表】中該模板的表單,在【關聯數據表】中選擇【創建】,表名稱自定義,這裡命名為【zhaobiao】(注意命名不能用數字和特殊符號),點擊【確定】。創建完成,勾選數據表,並點擊右上角保存按鈕。

②選擇【數據採集】,勾選任務名稱,點擊【開始採集】,則正式開始採集。

③採集中:

④採集結束後,可以在【數據瀏覽】中,選擇數據表查看採集數據,並可以導出數據。

⑤導出的文件打開如下圖所示:

*本教程僅供學習交流,嚴禁用於商業用途!

前嗅簡介

前嗅大數據,國內領先的研髮型大數據專家,多年來致力於為大數據技術的研究與開發,自主研發了一整套從數據採集、分析、處理、管理到應用、營銷的大數據產品。前嗅致力於打造國內第一家深度大數據平台!

#####

需要採集的話太累了,可以辦理一個馬蜂盯標網站的會員,就可以進行數據導出了

由於網站搬家,部分鏈接失效,如無法下載,請聯繫站長!謝謝支持!
1. 帶 [親測] 說明源碼已經被站長親測過!
2. 下載後的源碼請在24小時內刪除,僅供學慣用途!
3. 分享目的僅供大家學習和交流,請不要用於商業用途!
4. 本站資源售價只是贊助,收取費用僅維持本站的日常運營所需!
5. 本站所有資源來源於站長上傳和網路,如有侵權請郵件聯繫站長!
6. 沒帶 [親測] 代表站長時間緊促,站長會保持每天更新 [親測] 源碼 !
7. 盜版ripro用戶購買ripro美化無擔保,若設置不成功/不生效我們不支持退款!
8. 本站提供的源碼、模板、插件等等其他資源,都不包含技術服務請大家諒解!
9. 如果你也有好源碼或者教程,可以到審核區發布,分享有金幣獎勵和額外收入!
10.如果您購買了某個產品,而我們還沒來得及更新,請聯繫站長或留言催更,謝謝理解 !
GG資源網 » 如何採集招投標類網站數據?(招投標信息採集是幹嘛的)

發表回復

CAPTCHAis initialing...