GG資源網

火車頭採集器自動發布設置-免費自動採集發布教程

大家好,這裡是關於[火車頭採集器圖片採集上傳設置],[火車頭採集器自動發布設置-免費自動採集發布教程]問題的解答,希望對您有所幫助。如果你還想了解更多這方面的信息,請關注本站其他相關內容,共同學習吧!

火車頭採集器圖片採集上傳設置

教程大全火車頭,火車頭採集圖片,火車頭採集教程

火車頭採集器圖片採集上傳設置

前面我們寫了基礎的標題和文章採集,下面介紹下圖片的採集。

圖片採集不是必須的,但是圖片可以豐富網站的內容,具體我也不清楚對網站的SEO有什麼影響。我測試採集圖片和不採集圖片收錄沒區別,我見到的一些採集站,大部分也是不採集圖片的!

如果採集數據量比較大的話可以選擇不採集圖片。

正文開始

首先是火車頭採集器上的設置。

我們以這個文章為例:https://server.zzidc.com/serverhosting/3117.html

這個裡面有一張圖片,並且也是前面我們教程里用做示範的網站。

聲明:本人目前沒使用任何景安的產品(以前用過),也對他產品印象不好。僅做教程示例,沒有推薦他產品的意思。

我們直接打開前面教程創建的那個火車頭採集任務。

在內容採集規則-內容-文件下載裡面

選擇:將相對地址補全為絕對地址、下載圖片

文件地址必須包含:uploads/allimg

這個必須包含是根據不同網站來設置的,比如本文教程里文章圖片地址是:

https://server.zzidc.com/uploads/allimg/191015/1-191015150925U2.png

那麼除掉前面他網站域名和後面會產生變化的文件名日期格式的目錄名之外剩餘的基本就是我們想要的內容,所以我這裡讓圖片文件地址必須包含uploads/allimg。

為什麼這麼做?

因為他有可能在文章里加入圖片廣告,圖片廣告為了便於修改,大部分都是採用單獨目錄內放圖片廣告的方式。這樣以後該廣告比較容易。新老文章都能一次修改掉。

文件保存目錄:i\\m\\g/yyyyMMdd

這個目錄是你採集器的本地電腦和伺服器裡面要創建的目錄,先存到本地然後上傳到伺服器里。

目錄裡面的\\斜杠是因為默認img裡面m和g會被火車頭識別為內置函數(字母顏色會變綠),沒辦法正常解析,所以加上斜杠。正常的話是img/yyyyMMdd這樣的

含義:表示保存到網站的/img目錄下,然後根據年月日自動創建對應的目錄。

然後是在內容的-HTML標籤排除裡面,我們去掉圖像<img這個標籤的排除。因為排除後我們發布後文章內就沒有調用圖片,自然不會顯示圖片內容。

然後我們進行圖片的上傳設置,我們採集時候順序是,先將圖片下載到本地,然後傳到伺服器這樣一個步驟。

通過FTP的方式來上傳。

先在寶塔面板上傳建一個FTP賬戶,FTP默認目錄要設置在我們網站跟目錄。

採集器會根據我們上面的設置自己創建對應的目錄。

注意:FTP使用的埠記得打開!21、20、39000-40000不打開埠你圖片自然傳不了。放行20和39000到40000這些埠是因為寶塔的FTP經常出現FTP連接錯誤的情況,這是另一個問題。這裡不給大家解釋了,不然篇幅太長了。

打開火車頭採集器:其他設置、FTP文件上傳、FTP上傳

伺服器:填寫你的伺服器IP地址

用戶名/密碼:剛才創建的FTP賬戶和密碼

埠:默認21

文件上傳根目錄:/

次序:先發布數據

文件上傳成功後刪除本地文件:是

這裡也可以選擇否,選擇是的話可以減少採集器所在機器磁碟的佔用,而且上傳成功的圖片,也沒必要在保留了。

設置好了之後我們點一下上傳測試文件:

看下下面的框里顯示的信息,有沒有成功上傳,並且打開網站目錄內也看下有沒有測試文件Test.zip被上傳。

測試OK的話保存一下設置,我們測試下看看採集效果

https://server.zzidc.com/serverhosting/3117.html

把這個網址填入到網址採集規則里

因為我們測試的直接是一個內容頁網址,所以網址採集規則下面我們要點一下:起始網址就是內容頁網址

保存,然後清空任務採集數據

運行任務

看運行日誌沒問題,我們到網站上看看有沒有發布上

文章正確進行了發布,4個圖片都正常顯示了

文章里開頭我寫的採集網址是/serverhosting/3117.html這個文章地址,後面截圖裡面的文章地址是fwqjc/2018/1203/2825.html這個。

沒有影響,主要我寫文章中間中斷了一次去做其他事了。。

火車頭採集器自動發布設置-免費自動採集發布教程

火車頭採集器發布設置,要更好的使用火車頭採集器軟體,必須需要有基本的HTML基礎,能看得懂網頁源碼,網頁結構。 同時如果用到web發布或資料庫發布,則對自己文章系統及數據存儲結構要非常了解。當然對HTML和資料庫不是很了解可以使用採集發布軟體嗎?當然不是,我們可以使用更簡單的免費採集發布軟體各大網站發布詳細如下圖

各大網站自動發布:無須花費大量時間學習軟體操作,一分鐘即可實現自動採集→內容處理→發布到網站。提供全自動系統化管理網站,無須人工干涉,設定任務自動執行,一個人維護成百上千網站也不是問題。

1、CMS發布:目前是市面上唯一同時支持帝國、易優、ZBLOG、織夢、WordPress、蘋果CMS、人人CMS、米拓CMS、雲優CMS、小旋風站群蜘蛛池、Thinkcmf、PHPCMS、Pboot、Fadmin、Destoon、海洋CMS、極致CMS、Emlog、Emlogpro、Typecho、TWCMS、WordPress社區版本、迅睿CMS、WXYCM、DZ論壇等各大CMS,並且可同時批量管理並發布的工具

2、對應欄目:相應文章可發布對應欄目(支持多欄目隨機發布文章)

3、定時發布:可控制發布間隔/單日總發布數量

4、監控數據:軟體上直接監控已發布、待發布、是否偽原創、發布狀態、網址、程序、發布時間、全網搜索引擎推送收錄等

指定網站採集:任意網站的數據都可以抓取,所見即所得的操作方式,只要點點滑鼠就能輕鬆獲得自己想要的數據,支持多任務同時採集!

輸入關鍵詞採集文章:同時創建多個採集任務(一個任務可支持上傳1000個關鍵詞,軟體同時還配備了關鍵詞挖掘功能)

監控採集: 能夠定時的對目標網站進行採集,頻率可以選擇10分鐘、20分鐘、根據用戶需求自定義設置監控採集(自動過濾重複,監控新增文章)。

標題處理設置: 根據標題或關鍵詞自動生成標題(不管是雙標題還是三標題都可以自由生成,間隔符號自定義填寫,自建標題庫生成,自媒體標題黨生成,標題替換等等)

圖片處理設置:圖片加標題水印/圖片加關鍵詞水印/自定義圖片水印/自定義圖片庫替換。不僅可以保護圖片的版權,同時還能防止圖片被盜,圖片加上水印後就形成了一張全新的原創圖片。

內容自動偽原創設置:偽原創是指把一篇互聯網上其它文章進行加工,使其讓搜索引擎認為是一篇原創文章,從而提高網站權重,從此再也不用擔心網站沒有內容更新!

關鍵詞優化設置:內鏈有助於提高搜索引擎對網站的爬行索引效率,更利於網站的收錄。再搭配自動敏感詞過濾避免被搜索引擎降權,讓網站擁有更好的收錄與排名。

火車頭髮布發布模塊製作教程(WEB發布模塊不一樣,每個需要自行製作)

網站自動登錄:設置網站登錄信息的數據 獲取欄目列表:設置發布的欄目列表

網頁隨機獲取:設置post數據內的隨機值

內容發布參數:設置發布頁面POST數據包

高級功能:文件上傳設置以及數據構造

打開fiddler(注意,如果有亂七八糟的數據流,請先Ctlr+X 清空數據流)分析fiddler里的數據包,將fiddler點擊 ①➯ ② ,依次點擊數據流列表⑤ 找到POST類型的數據流⑥, 然後點擊⑦ 以文本的形式查看

根據上面的數據包得出: 網站編碼是:utf-8 (可以在您的網站右擊查看源代碼,查找charset欄位值,具體看編碼)

網站地址是: 網站地址可以根據POST 和Referer欄位自定義,一般我們用網站域名做網站地址,也可以找其他的2個設置的共同部分做網站地址。

cookie是: menuitems=1_1%2C2_1%2C3_1; PHPSESSID=f21a42f70199c81955f3219623343735; DedeUserID=1; DedeUserID__ckMd5=91a12e3e1eae3a4d; DedeLoginTime=1444806848; DedeLoginTime__ckMd5=65d5fa4845a7ec00; ENV_GOBACK_URL=%2Fdede%2Fdede%2Fcontent_list.php%3Fchannelid%3D1

user-agent是: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/43.0.2357.124 Safari/537.36

然後我們把發布POST數據 里的值 替換成標籤。雙擊選中表單值,然後滑鼠懸停在 標籤按鈕上,對應選擇要替換成的標籤名即可,可選系統標籤,常用標籤,時間標籤。

標題,來源,內容,時間 很方便確認識別。

在這裡給大家講解下「[分類ID]」 系統標籤。

此標籤是用於接下來我們的獲取欄目列表設置做鋪墊的。

那麼如何確定 哪個表單名 就是 [分類ID]呢?

由於網站搬家,部分鏈接失效,如無法下載,請聯繫站長!謝謝支持!
1. 帶 [親測] 說明源碼已經被站長親測過!
2. 下載後的源碼請在24小時內刪除,僅供學慣用途!
3. 分享目的僅供大家學習和交流,請不要用於商業用途!
4. 本站資源售價只是贊助,收取費用僅維持本站的日常運營所需!
5. 本站所有資源來源於站長上傳和網路,如有侵權請郵件聯繫站長!
6. 沒帶 [親測] 代表站長時間緊促,站長會保持每天更新 [親測] 源碼 !
7. 盜版ripro用戶購買ripro美化無擔保,若設置不成功/不生效我們不支持退款!
8. 本站提供的源碼、模板、插件等等其他資源,都不包含技術服務請大家諒解!
9. 如果你也有好源碼或者教程,可以到審核區發布,分享有金幣獎勵和額外收入!
10.如果您購買了某個產品,而我們還沒來得及更新,請聯繫站長或留言催更,謝謝理解 !
GG資源網 » 火車頭採集器自動發布設置-免費自動採集發布教程

發表回復

CAPTCHAis initialing...