前嗅ForeSpider腳本教程-數據抽取腳本實戰教程

今天,小編給大家帶來的教程為:前嗅ForeSpider腳本教程-數據抽取腳本實戰教程的,應用場景,數據在源碼的html標籤裡寫腳本。具體內容如下:

一.應用場景

當所需要的數據字段大部分需要配置腳本時,可將所有字段的抽取統一放在數據抽取腳本中。

可能用到的類:DOM、EXTRACT。

配置方法:選中數據抽取,點擊“腳本窗口”,點擊創建按鈕。即可在新建的代碼框內輸入代碼。

前嗅ForeSpider腳本教程-數據抽取腳本實戰教程

前嗅ForeSpider腳本教程-數據抽取腳本實戰教程

二.數據在源碼的html標籤裡寫腳本

目標數據可在源碼中查找到。在目標網頁右鍵,選擇“查看源代碼”,鍵盤點擊“ctrl+F”,查找目標數據所在位置。

1.數據需要循環

場景:目標數據集中分佈,如評論數據。

2.數據不循環

場景:目標數據分散分佈。

示例:獲取聚美優品網,關鍵詞搜索之後的列表頁的頁數。

前嗅ForeSpider腳本教程-數據抽取腳本實戰教程

前嗅ForeSpider腳本教程-數據抽取腳本實戰教程

​查看源碼,得知在源碼中的位置。

前嗅ForeSpider腳本教程-數據抽取腳本實戰教程

前嗅ForeSpider腳本教程-數據抽取腳本實戰教程

由圖可知,頁碼所在

的class屬性值唯一,所以可以根據class屬性值找到該

腳本實例:

var div = DOM.FindClass(“head_pageInfo”); //獲取目標數據節點位置
var num=DOM.GetTextAll(div).Middle("/",頁).ToInt(); //獲取目標數據,並轉為int型
前嗅ForeSpider腳本教程-數據抽取腳本實戰教程

前嗅ForeSpider腳本教程-數據抽取腳本實戰教程


分享到:


相關文章: