今天,小編給大家帶來的教程為:前嗅ForeSpider腳本教程-數據抽取腳本實戰教程的,應用場景,數據在源碼的html標籤裡寫腳本。具體內容如下:
一.應用場景
當所需要的數據字段大部分需要配置腳本時,可將所有字段的抽取統一放在數據抽取腳本中。
可能用到的類:DOM、EXTRACT。
配置方法:選中數據抽取,點擊“腳本窗口”,點擊創建按鈕。即可在新建的代碼框內輸入代碼。
二.數據在源碼的html標籤裡寫腳本
目標數據可在源碼中查找到。在目標網頁右鍵,選擇“查看源代碼”,鍵盤點擊“ctrl+F”,查找目標數據所在位置。
1.數據需要循環
場景:目標數據集中分佈,如評論數據。
2.數據不循環
場景:目標數據分散分佈。
示例:獲取聚美優品網,關鍵詞搜索之後的列表頁的頁數。
查看源碼,得知在源碼中的位置。
由圖可知,頁碼所在
腳本實例:
var div = DOM.FindClass(“head_pageInfo”); //獲取目標數據節點位置
var num=DOM.GetTextAll(div).Middle("/",頁).ToInt(); //獲取目標數據,並轉為int型
閱讀更多 前嗅大數據 的文章