自從安裝了這麼多插件後"python"地基好像出問題了,按照視頻在"python"自身的編輯器編輯老是出問題,顯示"squeezed text"哪裡搞錯了? 在"pycharm"都實現了,試了幾次都不行,有print是因在"pycharm"中編譯加的,
在"pycharm"可以實現網站首頁讀取;"python"自身編輯器到底什麼問題,就先不管了,按照我這個級別目前還是沒法解決的;
按教程完成了簡單爬蟲策略的撰寫,爬取某網站的首頁
importurllib.request
data=urllib.request.urlopen("https://XXX替換網址").read().decode("utf-8")
print(data)
可以將網頁信息爬取下來!
下一個作業:爬取豆瓣所有出版社的名字--失敗!
顯示418的錯誤,查詢後應該是豆瓣的反爬機制,今天解決不了了,
還需要深入模擬瀏覽器……
下一更繼續 2020.2.23
閱讀更多 鎖螺絲0731 的文章