自从安装了这么多插件后"python"地基好像出问题了,按照视频在"python"自身的编辑器编辑老是出问题,显示"squeezed text"哪里搞错了? 在"pycharm"都实现了,试了几次都不行,有print是因在"pycharm"中编译加的,
在"pycharm"可以实现网站首页读取;"python"自身编辑器到底什么问题,就先不管了,按照我这个级别目前还是没法解决的;
按教程完成了简单爬虫策略的撰写,爬取某网站的首页
importurllib.request
data=urllib.request.urlopen("https://XXX替换网址").read().decode("utf-8")
print(data)
可以将网页信息爬取下来!
下一个作业:爬取豆瓣所有出版社的名字--失败!
显示418的错误,查询后应该是豆瓣的反爬机制,今天解决不了了,
还需要深入模拟浏览器……
下一更继续 2020.2.23
閱讀更多 鎖螺絲0731 的文章