爬取部分江北区二手房信息
注:数据来源于安居客二手房,采用Python爬取的,数据仅供参考请以实际为准。若想要全市的数据请加关注并留邮箱
源代码
cqersf=pd.DataFrame()
for y in range(1,101):
url='https://chongqing.anjuke.com/sale/p{}/'.format(y)
ershouf=requests.get(url,headers=headers)
bs=BeautifulSoup(ershouf.text,'lxml')
xm=[i.find('a').text.strip() for i in bs.find_all('div','house-title')]##项目
xxdz=[i.text.strip().replace('\xa0\xa0\n','') for i in bs.find_all('span','comm-address')]##详细地址
hx=[i.replace('','').replace('|',' ') for i in re.findall('(.*)',ershouf.text)]##户型
zj=[i.text for i in bs.find_all('span','price-det')]##总价
dj=[i.text for i in bs.find_all('span','unit-price')]##单价
ersf=pd.DataFrame(columns=['项目','户型','总价','每平米价格','详细地址'])
ersf['项目']=xm
ersf['户型']=hx
ersf['总价']=zj
ersf['每平米价格']=dj
ersf['详细地址']=xxdz
cqersf=cqersf.append(ersf)
print(cqersf)
cqersf.to_excel('D:/data/cqersf.xlsx',sheet_name ='信息',encoding = 'utf-8')