01.09 如何利用python爬取抖音高颜值美女

如何利用python爬取抖音高颜值美女

目标场景

相信大家平时刷抖音短视频的时候,看到颜值高的小姐姐,都有随手点赞关注的习惯。

如果一条条去刷确实很耗时间,如果 Python 能帮忙筛选出颜值高的小姐姐那就省了很多事。

本篇文章是借助「百度人脸识别」API,帮我们识别出抖音上颜值高的小姐姐,然后下载到手机相册中。

如何利用python爬取抖音高颜值美女

准 备 工 作

首先,项目需要对页面元素进行一些精准的操作,需要提前准备一部 Android 设备,激活开发者选项,并在开发者选项中打开 「USB 调试和指针位置」两处设置。

为了确保 ad b 命令能正常使用,需要提前配置好 ad b 开发环境。

页面元素中的部分元素没法利用 name 等常用属性获取到,可能需要获取到完整的「U I 树」,再利用 Air test 判断是否存在某个 U I 元素。

<code># 安装依赖pip3installpocoui
/<code>

另外,项目中会对视频进行人脸识别,获取到出现的所有人脸,再进行性别识别及颜值判断。

这里需要进行百度云后台,注册一个人脸识别的应用,获取到一组 「API Key 和 Secret Key」值。

<code>http://console.bce.baidu.com/<code>
如何利用python爬取抖音高颜值美女

然后利用官网提供的 API 文档即可获取到「access token」,由于 a k 的有效期为一个月,所以只需要初始化一次,后面就可以利用人脸识别接口进行正常的识别了。

<code>appid='你注册应用的appid'
api_key='你注册应用的ak'
secret_key='你注册应用的sk'

defget_access_token():
"""
其关access_token有效期一般有一个月
"""
#此变量赋值成自己APIKey的值
client_id=api_key

#此变量赋值成自己SecretKey的值
client_secret=secret_key

auth_url='http://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id='+client_id+'&client_secret='+client_secret

header_dict={'User-Agent':'Mozilla/5.0(WindowsNT6.1;Trident/7.0;rv:11.0)likeGecko',
"Content-Type":"application/json"}

#请求获取到token的接口
response_at=requests.get(auth_url,headers=header_dict)
json_result=json.loads(response_at.text)
access_token=json_result['access_token']
returnaccess_token
/<code>

编 写 脚 本

在上面已经配置好了 a db 环境的情况下,可以直接借助 python 中的 o s 模块执行 ad b 命令打开抖音 App。

<code>#抖音App的应用包名和初始Activity
package_name='com.ss.android.ugc.aweme'
activity_name='com.ss.android.ugc.aweme.splash.SplashActivity'

defstart_my_app(package_name,activity_name):
"""
打开应用
adbshellamstart-ncom.tencent.mm/.ui.LauncherUI
:parampackage_name:
:return:
"""
os.popen('adbshellamstart-n%s/%s'%(package_name,activity_name))
/<code>

接着,我们需要截取当前播放视频的截图到本地。

如何利用python爬取抖音高颜值美女

需要注意的是,抖音视频播放界面包含视频创作者头像、B G M 创作者头像等一些杂乱的元素,可能对人脸识别的结果产生一些误差,所以需要对屏幕截图之后的图像进行「二次裁剪」处理。

<code>defget_screen_shot_part_img(image_name):
"""
获取手机截图的部分内容
:return:
"""
#截图
os.system("adbshell/system/bin/screencap-p/sdcard/screenshot.jpg")
os.system("adbpull/sdcard/screenshot.jpg%s"%image_name)

#打开图片
img=Image.open(image_name).convert('RGB')

#图片的原宽、高(1080*2160)
w,h=img.size

#截取部分,去掉其头像、其他内容杂乱元素
img=img.crop((0,0,900,1500))

img.thumbnail((int(w/1.5),int(h/1.5)))

#保存到本地
img.save(image_name)

returnimage_name
/<code>

现在可以使用百度提供的 API 获取到上面截图的人脸列表。

<code>defparse_face_pic(pic_url,pic_type,access_token):
"""
人脸识别
5秒之内
:parampic_url:

:parampic_type:
:paramaccess_token:
:return:
"""
url_fi='http://aip.baidubce.com/rest/2.0/face/v3/detect?access_token='+access_token

#调用identify_faces,获取人脸列表
json_faces=identify_faces(pic_url,pic_type,url_fi)

ifnotjson_faces:
print('未识别到人脸')
returnNone
else:
#返回所有的人脸
returnjson_faces
/<code>

从上述的人脸列表中筛选出性别为女,年龄为 18-30 岁之间,颜值超过 70 的小姐姐。

<code>defanalysis_face(face_list):
"""
分析人脸,判断颜值是否达标
18-30之间,女,颜值大于80
:paramface_list:识别的脸的列表
:return:
"""
#是否能找到高颜值的美女
find_belle=False
ifface_list:
print('一共识别到%d张人脸,下面开始识别是否有美女~'%len(face_list))
forfaceinface_list:
#判断是男、女
ifface['gender']['type']=='female':
age=face['age']
beauty=face['beauty']

if18<=age<=30andbeauty>=70:
print('颜值为:%d,及格,满足条件!'%beauty)

find_belle=True
break
else:
print('颜值为:%d,不及格,继续~'%beauty)
continue
else:
print('性别为男,继续~')
continue
else:
print('图片中没有发现人脸.')

returnfind_belle
/<code>

由于视频是连续播放的,很难通过截取视频某一帧,判断视频有出现颜值高的小姐姐。

如何利用python爬取抖音高颜值美女

另外,大部分短视频播放时长为「10 s+」,这里需要对每一个视频多次截图去做人脸识别,直到识别到颜值高的小姐姐。

<code># 一条视频最长的识别时间RECOGNITE_TOTAL_TIME = 10#识别次数
recognite_count=1

#对当前视频截图去人脸识别
whileTrue:
#获取截图
print('开始第%d次截图'%recognite_count)

#截取屏幕有用的区域,过滤视频作者的头像、BGM作者的头像
screen_name=get_screen_shot_part_img('images/temp%d.jpg'%recognite_count)

#人脸识别
recognite_result=analysis_face(parse_face_pic(screen_name,TYPE_IMAGE_LOCAL,access_token))

recognite_count+=1

#第n次识别结束后的时间
recognite_time_end=datetime.now()

#这一条视频出现了颜值高的小姐姐
ifrecognite_result:
pass
else:
print('超时!!!这是一条没有吸引力的视频!')
#跳出里层循环
break
/<code>

一旦当前播放的视频识别出有颜值高的小姐姐,就需要模拟保存视频到本地的操作。

如何利用python爬取抖音高颜值美女

获取「分享」和「保存本地」两个按钮的坐标位置,依次利用 a db 执行点击操作即可下载视频到本地。

<code>defsave_video_met():
"""
:return:
"""
#分享
os.system("adbshellinputtap10001500")
time.sleep(0.05)

#保存到本地
os.system("adbshellinputtap3501700")
/<code>

另外,由于下载视频的过程是一个耗时操作,在下载进度对话框还未消失之前,需要做一个「模拟等待」的操作。

<code>defwait_for_download_finished(poco):
"""
从点击下载,到下载完全
:return:
"""

element=Element()
whileTrue:
#由于是对话框,不能利用Element类来判断是否存在某个元素来准确处理
#element_result=element.findElementByName('正在保存到本地')

#当前页面UI树元素信息
#注意:保存的时候可能会获取元素异常,这里需要抛出,并终止循环
#com.netease.open.libpoco.sdk.exceptions.NodeHasBeenRemovedException:Nodewasnolongeralivewhenqueryattribute"visible".Pleasere-select.
try:
ui_tree_content=json.dumps(poco.agent.hierarchy.dump(),indent=4).encode('utf-8').decode('unicode_escape')
exceptExceptionase:
print(e)
print('异常,按下载处理~')
break

if'正在保存到本地'inui_tree_content:
print('还在下载中~')
time.sleep(0.5)
continue
else:
print('下载完成~')
break
/<code>

在视频保存到本地之后,就可以模拟向上滑动的操作,跳到播放「下一条视频」。

如何利用python爬取抖音高颜值美女

循环上面的操作,即可筛选出所有颜值高的小姐姐,并保存到本地。

<code>defplay_next_video():
"""
下一个视频
从下往上滑动
:return:
"""
os.system("adbshellinputswipe5401300540500100")
/<code>

在脚本一条条刷视频的过程中,可能会遇到一下广告,我们需要对这类视频进行过滤。

<code>defis_a_ad():
"""
判断的当前页面上是否是一条广告
:return:
"""
element=Element()
ad_tips=['去玩一下','去体验','立即下载']

find_result=False

forad_tipinad_tips:
try:
element_result=element.findElementByName(ad_tip)
#是一条广告,直接跳出
find_result=True
break
exceptExceptionase:
find_result=False

returnfind_result
/<code>

结 果 结 论

运行上面的脚本,会自动打开抖音,对每一条小视频多次进行人脸识别,直到识别到颜值高的小姐姐,保存视频到本地,然后继续刷下一条短视频。

最后小编帮助大家整理了一套python基础还有实战的教程,下面展示了部分,希望也能帮助对编程感兴趣,想做数据分析,人工智能或者希望从事编程开发的小伙伴,毕竟python工资还可以,如果能帮到你请点赞、点赞、点赞。

python视频系列:

如何利用python爬取抖音高颜值美女

电子书系列:


如何利用python爬取抖音高颜值美女


获取方式

如何利用python爬取抖音高颜值美女

如果你觉得文章还不错,请大家点赞分享下。你的肯定是我最大的鼓励和支持。


分享到:


相關文章: