立即注册  找回密码
 立即注册
CeraNetworksBGVM服务器主机交流会员请立即修改密码Sharktech防护
查看: 45|回复: 0

[笔记] 解决网络爬虫登陆问题

[复制链接]

[笔记] 解决网络爬虫登陆问题

[复制链接]

66

主题

24

回帖

696

积分

高级会员

积分
696
odmin

66

主题

24

回帖

696

积分

高级会员

积分
696
2023-11-2 22:33:23 | 显示全部楼层 |阅读模式
网络爬虫在爬取网站时会遇到一些登陆的问题,登陆过程中会遇到输入验证码,如何解决爬虫解决登陆和输入验证码?一般有两种方案。

1、使用cookie登陆
使用cookies登陆,获取浏览器的cookies,然后利用requests 库直接登陆cookies,服务器会认为你是一个真实登陆用户,所以就会返回给你一个已登陆的内容。因此,需要验证码的情况可以使用带验证码登陆的cookie解决。

2、强行登陆
使用requests登陆,requests的好处是速度快。
使用requests登陆一般分为几步:
1、发出请求时使用sess
2、需要把验证码图片下载到本地保存
3、需要通过验证码
4、使用post请求访问登陆网站
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|小黑屋|HS2V主机综合交流论坛

GMT+8, 2024-12-26 15:11 , Processed in 0.013183 second(s), 2 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表