EasySpider教程
EasySpider如何避免任务采集时自动从HTTP跳转到HTTPS
在进行自动化任务采集时,有用户遇到一个困扰:输入的HTTP网址在任务执行过程中会自动跳转为HTTPS,导致任务无法正常运行。
这是由于现代浏览器的安全策略,特别是浏览器的某些版本会强制将HTTP请求重定向到HTTPS。虽然这项策略提升了安全性,但在某些特定任务中,比如访问只支持HTTP的网站,这个行为可能会带来问题。
原因分析
项目维护者提到,这个问题是由于浏览器版本和webdriver控制引起的。120版本之后的浏览器会自动启用HTTP强制跳转为HTTPS的策略,这种行为很难通过常规设置调整。webdriver根据浏览器版本进行控制,导致在任务运行时出现强制跳转的问题。
解决方案
为了解决HTTP网址自动跳转HTTPS的问题,项目维护者提供了几种应对方案:
使用较低版本的浏览器和webdriver:
- 如果你使用的是Windows平台,可以下载x32版本的EasySpider,这个版本使用了较低的浏览器版本,避免了HTTP自动跳转HTTPS的问题。
- 对于其他平台的用户,可以手动将浏览器和webdriver的版本降级至119以下。119以下的浏览器版本不会自动启用HTTP跳转策略,从而保证任务可以正常执行。
使用0.5.0版本的EasySpider:
- 如果浏览器降级操作较为复杂,可以选择直接使用EasySpider的0.5.0版本。这一版本同样使用了较老版本的浏览器内核,能够避免自动跳转问题。
设计时设置等待时间进行手动校正:
- 有用户建议在设计任务时,在打开网页的步骤设置一个等待时间。当任务执行到此步骤时,手动将HTTPS地址更正为HTTP,以避免跳转。
浏览器的自动跳转策略虽然可以提升安全性,但在特定情况下会影响自动化任务的执行。
通过降级浏览器版本或使用EasySpider的旧版本,可以避免HTTP网址被强制跳转为HTTPS。如果你遇到类似问题,按照这些步骤进行操作,任务就能正常执行了。
阅读全文
×
初次访问:反爬虫,人机识别