python解析js方案

在Python爬虫的时候遇到的JS,几种策略

  1. pyv8只支持python2,容错高
  2. PyExecJS,支持到python3,容错率低,同样的代码pyv8执行ok,但是这个报多余的分号…
  3. phantomjs,动态渲染页面执行js,主要是不好kill掉,不直接杀进程内存能gg
  4. 手动解析script,也是一种方案,主要是py处理一下混淆
  5. py调os.system再解析,这种就是依赖本地另一个工具,比如node之类的,解析js再返回结果,增加外部依赖
最近的文章

前后端分离下的前端安全

学React的时候,想到的一个前后端分离增加的隐患,好几年了,共勉,在内网有奇效 …

于  web_security 继续阅读
更早的文章

Python2的神奇编码

尝试解决Python编码问题 …

于  python 继续阅读