
比如 https://www.36kr.com/p/1932814869170564 ,通过访问获取的是 js 和一些编码信息,没法通过 jsoup 这样的工具去解析 html 内容。
1 xiao109 2022 年 9 月 27 日 跟豆瓣一样执行他的解码 js 文件获取实际的编码信息,不然就用无头浏览器然浏览器去执行 js 渲染一次。 |
2 raphaell2e 2022 年 9 月 27 日 |
3 SleepyRaven 2022 年 9 月 27 日 研究了一下,Sources 面板打开 app.[hash].js 可以看到 window.initialState.state 的 AES.decrypt 信息 |