如何保存含有大量js生成内容的网页?-灵析社区

万码EZQPETUV

现在网站大多用Javascript动态生成一些内容,用浏览器打开可以看到渲染好的页面,用鼠标可以选择复制。而用浏览器保存时,却只能保存下带Javascript源码的内容,将解析后的内容保存下来。不知道能否保存解析后的,在浏览器显示的最终样式呢? 已经尝试用Firefox的保存,保存为单个网页,保存为文本都无法找到由Javascript控制生成的内容。 比如:我打开Bing词典,里面的的英英解释是由Javascript生成的,在浏览器中当然可以选择我想要的内容;而用Firefox保存之后,则找不到由Javascript生成的内容。 ![https://wmprod.oss-cn-shanghai.aliyuncs.com/community/1724816344985_lo7C.png](https://wmprod.oss-cn-shanghai.aliyuncs.com/community/1724816344985_lo7C.png) 下面是由Firefox保存为文本文件的结果: ``` language 权威英汉双解 英汉 英英 网络释义 ``` 有没有办法保存整个已经被浏览器解析之后的网页呢? 听说使用爬虫时可以用selenium,phantomjs之类的库进行解析,但是自己的需求没有这么麻烦,感觉一两个网页用不着。而手工复制的话又太笨了。有没有一个半自动化的方法呢? 比如说,用Python控制IE打开一个网页,然后保存下已经解析的内容,再对保存下的内容进行分析。

阅读量:174

点赞量:0

问AI
F12->选中element->右键html标签->copy as html 不知道这样满不满足你的需求。