[已解决]怎样获取已经打开网页的源码?

ycgaodp · 发表于 2017-5-13 07:13:34

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

本帖最后由 ycgaodp 于 2017-5-13 10:52 编辑

如标题所述，不是python通过网址去打开网页，然后获取源码，而是网页已经打开了，python来直接获取这个网页的源码。

对上面问题进行举例补充：

1、第一种获取网页源码的最原始的方法：
（1）、在IE地址栏输入网址如，http://www.sohu.com；
（2）、在已打开的网页上点击右键，点击查看源文件，就得了到了网页源文件。

2、第二种获取网页源码的方式：
>>> import requests
>>> html = requests.get("http://www.sohu.com/")
>>> print (html.text)

3、第三种方式，也就是我想要实现的方式：
（1）、在IE地址栏手工输入网址如，http://www.sohu.com；
（2）、用 python来获取这个已经手工打开了的网页源码。（不知道怎么实现，请高手指导）
这个需求场景：我的网址随时在变化，所以我只能在网页打开以后才来抓取数据。

最佳答案

月排行榜 / 总排行榜

ooxx7788

2017-5-14 00:37:10

用selenium启动浏览器，留一个input做为网址输入的接口。
你就用这个接口，让selenium打开网页，然后直接让selenium获取源代码就行了。
你所需要的改变，就是在浏览器输入的地址，改在python里面输入就行了。

跳转到最佳答案楼层

ooxx7788 · 发表于 2017-5-13 10:22:28

你自己写的东西，你看得懂吗

ycgaodp · 发表于 2017-5-13 10:31:29

ooxx7788 发表于 2017-5-13 10:22
你自己写的东西，你看得懂吗

哪里有疑问？

gopythoner · 发表于 2017-5-14 00:07:48

ooxx7788 发表于 2017-5-13 10:22
你自己写的东西，你看得懂吗

哈哈哈，我也没看懂他到底在说什么东西

ooxx7788 · 发表于 2017-5-14 00:37:10

这个最佳答案由 ooxx7788 给出，感谢 ooxx7788 的回答。

单击隐藏图章

用selenium启动浏览器，留一个input做为网址输入的接口。
你就用这个接口，让selenium打开网页，然后直接让selenium获取源代码就行了。
你所需要的改变，就是在浏览器输入的地址，改在python里面输入就行了。

账号		自动登录	找回密码
密码			立即注册