web爬虫中怎么用Selenium操作浏览器抓数据-快上网网站建设公司

web爬虫中怎么用Selenium操作浏览器抓数据

小编给大家分享一下web爬虫中怎么用Selenium操作浏览器抓数据，希望大家阅读完这篇文章之后都有所收获，下面让我们一起去探讨吧！

成都创新互联专注于资兴网站建设服务及定制，我们拥有丰富的企业做网站经验。热诚为您提供资兴营销型网站建设，资兴网站制作、资兴网页设计、资兴网站官网定制、微信小程序服务，打造资兴网络公司原创品牌,更为您提供资兴网站排名全网营销落地服务。

Selenium是一个基于Web的开源自动化工具。Python使用Selenium用于自动化测试。特点是易于使用。Selenium可以将标准Python命令发送到不同的浏览器，尽管它们的浏览器设计有所不同。

使用Selenium自动打开谷歌浏览器然后访问地址http://econpy.pythonanywhere.com/ex/001.html，并将改页面中的购买者姓名和商品价格抓取下来打印，然后自动关闭浏览器的操作。

分析页面源代码可知购买者姓名和商品价格的html代码信息如下：

web爬虫中怎么用Selenium操作浏览器抓数据

使用Selenium自动打开谷歌浏览器的时候需要下载谷歌的驱动程序，我的谷歌浏览器版本为74：

web爬虫中怎么用Selenium操作浏览器抓数据

所以我们访问驱动程序下载地址：

https://sites.google.com/a/chromium.org/chromedriver/downloads

进行下载：

web爬虫中怎么用Selenium操作浏览器抓数据

然后我们要使用Selenium 需要进行安装，这里使用pip install selenium。

接下来开始编码部分：

#导入包from selenium import webdriver#打开谷歌浏览器 并访问要抓取数据的地址#注意：驱动chromedriver.exe与改python文件在同一个目录driver = webdriver.Chrome('chromedriver.exe') driver.get("http://econpy.pythonanywhere.com/ex/001.html")# 使用xpath找到购买者和商品价格元素列表buyers = driver.find_elements_by_xpath('//div[@title="buyer-name"]')prices = driver.find_elements_by_xpath('//span[@class="item-price"]')
# 打印所有信息num_page_items = len(buyers)for i in range(num_page_items):    print(buyers[i].text + " : " + prices[i].text)
#完成任务后 关闭浏览器driver.close()

运行结果部分内容为：

Carson Busses : $29.95Earl E. Byrd : $8.37Patty Cakes : $15.26Derri Anne Connecticut : $19.25Moe Dess : $19.25Leda Doggslife : $13.99Dan Druff : $31.57Al Fresco : $8.49。。。。。。

我简单录制了一下运行过程，由于单手操作录制，画面抖动，大家对付观看一下，过程为：运行程序，自动打开谷歌浏览器，访问地址，抓取数据打印，关闭浏览器完成

看完了这篇文章，相信你对“web爬虫中怎么用Selenium操作浏览器抓数据”有了一定的了解，如果想了解更多相关知识，欢迎关注创新互联行业资讯频道，感谢各位的阅读！

分享名称：web爬虫中怎么用Selenium操作浏览器抓数据
文章转载：http://www.cdkjz.cn/article/iieisj.html

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

web爬虫中怎么用Selenium操作浏览器抓数据

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

web爬虫中怎么用Selenium操作浏览器抓数据

相关资讯

Linux没命令 linux没有yum命令怎么办

腾讯云服务器怎么实现换ip 腾讯云切换ip

阿里云服务器学生计划测试 阿里云学生服务器配置

怎么用语音输入中文域名 如何输入语音

java识别图片颜色代码 java识别图片颜色代码是什么

阿里云服务器数据被覆盖 阿里云释放的服务器能找回吗

路由器接多卡 路由器几张网卡

linux命令界面输出 linux输出到文件

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

阿里云服务器学生计划测试阿里云学生服务器配置

怎么用语音输入中文域名如何输入语音

阿里云服务器数据被覆盖阿里云释放的服务器能找回吗

路由器接多卡路由器几张网卡

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接