首页编程正文内容

selenium+edge+python on mac

编程

更新时间：2024-09-1657

admin管理员组
文章数量:1516870

一、简介

本文主要介绍Selenium的最简单的使用，看懂了去拓展会So ez。
Selenium：一种浏览器脚本驱动工具，实现用电脑模拟人操作浏览器网页，对网页自动化操作。

二、环境准备

安装python，配置环境变量（python和python Scripts的）
安装或更新pip
使用pip工具安装第三方库：pip install -i https://pypi.tuna.tsinghua.edu/simple selenium
下载并部署你浏览器对应的驱动。
创建project，导入Python SDK

三、EASY准备

Edge浏览器采用Chromium内核，并将支持所有受支持的Windows版本以及macOS等平台。
这次我使用的是Edge

1、使用驱动获取指定页面元素

1）使用Service指定驱动路径

service = Service('/usr/local/bin/msedgedriver')
service.start()
driver = webdriver.Remote(service.service_url)
driver.get('https://www.baidu/')

2）给驱动导入用户配置option

#驱动路径
chromedriver = "/usr/local/bin/msedgedriver.exe"
#将驱动对应环境的映像对象 给到os
os.environ["webdriver.chrome.driver"] = chromedriver
#初始化配置
option = webdriver.ChromeOptions()
#配置加入我们的用户配置文件
option.add_argument('--user-data-dir=/usr/local/bin/config')
#将配置应用到驱动
driver = webdriver.Chrome(chromedriver,chrome_options=option)

2、获取完元素，定位元素

1）八种定位元素的方法（子）

通过id定位元素：find_element_by_id(“id_vaule”)
通过name定位元素：find_element_by_name(“name_vaule”)
通过tag_name定位元素：find_element_by_tag_name(“tag_name_vaule”)
通过class_name定位元素：find_element_by_class_name(“class_name”)
通过css定位元素：find_element_by_css_selector()
通过xpath定位元素：find_element_by_xpath(“xpath”)
通过link：find_element_by_link_text(“text_vaule”)
通过find_element_by_partial_link_text()

    def find_element_by_id(self, id_):
        return self.find_element(by=By.ID, value=id_)
        
    def find_element_by_xpath(self, xpath):
        return self.find_element(by=By.XPATH, value=xpath)
        
	def find_element_by_link_text(self, link_text):
        return self.find_element(by=By.LINK_TEXT, value=link_text)
        
	def find_element_by_partial_link_text(self, link_text):
        return self.find_element(by=By.PARTIAL_LINK_TEXT, value=link_text)
        
    def find_element_by_name(self, name):
        return self.find_element(by=By.NAME, value=name)
        
    def find_element_by_tag_name(self, name):
        return self.find_element(by=By.TAG_NAME, value=name)
        
    def find_element_by_class_name(self, name):
        return self.find_element(by=By.CLASS_NAME, value=name)
        
    def find_element_by_css_selector(self, css_selector):
        return self.find_element(by=By.CSS_SELECTOR, value=css_selector)

2）定位元素（父）：`find_element` 和 `find_elements`

其实可以一眼看出上面八种定位方法最终都调用的是find_element方法

driver.find_element(By.ID, "kw")
driver.find_elements(By.TAG_NAME, "input")

find_element：好处是方法名不会写死，定位方式可以通过参数传递，在一些框架中使用时会更加灵活一些。

定位方式	By
name	By.NAME
class_name	By.CLASS_NAME
tag_name	By.TAG_NAME
link_text	By.LINK_TEXT
partial_link_text	By.PARTIAL_LINK_TEXT
css_selector	By.CSS_SELECTOR
xpath	By.XPATH

每种 find_element()方法，包括find_element_by_id()在查找元素时，如果定位语句不唯一，能够查到多个函数的话，默认值返回页面中出现的第一个。也就是说定位不唯一，那得到的元素可能就不是你想要的。区别就是带s的会返回指定元素列表，八种基本定位也会拓展出带s的八种，例：find_elements_by_id

以下是返回的元素对象结果：

/usr/local/bin/python3.9 /Users/zjk/IdeaProjects/test_Python/src/web_driver/driver.py
<selenium.webdriver.remote.webelement.WebElement (session="dc4f0bbd53be7da2abf796001cde4c77", element="155b0372-b50e-4faf-8354-025988caa340")>

Process finished with exit code 0

3、驱动对页面操作

driver.back() # 返回上一页（右箭头）
driver.forward() # 去下一页（左箭头）
driver.refresh() # 刷新当前网页
driver.close() # 关闭当前窗口

# .submit() 模拟键盘的回车建
driver.find_element_by_link_text('新闻').submit()

driver.execute(Command.QUIT)
driver.quit() # = .execute(Command.QUIT) + .stop_client()

...很多

四、CASE

1、遍历爬取页面内所有图片属性

from selenium import webdriver
from time import sleep
from selenium.webdriver.chrome.service import Service

service = Service('/usr/local/bin/msedgedriver')
service.start()
driver = webdriver.Remote(service.service_url)
driver.get('https://www.baidu')
for img in driver.find_elements_by_tag_name("img"):
    print('text: ' + img.text)
    print('size: ' + str(img.size))
    print('tag_name: ' + img.tag_name)
sleep(2)
driver.stop_client()
# driver.quit()

本文标签： edge selenium Mac python

版权声明：本文标题：selenium+edge+python on mac 内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.betaflare.com/biancheng/1726433427a1095876.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

发表评论

全部评论 0

暂无评论

编程频道|软件玩家 - 软件改变生活！

selenium+edge+python on mac

一、简介

二、环境准备

三、EASY准备

1、使用驱动获取指定页面元素

1）使用Service指定驱动路径

2）给驱动导入用户配置option

2、获取完元素，定位元素

1）八种定位元素的方法（子）

2）定位元素（父）：find_element 和 find_elements

3、驱动对页面操作

四、CASE

1、遍历爬取页面内所有图片属性

更多相关文章

python selenium 接管已开启浏览器

Python+Selenium 不打开谷歌浏览器运行脚本

解决IE浏览器就自动跳转到Edge浏览器的问题

selenium实战指南:如何防止被浏览器检测?

python实现打开网页后并且不用关闭网页就能自动刷新

〖Python零基础入门篇③〗- Pycharm编辑器不能复制粘贴怎么办？

python安装到了c盘怎么办_pip install **老是往C盘下？怎么改？想学啊，我教你啊...

edge浏览器怎么设置activex_Edge浏览器ActiveX插件

[路由器]IP-MAC的绑定与取消

如何在 Windows 上安装 Python

Mac系统随笔 | (4) 使用Mac的&quot;预览&quot;添加、删除或移动pdf页面

微软Edge浏览器下载出错！解决办法！

Mac VMware Fusion 11 安装 Windows 10

2024最新Python下载安装环境配置教程（Windows系统＋Mac系统）！

python完整卸载和重装

MAC系统如何连接Windows共享文件？MAC系统连接Win共享文件的方法

Mac Parallels Desktop篇 安装Windows 10

Python安装问题之One or more issues caused the setup to fail.Windows7安装Python3.7

【python】Windows下使用Tkinter，出现No module named 'Tkinter'的解决办法

Python `

发表评论

推荐文章

深入解读NOD32服务器配置，轻松升级

揭秘：64位与32位系统，你是否真的需要更大的内存与处理器能力？

一文精通Echarts：CPU监控中的折线仪表盘与色彩艺术的完美融合!

揭秘2024年最全Android特效代码库：自定义动画，轻松提升用户粘性！

深入浅出：剖析安卓蓝牙Hal层服务启动机制

热门文章

Win10新手指南：一步到位教你看懂定时关机

忘记了MFC7380和Mac之间的WiFi密码，轻松重置步骤大公开！

Flash中心焕新颜：轻松删除Adobe Flash Player临时数据

GMAC网络延时优化秘籍：针对交换芯片提速策略

小巧便携的NirSofer工具，从Win2000到Win10通吃

BP不再困扰你！游戏助手带你轻松拿下每场游戏

ISO改写全攻略：打造你的个性文件管理

轻松掌握Linux：文件属性解读指南

避开SWF、Flash中心与Adobe Flash Player注册码，YOLOFuse专注核心功能！

手感革命：详解机械键盘的灵敏度、耐用与响应速度

最新文章

金融建模中Excel与VBA的超级组合拳

现代计算的新篇章：把FEMCFD求解器封装为PyTorch或JAX函数

突破视觉强化学习训练的‘视觉’障碍，MJX带来高效方案

Excel高手必备：TL431可调电压基准源的求解秘技

高性能物理世界：MuJoCo XLA在Unity中的应用揭秘

Excel宏数量爆炸，开机慢如乌龟？轻松破解攻略！

Open-AutoGLM性能瓶颈大揭秘：破解编译三大障碍

MuJoCo高手之路：从入门到精通的进阶指南

深度学习加速新纪元：张量引擎TBE与深度学习编译器，加速你的训练与推理

MJX秘籍：5倍加速技巧，改写强化学习训练规则！

清华同方超锐L60P 龙芯 3A600032GB1TB集显麒麟统信永久版系统参数报价

清华同方超锐L60P 龙芯 3A600016GB512GB集显KOS麒麟系统试用版参数报价

清华同方超锐L60P 龙芯 3A600032GB1TB集显麒麟统信永久版系统+WPS参数报价

清华同方超锐L60P 龙芯 3A600016GB512GB集显麒麟统信永久版系统参数报价

联想开天X1f G1d 飞腾D3000M16GB1TB集显国防版麒麟统信系统参数报价

2）定位元素（父）：`find_element` 和 `find_elements`

Mac系统随笔 | (4) 使用Mac的"预览"添加、删除或移动pdf页面

Mac Parallels Desktop篇安装Windows 10