如何用Selenium和Python高效提取父元素下的所有指定子元素

来源：IPIPP.com作者：陈平安头衔：全栈工程师

导读：本期聚焦于小伙伴创作的《如何用Selenium和Python高效提取父元素下的所有指定子元素》，敬请观看详情，探索知识的价值。以下视频、文章将为您系统阐述其核心内容与价值。如果您觉得《如何用Selenium和Python高效提取父元素下的所有指定子元素》有用，将其分享出去将是对创作者最好的鼓励。

如何用Selenium和Python高效提取父元素下的所有指定子元素

在使用Selenium进行Python web自动化操作时，提取父元素下的指定子元素是高频需求，比如获取某个列表容器下的所有列表项、某个卡片下的所有按钮等。下面我们先看一张示例页面结构，再逐步讲解实现方法。

前提准备

首先需要安装对应的依赖库，确保环境可用：

# 安装Selenium库
pip install selenium
# 下载对应浏览器的驱动，比如ChromeDriver，放到环境变量可访问的路径

初始化浏览器驱动的代码如下：

from selenium import webdriver
from selenium.webdriver.common.by import By

# 初始化Chrome浏览器驱动
driver = webdriver.Chrome()
# 打开目标页面
driver.get("https://ipipp.com/test_page")

方法一：使用XPath相对路径定位

XPath支持相对路径查找，我们可以先定位到父元素，再通过相对路径查找其下的子元素，这种方式精准度很高。

假设页面结构如下：

<div id="parent-container" class="container">
    <ul>
        <li class="item">子元素1</li>
        <li class="item">子元素2</li>
        <li class="item">子元素3</li>
        <li class="other">其他元素</li>
    </ul>
</div>

我们需要提取id为parent-container的父元素下，所有class为item的li子元素，代码如下：

# 先定位父元素
parent_element = driver.find_element(By.ID, "parent-container")
# 在父元素下用XPath相对路径查找所有class为item的li子元素
child_elements = parent_element.find_elements(By.XPATH, ".//li[@class='item']")
# 遍历输出子元素的文本内容
for element in child_elements:
    print(element.text)

这里的.//表示在当前父元素节点下查找，避免全局查找导致的错误结果。

方法二：使用CSS选择器嵌套定位

CSS选择器也支持嵌套查找，语法更简洁，执行效率通常也不错。

同样针对上面的页面结构，用CSS选择器实现的代码如下：

# 先定位父元素
parent_element = driver.find_element(By.ID, "parent-container")
# 在父元素下用CSS选择器查找所有class为item的li子元素
child_elements = parent_element.find_elements(By.CSS_SELECTOR, "li.item")
# 提取子元素的属性值示例，比如获取所有li的class属性
for element in child_elements:
    print(element.get_attribute("class"))

方法三：批量定位后过滤（适合复杂条件）

如果子元素的筛选条件比较复杂，也可以先获取父元素下的所有子元素，再通过代码逻辑过滤。

# 定位父元素
parent_element = driver.find_element(By.ID, "parent-container")
# 获取父元素下的所有li子元素
all_li_elements = parent_element.find_elements(By.TAG_NAME, "li")
# 过滤出class包含item的子元素
target_elements = [li for li in all_li_elements if "item" in li.get_attribute("class")]
# 输出结果
print(f"共找到{len(target_elements)}个目标子元素")

注意事项

使用find_elements而不是find_element，前者返回列表，没有找到结果时返回空列表，不会抛出异常；后者找不到会直接报错。
如果页面是动态加载的，需要先等待父元素和子元素加载完成，可以使用显式等待：

from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

# 等待父元素加载完成，最多等10秒
parent_element = WebDriverWait(driver, 10).until(
    EC.presence_of_element_located((By.ID, "parent-container"))
)
# 再等待子元素加载完成
child_elements = WebDriverWait(parent_element, 10).until(
    EC.presence_of_all_elements_located((By.XPATH, ".//li[@class='item']"))
)

如果父元素下有嵌套的同类型子元素，XPath的.//会查找所有层级的后代元素，如果需要只找直接子元素，可以用./加上直接子元素标签，比如./li[@class='item']。

方法对比

三种方法的适用场景可以参考下表：

方法	适用场景	优点	缺点
XPath相对路径	条件复杂，需要跨层级查找	语法灵活，支持复杂条件筛选	语法相对复杂，新手不易掌握
CSS选择器嵌套	条件简单，选择逻辑清晰	语法简洁，执行效率高	复杂条件支持不如XPath
批量定位后过滤	筛选条件无法通过定位表达式实现	灵活度高，可自定义过滤逻辑	多了一步过滤操作，效率略低

完成操作后记得关闭浏览器驱动：

driver.quit()

Selenium Python 元素定位子元素提取 web自动化修改时间：2026-06-02 04:02:57

免责声明：已尽一切努力确保本网站所含信息的准确性。网站内容多为原创整理与精心编撰，观点力求客观中立。本站旨在免费分享，内容仅供个人学习、研究或参考使用。若引用了第三方作品，版权归原作者所有。如内容涉及您的权益，请联系我们处理。