网页下载为HTM格式的两种方法：浏览器操作与Python脚本详解

来源：站长平台作者：陈平安头衔：全栈工程师

导读：本期聚焦于小伙伴创作的《网页下载为HTM格式的两种方法：浏览器操作与Python脚本详解》，敬请观看详情，探索知识的价值。以下视频、文章将为您系统阐述其核心内容与价值。如果您觉得《网页下载为HTM格式的两种方法：浏览器操作与Python脚本详解》有用，将其分享出去将是对创作者最好的鼓励。

如何下载网页为HTM格式

引言

在日常的网络使用中，我们常常会有保存网页的需求。将网页下载为HTM格式是一种常见的方式，它可以保留网页的原始结构和大部分内容，方便我们在离线状态下查看。本文将介绍几种常见的下载网页为HTM格式的方法。

方法一：使用浏览器自带功能

大多数现代浏览器都提供了将网页保存为HTM格式的功能，操作简单便捷。

Chrome浏览器

打开你想要下载的网页。
点击浏览器右上角的菜单按钮（三个竖点）。
选择“另存为”选项。
在弹出的对话框中，选择保存类型为“网页，仅HTML”（.htm;*.html）。
选择保存位置，然后点击“保存”按钮。

Firefox浏览器

打开目标网页。
点击菜单按钮（三条横线），选择“保存页面为”。
在“保存类型”下拉菜单中选择“网页，仅HTML”。
指定保存路径，点击“保存”。

Edge浏览器

访问要下载的网页。
点击右上角的“...”，选择“另存为”。
在“保存类型”中选择“网页，仅HTML”。
确定保存位置后点击“保存”。

方法二：使用Python脚本

如果你需要批量下载网页或者想要更灵活的控制，可以使用Python编写脚本来完成这个任务。这里我们使用requests库来获取网页内容，并使用BeautifulSoup库来解析和保存为HTM格式。

安装所需库

首先，你需要安装requests和beautifulsoup4库。可以使用以下命令进行安装：

pip install requests beautifulsoup4

编写Python脚本

以下是一个简单的Python脚本示例，用于下载指定URL的网页并保存为HTM格式：

import requests
from bs4 import BeautifulSoup

# 要下载的网页URL
url = 'https://www.ipipp.com'

# 发送HTTP GET请求获取网页内容
response = requests.get(url)

# 检查请求是否成功
if response.status_code == 200:
    # 使用BeautifulSoup解析网页内容
    soup = BeautifulSoup(response.text, 'html.parser')
    
    # 提取网页标题作为文件名，如果没有标题则使用默认名称
    title = soup.title.string if soup.title else 'index'
    
    # 构建保存的文件名
    filename = f'{title}.htm'
    
    # 以写入模式打开文件，并指定编码为UTF-8
    with open(filename, 'w', encoding='utf-8') as file:
        # 将解析后的网页内容写入文件
        file.write(str(soup))
    
    print(f'网页已成功保存为 {filename}')
else:
    print(f'请求失败，状态码：{response.status_code}')

代码解释

import requests 和 from bs4 import BeautifulSoup：导入所需的库。
url = 'https://www.ipipp.com'：定义要下载的网页URL。
response = requests.get(url)：发送HTTP GET请求获取网页内容。
if response.status_code == 200:：检查请求是否成功，状态码200表示成功。
soup = BeautifulSoup(response.text, 'html.parser')：使用BeautifulSoup解析网页内容。
title = soup.title.string if soup.title else 'index'：提取网页的标题作为文件名，如果没有标题则使用默认名称“index”。
filename = f'{title}.htm'：构建保存的文件名。
with open(filename, 'w', encoding='utf-8') as file:：以写入模式打开文件，并指定编码为UTF-8。
file.write(str(soup))：将解析后的网页内容写入文件。
print(f'网页已成功保存为 {filename}')：打印保存成功的消息。

注意事项

在使用浏览器保存网页时，有些网页可能包含动态加载的内容，这些内容可能无法被完整保存。
使用Python脚本下载网页时，要注意遵守网站的robots.txt协议和相关法律法规，不要过度频繁地请求网站。
保存的HTM文件可能会依赖外部的CSS、JavaScript文件和图片等资源，如果在离线状态下查看，可能需要手动下载这些资源并放置在正确的位置。

结论

通过本文介绍的两种方法，你可以轻松地将网页下载为HTM格式。浏览器自带功能适合简单的单个网页保存，而Python脚本则更适合批量下载和自动化操作。希望这些方法能满足你的需求。

下载网页为HTM Python下载网页浏览器保存网页离线保存网页网页保存方法修改时间：2026-05-09 09:28:42

免责声明：已尽一切努力确保本网站所含信息的准确性。网站内容多为原创整理与精心编撰，观点力求客观中立。本站旨在免费分享，内容仅供个人学习、研究或参考使用。若引用了第三方作品，版权归原作者所有。如内容涉及您的权益，请联系我们处理。