python爬取网页数据,为啥保存到Excel里面没有东西?

Python015

python爬取网页数据,为啥保存到Excel里面没有东西?,第1张

如果您使用 Python 从网页中抓取数据并将其保存到 Excel 文件,但 Excel 文件不包含任何数据,则可能有多种原因。以下是一些可能的原因和解决方案:

您没有使用正确的方法将数据写入 Excel 文件。若要将数据保存到 Excel 文件,需要使用库,例如 或 。这些库提供可用于创建和写入 Excel 文件的函数和类。确保已导入正确的库,并使用正确的方法将数据写入文件。openpyxlxlsxwriter

将数据写入 Excel 文件后,您不会保存该文件。将数据写入 Excel 文件后,需要使用 or 方法保存对文件的更改。如果不保存文件,则不会保留写入文件的数据。save()save_as()

您没有在正确的模式下打开 Excel 文件。使用 Python 打开 Excel 文件时,需要指定是要读取文件还是写入文件。如果以只读模式打开文件,则无法向其写入数据。确保在写入模式下打开文件,在调用该方法时使用该选项。write_onlyopen()

您没有将数据写入 Excel 文件中的正确工作表。一个 Excel 文件可以包含多个工作表,您需要指定要将数据写入哪个工作表。请确保在调用 or 方法将数据写入 Excel 文件时使用正确的工作表名称。append()write()

回答不易望请采纳

爬虫流程

其实把网络爬虫抽象开来看,它无外乎包含如下几个步骤

模拟请求网页。模拟浏览器,打开目标网站。

获取数据。打开网站之后,就可以自动化的获取我们所需要的网站数据。

保存数据。拿到数据之后,需要持久化到本地文件或者数据库等存储设备中。

那么我们该如何使用 Python 来编写自己的爬虫程序呢,在这里我要重点介绍一个 Python 库:Requests。

Requests 使用

Requests 库是 Python 中发起 HTTP 请求的库,使用非常方便简单。

模拟发送 HTTP 请求

发送 GET 请求

当我们用浏览器打开豆瓣首页时,其实发送的最原始的请求就是 GET 请求

import requests

res = requests.get('http://www.douban.com')

print(res)

print(type(res))

>>>

<Response [200]>

<class 'requests.models.Response'>