用python爬取关键词并解释

2023-02-26 15:58:02Python024

用python爬取关键词并解释,第1张

python

打开APP

小羊努力搞代码

关注

学习日志：Python 实现网络爬虫——提取关键字原创

2022-06-19 13:02:38

小羊努力搞代码

码龄174天

关注

编写一段Python代码，向百度提交查询关键词“桃花源记”，抓取百度的查询结果，要求有文字、链接，可以在浏览器中打开抓取的链接，或者调用浏览器打开抓取的链接。

红框内是根据网站信息需要更改的内容。57031baa3a394395be479ad89f1ff15e.png

附上完整代码：

import json

import requests

from lxml import etree

headers = {

"User-Agent":"Mozilla/5.0 (Windows NT 10.0WOW64) AppleWebKit/537.36 (KHTML, like Gecko) "

"Chrome/88.0.4324.104 Safari/537.36"

}

response = requests.get('https://www.baidu.com/s?wd=桃花源记&lm=0', headers=headers)

r = response.text

html = etree.HTML(r, etree.HTMLParser())

r1 = html.xpath('//h3')

r2 = html.xpath('//*[@class="content-right_8Zs40"]')

r3 = html.xpath('//*[@class="c-row source_1Vdff OP_LOG_LINK c-gap-top-xsmall"]/a/@href')

for i in range(4):

r11 = r1[i].xpath('string(.)')

r22 = r2[i].xpath('string(.)')

r33 = r3[i]

with open('桃花源记.txt', 'a', encoding='utf-8') as c:

c.write(json.dumps(r11,ensure_ascii=False) + '\n')

c.write(json.dumps(r22, ensure_ascii=False) + '\n')

c.write(json.dumps(r33, ensure_ascii=False) + '\n')

print(r11, end='\n')

print('------------------------')

print(r22, end='\n')

print(r33)

Python find() 方法检测字符串中是否包含子字符串 str ，如果指定 beg（开始）和 end（结束）范围，则检查是否包含在指定范围内，如果包含子字符串返回开始的索引值，否则返回-1。

str.find(str, beg=0, end=len(string))

str -- 指定检索的字符串

beg -- 开始索引，默认为0。

end -- 结束索引，默认为字符串的长度。

初学者建议用上面的，进阶可以用正则表达式

字符串桃花源记小羊代码索引

# 上一篇：r语言画图默认字号

# 下一篇：学习Python建议用什么编译器?

给您推荐相同类型的内容：

计算机毕业论文开题报告—教学网站的设计与实现(一)
毕业设计(论文)开题报告一、选题的依据、意义和理论或实际应用方面的价值本课题围绕C语言课程教学网站的设计与实现展开,此教学网站的开发突破了时间、空间的限制,给学习者提供丰富的网络教学资源及各种形式的教学活动。同时使课程中抽象和难以体会的
星际公民鼹鼠在哪里买
星际公民鼹鼠是只能在官网购买的。因为星际公民常驻飞船可以随时通过官网购买，常驻船最贵的是315刀的鼹鼠，在官网就可以购买升级，不需要其他条件，所以鼹鼠是只能在官网购买的。星际公民设定在30世纪银河系中心虚构的地球联合帝国，一个晚期罗马帝国
Go 语言前景怎么样，有木有需要 Go 程序员的
GO语言虽然不如Java、Python等语言火热，但在云计算、云存储时代却是最重要的基础编程语言。作为服务器编程语言，很适合处理日志、数据打包、虚拟机处理、文件系统、分布式系统、数据库代理等。在国外，Google、Facebook等公司在使
java培训费一般多少?
费用一般在1万五到两万元之间。【点击测试我适不适合学设计】 java培训线上费用大部分在几千元到1万元左右，线上培训可能还会分为直播课和录播课，直播课相对来说价钱会高一些。这种学习方式学习时间灵活，学员可自由安排学习时间，并且不会耽误上
每个开发人员都应该知道的16个顶级新计算机编程语言
函数式语言 Elixir Elixir 比 Erlang 更容易编写，具有 Haskell 等语言的函数式编程概念。Elixir是基于Erlang 虚拟机的，其广为人知的特点是运行低延时、分布式、可容错的系统，并成
python 有没有问号冒号表达式
函数，循环，if条件，类定义等后面有block，block要缩进，因此这些语句后面要加上冒号，这是python的语法 python的冒号和java、c中的{}是一样的 block是一组语句 1,正则表达式的一些内容
python贪吃蛇撞墙后如何重新开始
点击重新开始按钮。根据CSDN博客相关资料查询得知，python贪吃蛇撞墙后想要重新开始可以按重新开始按钮重新玩一次、当贪吃蛇撞墙或者撞到自己时、贪吃蛇会死亡跳入到重启界面、在重启界面，有两个按钮、点击重新开始按钮游戏进入运行界面。1、首
如何让R语言通过RODBC库读写数据库的数据
一、安装RODBC库1、进入R语言的GUI界面（RGUI.EXE)，在菜单栏选择“程序包安装程序包”（如图）2、在弹出的窗口里往下拉，选择RODBC如图，点击确定3、在ODBC数据源管理器里将需要的数据库添加进去，这里笔者使用的是SQL
在R语言中,参数prob和scale和df是什么意思
prob=probabilitie是概率,df=degrees of freedom 是自由度.scale(x,center = TRUE,scale = TRUE)函数scale执行中心化和标准化.若center为数字或向量,x减去cen
python 矩阵 sqrt什么意思
对矩阵操作sqrt的意思是对矩阵中的每个元素都开方，比如：from numpy import *import numpy as npA = np.matrix([[1, 2, 3], [4, 5, 6], [7, 8, 9]])B = a
R语言里面的因子
R语言中的因子确实不好理解，很多人都这么觉得。在R语言中，因子（factor）表示的是一个符号、一个编号或者一个等级，即，一个点。例如，人的个数可以是1，2，3，4......那么因子就包括，1，2，3，4.....还有统计量的水平的时候用
驳狗屎文 "我为什么放弃Go语言
此篇文章流传甚广, 其实里面没啥干货，而且里面很多观点是有问题的. 这个文章在 golang-china 很早就讨论过了.最近因为 Rust 1.0 和 1.1 的发布, 导致这个文章又出来毒害读者.所以写了这篇反驳文章, 指出其中的问题
组内相关系数的意义及R语言实现
组内相关系数（intra-class correlation coefficient, ICC）的用途、类型以及计算。 ICC常用于衡量某个指标（比如，皮层厚度）在多次测量中的一致性相似性（即信度）。在概念上，ICC等于真实的（被试间
为什么空军的阿兵哥比较少
那是因为空军需要投入很多的资金，对于不算富有的国家来说是个负担。空军作战任务主要是协助及配合地面部队攻势及行动。一般常规战争，会先由侦察机进行侦察行动，最初会由空军提供重型火力攻击，摧毁敌方主要防空设施，电力设施，军事基地等重要目标，再由轰
python 弹出式对话框
不知道你用的什么版本，我修改了一下，测试通过(python2.7)：# coding=utf-8import Tkinterimport tkMessageBoxdef show(): tkMessageBox.showinfo(t
81.go + vue实现web应用程序
前端框架越来越丰富，前后端分离已经是大多数软件团队采取的模式了。vue使用的场景也越来越多。 go本来使用template模板来进行前端的表现，现在可以用vue来分担很大一部分工作了。通常直接使用go语言写后端，然后使用静态模板
GO语言（十六）：模糊测试入门（上）
本教程介绍了 Go 中模糊测试的基础知识。通过模糊测试，随机数据会针对您的测试运行，以尝试找出漏洞或导致崩溃的输入。可以通过模糊测试发现的一些漏洞示例包括 SQL 注入、缓冲区溢出、拒绝服务和跨站点脚本攻击。在本教程中，您将为一个
R语言的清屏命令
命令代码参考如下：# An R function to clear the screen on RGui:cls &lt- function() {if (.Platform$GUI[1] != "Rgui")r
Java中的异常有哪几类
常见的异常有：1、 java.lang.nullpointerexception 解释是"程序遇上了空指针",就是调用了未经初始化的对象或者是不存在。2、java.lang.classnotfoundexceptio
C语言：用递归的方式对数组排序
#include &ltstdio.h&gt#define N 8void selection_sort(int a[], int n) {int i, t, imax = 0if(n &lt 1) return
您好，您的cass地类编码072解决了吗，是怎么解决的。
这个是南方cass本身的一个问题，宗地地类前边的0它不会显示出来，但如果是图斑地类，它就没问题了当然，实际上又不可能把宗地都弄成图斑，所以这个还得自己解决一是通过快速选择文本内容72，限定图层JZD，再按它的对正方式（中上）进行一次筛选，在
北大青鸟设计培训：java短期培训哪个学校比较好？
在学电脑的学校很多，去哪个学校比较好？java短期培训哪里学比较好？沈阳北大青鸟的课程是由专门的研发团队进行研发的，这一点就是其他几个学校不能比拟的，下面北大青鸟http:www.kmbdqn.cn就从三个方面帮你认识学校的课程：一看
java培训班哪家好？
推荐千锋教育，Java应用广泛，除非有一项很大的技术突破能够替代Java。在当下，Java被使用的场景非常多，网站、游戏、办公软件、新零售、云计算、芯片技术、数字经济等多个互联网领域都不开Java，拥有很好的就业前景。就算是小白也可以学会，
C语言如何提高程序效率
好的代码没有一个统一的衡量标准，在程序员们的世界里大家也是各自按照自己的标准衡量着自己和别人的代码。不过有一个标准几乎是被所有人认同的。服役时间越长、出错率越高的代码就是好代码。所有的编程方法、代码技巧甚至于设计模式都是为了达到这个目的而
Java的官方网站是哪个？
Java 官方网站https：www.java.comzh_CNJava是一门面向对象编程语言，1990年代初由詹姆斯·高斯林等人开发出Java语言的雏形，最初被命名为Oak，后随着互联网的发展，经过对Oak的改造，1995年5月J
[R语言] Heatmap绘图经验总结
这里随机生成了25个0,1之间的均匀分布的随机数，其中，行是样本，列是特征，如图：第一种方案绘制的Heatmap需要借助于Corrplot包，我们求出dat特征的相关系数矩阵，进一步利用corrplot函数来画图，在该包的官方文档中，
学习Python建议用什么编译器?
LLVM后端的numba和支持大部分C++编译器作为后端的nuitka。Python由荷兰数学和计算机科学研究学会的Guido van Rossum于1990 年代初设计，作为一门叫做ABC语言的替代品。Python提供了高效的高级数据
学java去哪个培训机构好点？
国内的java培训机构非常多，比较知名的品牌有千锋教育、动力节点、中软国际教育集团、课工场、开课吧等等。千锋教育就有线上免费Java线上公开课。值得注意的是，因为java属于新兴行业，培训机构的教学水平和师资力量参差不齐，有些机构会宣传为
如何让python程序在命令行不输入扩展名就能运行?[已解决]
打开我的电脑，工具&gt&gt文件夹选项&gt&gt文件类型里面有py的扩展名和对应的关联。实在不行你重装下python，我的用的是activepython，装好之后就自动关联了，py脚本图片都变成了pyth
r语言lm函数找不到对象
百度知道r语言找不到对象geneexp查看全部1个回答百度网友0f1c54f9b超过127用户采纳过TA的回答关注成为第12位粉丝r语言找不到对象geneexp，原因和解决方法如下。cor.test(x, ...)## Default S3

推荐阅读

热门文章

最新发布

标签列表

用python爬取关键词并解释

给您推荐相同类型的内容：