最新发布

# 2023-02-09
harmonyos忘记密码如何解锁？
如果您确认遗忘自己的手机密码需要解锁，我们可以帮助您将手机强制恢复出厂设置。但是手机中的数据也会被清除，且无法恢复，建议您再回忆一下是否通过云备份或其他方式备份过手机数据。也建议您再仔细回忆一下是否自己设置修改了密码，如果确定无法回忆起密
# 2023-02-09
鸿蒙OS2.0九大新功能，详细玩机技巧
鸿蒙OS适配后，相比EMUI新增了九大功能！赶快保存或者手机搜索玩机技巧。一、HarmonyOs 桌面提供了服务卡片、大文件夹与小艺建议,让操作更便捷、桌面更美观。服务卡片:无需打开应用,可快速预览应用信息或使用常用功能。将不同
# 2023-02-09
magicos和鸿蒙os区别
magicos和鸿蒙os区别：两者定位不同，技术架构不同。两者定位不同：HarmonyOS旨在替换安卓、最终实现跨平台多设备分布式操作。MagicOS则是在安卓系统、Windows系统以及其它操作系统上叠加荣耀的核心能力，从而让不同生态实
# 2023-02-09
鸿蒙系统在线铃声免费吗
鸿蒙系统在线铃声部分是免费的。鸿蒙系统上有一些在线铃声是免费的，但不是所有都是免费的，毕竟运营商还是要赚钱的，如果不想付费可以在一些免费的资源里寻找一个自己最喜欢的，愿意的话可以找自己喜欢的铃声付费，付费的铃声还是比较丰富的，可以选择的很多
# 2023-02-09
p50HarmonyOS新桌面有哪些功能？
HarmonyOS 提供服务卡片、大文件夹和小艺建议，让您把重要信息放在眼前，操作更快捷，屏幕也更个性化。P50手机系统为HarmonyOS 2，具体功能如下：状态栏：通过顶部状态栏查看手机状态、通知消息。大文件夹：无需展开文件夹，可一步打
# 2023-02-09
鸿蒙HarmonyOS系统用户已突破3000万，跻身第三大操作系统？
华为HarmonyOS操作系统用户已经突破3000万，计划2021年底突破三亿台设备北京时间7 月 8 日，华为官方透露，华为 Harmony OS 2.0 用户已经达到 3000 万。新系统发布仅一个多月，相当于每天有一百
# 2023-02-09
鸿蒙系统的官网是什么?
鸿蒙系统的官网是Harmonyos.com。华为鸿蒙系统是一款全新的面向全场景的分布式操作系统，创造一个超级虚拟终端互联的世界，将人、设备、场景有机地联系在一起，将消费者在全场景生活中接触的多种智能终端实现极速发现、极速连接、硬件互助、资
# 2023-02-09
华为手机升级鸿蒙系统音乐不能同步到华为音箱
要将手机和鸿蒙系统音乐进行蓝牙配对。匹配方法：1、在鸿蒙系统手机的主页面中从右上边向下滑动，调出控制中心。2、点击【音频播控中心】，播放音乐、新人或者是有声小说等。3、进入音频播控中心中，点击右上角的位置。4、选择切换音频输出设备，以华为音
# 2023-02-09
HarmonyOS技术特性
最近,随着华为的一批电子设备升级鸿蒙系统,鸿蒙系统的热度也逐渐升高。这里分享一下鸿蒙系统的定位及底层特性,让人们比较深入的认识一下鸿蒙系统。 HarmonyOS是一款面向万物互联时代的、全新的分布式操作系统。
# 2023-02-09
华为手机开机显示Harmony OS是什么情况?
如果您的手机开机进入Harmony OS界面、EMUI界面、FASTBOOT界面，可能因为如下原因：（1）可能是无意按到了开机键+音量键的组合键进入了特殊模式，建议您长按电源键15秒以上，尝试强制重启手机，即可正常进入手机桌面。温馨提醒

用python爬取关键词并解释

2023-02-12 15:22:01Python025

用python爬取关键词并解释,第1张

Copyright © 1999-2020, CSDN.NET, All Rights Reserved

python

打开APP

小羊努力搞代码

关注

学习日志：Python 实现网络爬虫——提取关键字原创

2022-06-19 13:02:38

小羊努力搞代码

码龄174天

关注

编写一段Python代码，向百度提交查询关键词“桃花源记”，抓取百度的查询结果，要求有文字、链接，可以在浏览器中打开抓取的链接，或者调用浏览器打开抓取的链接。

红框内是根据网站信息需要更改的内容。57031baa3a394395be479ad89f1ff15e.png

附上完整代码：

import json

import requests

from lxml import etree

headers = {

"User-Agent":"Mozilla/5.0 (Windows NT 10.0WOW64) AppleWebKit/537.36 (KHTML, like Gecko) "

"Chrome/88.0.4324.104 Safari/537.36"

}

response = requests.get('https://www.baidu.com/s?wd=桃花源记&lm=0', headers=headers)

r = response.text

html = etree.HTML(r, etree.HTMLParser())

r1 = html.xpath('//h3')

r2 = html.xpath('//*[@class="content-right_8Zs40"]')

r3 = html.xpath('//*[@class="c-row source_1Vdff OP_LOG_LINK c-gap-top-xsmall"]/a/@href')

for i in range(4):

r11 = r1[i].xpath('string(.)')

r22 = r2[i].xpath('string(.)')

r33 = r3[i]

with open('桃花源记.txt', 'a', encoding='utf-8') as c:

c.write(json.dumps(r11,ensure_ascii=False) + '\n')

c.write(json.dumps(r22, ensure_ascii=False) + '\n')

c.write(json.dumps(r33, ensure_ascii=False) + '\n')

print(r11, end='\n')

print('------------------------')

print(r22, end='\n')

print(r33)

8684公交线路爬取

import requests

from lxml import etree

items=[]

headers={

"User-Agnet":"Mozilla/5.0 (MacintoshIntel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.130 Safari/537.36"

}

def parse_navigation():

url=' https://beijing.8684.cn/'

r=requests.get(url,headers=headers)

#解析内容,获取所有的导航链接#

tree=etree.HTML(r.text)

#查找以数字开头的所有链接#

number_href_list=tree.xpath('//div[@class="depth"]/div[2]/div[1]/div/a/@href')

#查找以字母开头的所有链接

char_href_list=tree.xpath('//div[@class="depth"]/div[2]/div[2]/div/a/@href')

#将需要爬取的所有链接返回

return number_href_list+char_href_list

def parse_erji_route(content):

tree=etree.HTML(content)

#写xpath,获取每一个线路

route_list=tree.xpath('//div[@class="cc-content"]/div[2]/a/@href')

route_name=tree.xpath('//div[@class="cc-content"]/div[2]/a/text()')

i=0

#遍历上面这个列表

for route in route_list:

print('开始爬取%s线路'%route_name[i])

route=' https://beijing.8684.cn'+route

r=requests.get(url=route,headers=headers)

#解析内容,获取每一路公交的详细信息

parse_sanji_route(r.text)

print('结束爬取%s线路'%route_name[i])

i+=1

def parse_sanji_route(content):

tree=etree.HTML(content)

#依次获取内容

bus_number=tree.xpath('//div[@class="bus-lzinfo mb20"]/div[2]/h1/text()')[0]

#获取运行时间

run_time=tree.xpath('//div[@class="bus-lzinfo mb20"]/div[2]/ul/li[1]/text()')[0]

#获取票价信息

ticket_info=tree.xpath('//div[@class="bus-lzinfo mb20"]/div[2]/ul/li[2]/text()')[0]

#获取更新时间

gxsj=tree.xpath('//div[@class="bus-lzinfo mb20"]/div[2]/ul/li[4]/text()')[0]

#获取上行总站数

total_list=tree.xpath('//div[@class="bus-excerpt mb15"]/div[2]/div/text()')

up_total=total_list[0]

#将里面的空格给去掉

up_total=up_total.replace('\xa0','')

print(up_total)

#获取上行所有站名

up_site_list=tree.xpath('//div[@class="bus-lzlist mb15"][1]//li/a/text()')

print(up_site_list)

exit()

try:

#获取下行总站数

down_total=total_list[1]

#获取下行所有站名

down_site_list=tree.xpath('//div[@class="bus-lzlist mb15"][2]//li/a/text()')

except Exception as e:

down_total=''

down_site_list=[]

#将每一条公交线路信息放到字典中

item={

'线路名':bus_number,

'运行时间':run_time,

'票价信息':ticket_info,

'更新时间':gxsj,

'上行站数':up_total,

'上行站点':up_site_list,

'下行站数':down_total,

'下行站点':down_site_list,

}

items.append(item)

def parse_erji(navi_list):

#遍历上面的列表,依次发送请求,解析内容,获取每一个页面所有的公交路线url

print(navi_list)

for first_url in navi_list:

first_url=' https://beijing.8684.cn'+first_url

print('开始爬取%s所有的公交信息'%first_url)

r=requests.get(url=first_url,headers=headers)

#解析内容,获取每一路公交的详细url

parse_erji_route(r.text)

print('结束爬取%s所有的公交信息'%first_url)

def main():

#爬取第一页所有的导航链接#

navi_list=parse_navigation()

#爬取二级页面,需要找到以1开头的所有公交路线

parse_erji(navi_list)

#爬取完毕

fp=open('文件保存路径','w',encoding='utf8')

for item in items:

fp.write(str(item)+'\n')

fp.close()

if name ==' main ':

main()

有的链接桃花源记内容小羊

# 上一篇：python如何读取矢量图和四个坐标点

# 下一篇：有哪些高级显白的口红色号可以推荐？