最新发布

# 2023-02-09
华为鸿蒙系统支持的中央空调有哪些
华为鸿蒙系统支持的中央空调有美的，日立中央空调等。首款搭载华为鸿蒙系统的智能空调中国尊鸿蒙艺术柜机，已于2021年5月起上市销售，在空调旺季市场上掀起一轮全新的主动智能、新风无风感的智慧新体验。随着美的与华为联手打造的这两大智慧空调操控体验
# 2023-02-09
华为harmonyos是什么手机
华为harmonyos是华为手机的操作系统，简称为鸿蒙系统。华为鸿蒙系统（HUAWEI Harmony OS），是华为公司在2019年8月9日于东莞举行华为开发者大会（HDC.2019）上正式发布的操作系统。华为鸿蒙系统是一款全新的面向全
# 2023-02-09
harmonyos是什么
harmonyos是华为鸿蒙系统。鸿蒙OS是华为公司开发的一款基于微内核、耗时10年、4000多名研发人员投入开发、面向5G物联网、面向全场景的分布式操作系统。鸿蒙的英文名是HarmonyOS，意为和谐。不是安卓系统的分支或修改而来的。与
# 2023-02-09
HarmonyOS——Ability和AbilitySlice生命周期(一)
HarmonyOS 中的页面会用到Ability和AbilitySlice。Ability是提供与用户交互的能力。AbilitySlice是一个页面及其逻辑的总和。两者的关系可以是一对多。也就是一个Ability中可以包含多个不同的A
# 2023-02-09
荣耀机型开启HarmonyOS 2内测，另有17款华为机型即将启动
目前，可以说华为自主研发的鸿蒙HarmonyOS系统正在如火如荼地开展升级及测试工作，而作为华为曾经的子品牌荣耀品牌的机型很多小伙伴都在期待获得HarmonyOS 2的测试，而最新消息来了，荣耀机型开启HarmonyOS内测了。根据最
# 2023-02-09
harmonyos是什么意思
harmonyos即鸿蒙系统的意思，正确写法为harmony os。harmony os鸿蒙系统是华为公司在2019年8月9日于东莞举行华为开发者大会（HDC.2019）上正式发布的操作系统。鸿蒙系统面向全场景的分布式操作，将人、设备、
# 2023-02-09
华为怎么取消harmony系统
harmonyOS系统是可以退出的。HarmonyOS版本可以通过华为手机助手回退到EMUI 11.0官方稳定版本。注意事项：1. 请确保当前使用的是华为官方版本，且为HarmonyOS版本，并且未进行任何非官方版本
# 2023-02-09
创维电视能不能升级鸿蒙系统
创维电视不能升级鸿蒙系统目前只有华为智慧屏和荣耀智慧屏搭载了鸿蒙系统，而鸿蒙系统刚刚正式发布，创维还没有正式加入鸿蒙阵营，短期内不会为创维电视适配鸿蒙系统，所以目前创维电视是无法升级鸿蒙系统的。由于鸿蒙系统是完全开源的系统，基于安卓系统的智
# 2023-02-09
鸿蒙抄袭安卓？看这一篇就够了
01什么是 AOSP ？很多人都说鸿蒙是 AOSP 套壳，那么我们首先得明白什么是 AOSP？ AOSP 是"Android Open Source Project&
# 2023-02-09
鸿蒙系统网页捷径怎么关闭
在华为浏览器设置中进行关闭。具体步骤：1.打开华为浏览器点击右下角更多。2.打开按键设置，选择主页设置。3.选择自定义主页，接下来选择自定义网址，就可以让捷径这个功能消失了。首先，您需要了解升级Harmony OS前的准备工作：1.升级前，

python如何才能获取src地址

2023-02-26 08:48:02Python019

python如何才能获取src地址,第1张

Copyright © 1999-2020, CSDN.NET, All Rights Reserved

python

打开APP

pergoods

关注

Python多线程爬取网站image的src属性实例原创

2017-05-16 11:18:51

pergoods

码龄6年

关注

# coding=utf-8

'''

Created on 2017年5月16日

@author: chenkai

Python多线程爬取某单无聊图图片地址(requests+BeautifulSoup+threading+Queue模块)

'''

import requests

from bs4 import BeautifulSoup

import threading

import Queue

import time

class Spider_Test(threading.Thread):

def __init__(self,queue):

threading.Thread.__init__(self)

self.__queue = queue

def run(self):

while not self.__queue.empty():

page_url=self.__queue.get() [color=red]#从队列中取出url[/color]

print page_url

self.spider(page_url)

def spider(self,url):

r=requests.get(url) [color=red]#请求url[/color]

soup=BeautifulSoup(r.content,'lxml') [color=red]#r.content就是响应内容，转换为lxml的bs对象[/color]

imgs = soup.find_all(name='img',attrs={}) #查找所有的img标签，并获取标签属性值（为列表类型）

for img in imgs:

if 'onload' in str(img): [color=red]#img属性集合中包含onload属性的为动态图.gif,[/color]

print 'http:'+img['org_src']

else:

print 'http:'+img['src']

def main():

queue=Queue.Queue()

url_start = 'http://jandan.net/pic/page-'

for i in range(293,295):

url = url_start+str(i)+'#comment'

queue.put(url) [color=red]#将循环拼接的url放入队列中[/color]

threads=[]

thread_count=2 [color=red]#默认线程数（可自动修改）[/color]

for i in range(thread_count):

threads.append(Spider_Test(queue))

for i in threads:

i.start()

for i in threads:

i.join()

if __name__ == '__main__':[color=red] #在.py文件中使用这个条件语句，可以使这个条件语句块中的命令只在它独立运行时才执行[/color]

time_start = time.time()

main() [color=red]#调用main方法[/color]

print time.time()-time_start

[color=red]#背景知识[/color]

'''

q = Queue.Queue(maxsize = 10)

Queue.Queue类即是一个队列的同步实现。队列长度可为无限或者有限。可通过Queue的构造函数的可选参数maxsize来设定队列长度。如果maxsize小于1就表示队列长度无限。

将一个值放入队列中

q.put(10)

调用队列对象的put()方法在队尾插入一个项目。put()有两个参数，第一个item为必需的，为插入项目的值；第二个block为可选参数，默认为

1。如果队列当前为空且block为1，put()方法就使调用线程暂停,直到空出一个数据单元。如果block为0，put方法将引发Full异常。

将一个值从队列中取出

q.get()

调用队列对象的get()方法从队头删除并返回一个项目。可选参数为block，默认为True。如果队列为空且block为True，get()就使调用线程暂停，直至有项目可用。如果队列为空且block为False，队列将引发Empty异常。

'''

[color=red]如果想要下载图片需要

import urllib

再替换spider方法即可[/color]

def spider(self,url):

r=requests.get(url)

soup=BeautifulSoup(r.content,'lxml')

imgs = soup.find_all(name='img',attrs={})

urls=[]

for img in imgs:

if 'onload' in str(img):

print 'http:'+img['org_src']

urls.append('http:'+img['org_src'])

else:

print 'http:'+img['src']

url = urls.append('http:'+img['src'])

#下载图片

k=0

for urlitem in urls:

k+=1

if '.jpg' in urlitem:

urllib.urlretrieve(url=urlitem,filename='F:\image\\'+str(k)+'.jpg')

[color=red]-----------多线程访问百度实例[/color]

#coding:utf-8

import requests

import threading

import time

import sys

url = 'https://www.baidu.com'

def get_baidu():

global url

time_start = time.time()

r = requests.get(url=url)

times = time.time()-time_start

sys.stdout.write('status:%s time:%s current_time:%s\n'%(r.status_code,times,time.strftime('%H:%M:%S')))

def main():

threads = []

thread_count = 10

for i in range(thread_count):

t = threading.Thread(target=get_baidu,args=())

threads.append(t)

for i in range(thread_count):

threads[i].start()

for i in range(thread_count):

threads[i].join()

if __name__=='__main__':

爬虫中手动输入验证码方法无法获取图片src地址

验证码在html中图片标签内容：

<class=“verCodeImg” src="/kaptcha.jpg?v=0.234724039578059" οnclick=“verCode(this)”>

<class=“verCodeImg” src="/kaptcha.jpg?v=0.234724239578059" οnclick=“verCode(this)”>

可知获取到验证码的src地址就能动态的获得验证码

因为验证码是动态的！动态的！动态的！

用动态爬取网页的方法：

要用到selenium库

其实获得了验证码的src地址，我还是没能成功登陆

因为即使是相同的链接点进去，每一次刷新都会有不同的验证码

通过动态网页打开是一张

解析src地址出来是另一张

# coding:utf8

import urllib.request

import os

def download_img(img_url):

request = urllib.request.Request(img_url)

try:

response = urllib.request.urlopen(request)

img_name = img_url.split('/')[-1]

print(img_name)

filename = os.getcwd() + '/' + img_name

print(filename)

code = response.getcode()

print(code)

if (code == 200):

with open(filename, 'wb') as f:

f.write(response.read()) # 将内容写入图片

return filename

except:

return "failed"

if __name__ == '__main__':

# 下载要的图片

img_url = ''

print (download_img(img_url)+' download successfully!')

队列验证码方法如果地址

# 上一篇：C语言如何输入小数

# 下一篇：小米Ruby可以双硬盘吗