他们2者功能是完全不同的,而初学者往往会被误导。
首先 我们看.find()方法:
现在有一个页面,里面HTML代码为<div class="css">
<p class="rain">测试1</p>
</div>
<div class="rain">
<p>测试2</p>
</div>
如果我们使用find()方法:
var $find = $("div").find(".rain")
alert( $find.html() )
将会输出:
测试1
如果使用filter()方法:
var $filter = $("div").filter(".rain")
alert( $filter.html() )
将会输出:
<p>测试2</p>
也许你已经看出它们的区别了。
find()会在div元素内 寻找 class为rain 的元素。
而filter()则是筛选div的class为rain的元素。
一个是对它的子集操作,一个是对自身集合元素筛选。
另外find()其实还可以用选择器表示:
var $select = $("div .rain")
明白他们的区别了吗?
让适合的人走进你的生活吧,让旧梦逝去吧,让不合适的那个离开吧。人生,看轻看淡多少,痛苦就离开你多少。因为看轻,所以快乐!
使用关键字传参,如果参数名不是find系函数已定义的位置参数名,参数会被kwargs收集并被当做 标签的属性来搜索 (拥有ID属性的标签)。
属性的传参可以是字符串、正则表达式对象、True、列表。
class是Python关键字,所以使用 class_ 。class是多值属性,可以匹配其中任意一个,也可以完全匹配。
属性:attrs接收一个字典, 字典的key为属性名, value可以是字符串、正则表达式对象、True、列表
可以通过text参数 搜索文档中的字符串内容,接受字符串、正则表达式对象、True、列表
限制返回结果的数量
默认是递归搜索所有子孙节点,如果不需要请设置为False
find_all()是非常常用的方法,可以简化省略掉
find( name , attrs , recursive , text , **kwargs )
和JQuery一样,可以使用CSS选择器来查找节点
使用soup.select()方法,select方法支持大部分CSS选择器,返回列表。
CSS中,标签名直接使用,类名前加.点号,id名前加#井号。
搜索节点的目的往往是为了提取该节点的文本内容, 一般不需要HTML标记, 只需要文字
拿到一个Json字符串,如果想提取其中的部分内容,就需要遍历了。在遍历过程中进行判断。
还有一种方式,类似于XPath,叫做JsonPath。
下表中列出了对应了JSONPath以及对应的XPath用法
依然用豆瓣电影的热门电影的Json, 找到得分高于8分的
https://movie.douban.com/j/search_subjects?type=movie&tag=%E7%83%AD%E9%97%A8&page_limit=50&page_start=0
异步请求的数据在XHR中,request请求的html不一定有我们想要的数据;