让适合的人走进你的生活吧,让旧梦逝去吧,让不合适的那个离开吧。人生,看轻看淡多少,痛苦就离开你多少。因为看轻,所以快乐!
使用关键字传参,如果参数名不是find系函数已定义的位置参数名,参数会被kwargs收集并被当做 标签的属性来搜索 (拥有ID属性的标签)。
属性的传参可以是字符串、正则表达式对象、True、列表。
class是Python关键字,所以使用 class_ 。class是多值属性,可以匹配其中任意一个,也可以完全匹配。
属性:attrs接收一个字典, 字典的key为属性名, value可以是字符串、正则表达式对象、True、列表
可以通过text参数 搜索文档中的字符串内容,接受字符串、正则表达式对象、True、列表
限制返回结果的数量
默认是递归搜索所有子孙节点,如果不需要请设置为False
find_all()是非常常用的方法,可以简化省略掉
find( name , attrs , recursive , text , **kwargs )
和JQuery一样,可以使用CSS选择器来查找节点
使用soup.select()方法,select方法支持大部分CSS选择器,返回列表。
CSS中,标签名直接使用,类名前加.点号,id名前加#井号。
搜索节点的目的往往是为了提取该节点的文本内容, 一般不需要HTML标记, 只需要文字
拿到一个Json字符串,如果想提取其中的部分内容,就需要遍历了。在遍历过程中进行判断。
还有一种方式,类似于XPath,叫做JsonPath。
下表中列出了对应了JSONPath以及对应的XPath用法
依然用豆瓣电影的热门电影的Json, 找到得分高于8分的
https://movie.douban.com/j/search_subjects?type=movie&tag=%E7%83%AD%E9%97%A8&page_limit=50&page_start=0
异步请求的数据在XHR中,request请求的html不一定有我们想要的数据;
因为<b>会继承父元素<span>的颜色,所以变红,color属性是可继承的。并不是子选择器的原因。你可以把{color:red}换成{border:1px solid red}看看第三层有没有边框?目前除了:first-letter没有选择器可以具体到字符。
所以你可以CSS样式继承及覆写的特性。
.positionInfo {color : red
}
.positionInfo > * {
color : black
}