Python tag解析

Python013

Python tag解析,第1张

这个不难啊,用id来定位元素,然后就可以了。id通常是唯一的。

from bs4 import BeautifulSoup

html_doc = '<a href="http://example.com/elsie" class="sister" id="link1">Elsie</a>,'

soup = BeautifulSoup(html_doc, 'html.parser')

print soup.find(id="link1").string   # => 'Elsie'

import xml.etree.ElementTree as ET

root = ET.parse("1.txt") #这个就是你的xml

result = root.findall('*/name') #这个就是你的tag

for each in result:

print (each)

>>>s=""//FEATURE_COMMOAN @{

........

........"""

>>>import re

>>>reg=re.compile(r"//FEATURE_COMMON\s+@\{(.*?)//@\}\s+FEATURE_COMMON",re.DOTALL)

>>>reg.findall(s)