这个不难啊,用id来定位元素,然后就可以了。id通常是唯一的。
from bs4 import BeautifulSouphtml_doc = '<a href="http://example.com/elsie" class="sister" id="link1">Elsie</a>,'
soup = BeautifulSoup(html_doc, 'html.parser')
print soup.find(id="link1").string # => 'Elsie'
import xml.etree.ElementTree as ETroot = ET.parse("1.txt") #这个就是你的xml
result = root.findall('*/name') #这个就是你的tag
for each in result:
print (each)
>>>s=""//FEATURE_COMMOAN @{........
........"""
>>>import re
>>>reg=re.compile(r"//FEATURE_COMMON\s+@\{(.*?)//@\}\s+FEATURE_COMMON",re.DOTALL)
>>>reg.findall(s)