python-xml怎么安装啊

Python010

python-xml怎么安装啊,第1张

pip install lxml python2.7.9 自带pip安装工具。 看下面图片,图中显示本人电脑已经安装好了。

1.

直接copy

下载的模块文件中已经有了模块的文件,有些模块只有一个文件,比如较早版本的BeautifulSoup,有些是一个文件夹,比如新版本BeautifulSoup就是一个叫做bs4的文件夹。

把这些文件直接copy到你的python路径下的/Lib/site-packages文件夹中,比如C:/Python27/Lib/site-packages。之后就可以在程序里直接引用了:

import BeautifulSoup

或者

from bs4 import BeautifulSoup

这是根据你放置的文件位置不同而决定的。

网上有人说直接放在Lib文件夹中就可以了。的确这样也行,但Lib文件夹中都是自带的模块,看一下就会发现我们用过的random、re等模块的代码文件。而外部模块一般放在site-packages文件夹中。

2.

setup.py

很多模块里都附带了setup.py文件,有同学直接双击了,然后发现没有用。

它的使用方法是从命令行去到setup.py所在的路径下,运行

python setup.py install

仔细看一下安装时输出的信息可以发现,在线学习这个命令做的事情其实也就是帮你把模块的代码copy到site-packages文件夹。

3.

setuptools

使用setuptools可以直接根据模块名称来自动下载安装,不需要自己再去寻找模块的安装文件。不过在使用之前,你得先安装setuptools自身。

windows平台的32位python,可以直接下载setuptools的exe文件安装。

lxml是Python中与XML及HTML相关功能中最丰富和最容易使用的库。lxml并不是Python自带的包,而是为libxml2和libxslt库的一个Python化的绑定。它与众不同的地方是它兼顾了这些库的速度和功能完整性,以及纯Python API的简洁性,与大家熟知的ElementTree API兼容但比之更优越!但安装lxml却又有点麻烦,因为存在依赖,直接安装的话用easy_install, pip都不能成功,会报gcc错误。下面列出来Windows、Linux下面的安装方法:

【Windows系统】

先确保Python已经安装好,环境变量也配置好了,相应的的easy_install、pip也安装好了.

1. 执行 pip install virtualenv

[python] view plain copy print?

C:\>pip install virtualenv

Requirement already satisfied (use --upgrade to upgrade): virtualenv in c:\python27\lib\site-package

s\virtualenv-12.0.4-py2.7.egg

2. 从官方网站下载与系统,Python版本匹配的lxml文件:

http //pypi.python.org/pypi/lxml/2.3/

NOTE:

比如说我的电脑是Python 2.7.4, 64位操作系统,那么我就可以下载

[python] view plain copy print?

lxml-2.3-py2.7-win-amd64.egg (md5) # Python Egg

lxml-2.3.win-amd64-py2.7.exe (md5) # MS Windows installer

3. 执行 easy_install lxml-2.3-py2.7-win-amd64.egg

[python] view plain copy print?

D:\Downloads>easy_install lxml-2.3-py2.7-win-amd64.egg# 进入该文件所在目录执行该命令

Processing lxml-2.3-py2.7-win-amd64.egg

creating c:\python27\lib\site-packages\lxml-2.3-py2.7-win-amd64.egg

Extracting lxml-2.3-py2.7-win-amd64.egg to c:\python27\lib\site-packages

Adding lxml 2.3 to easy-install.pth file

Installed c:\python27\lib\site-packages\lxml-2.3-py2.7-win-amd64.egg

Processing dependencies for lxml==2.3

Finished processing dependencies for lxml==2.3

NOTE:

1. 可用exe可执行文件,方法更简单直接安装就可以

2. 可用easy_install安装方式,也可以用pip的方式

[python] view plain copy print?

#再执行下,就安装成功了!

>>>import lxml

>>>

3. 如用pip安装,常用命令就是:

pip install simplejson # 安装Python包

pip install --upgrade simplejson # 升级Python包

pip uninstall simplejson# 卸载Python包

4. 如用Eclipse+Pydev的开发方式,需要移除旧包,重新加载一次

Window -->Preferences -->PyDev -->Interperter-python # 否则导包的时候会报错

【Linux系统】

因为lxml依赖的包如下:

libxml2, libxml2-devel, libxlst, libxlst-devel, python-libxml2, python-libxslt

所以安装步骤如下:

第一步: 安装 libxml2

$ sudo apt-get install libxml2 libxml2-dev

第二步: 安装 libxslt

$ sudo apt-get install libxlst libxslt-dev

第三步: 安装 python-libxml2 和 python-libxslt

$ sudo apt-get install python-libxml2 python-libxslt

第四步: 安装 lxml

$ sudo easy_install lxml

python有三种方法解析XML,SAX,DOM,以及ElementTree,这三种都不需要额外安装的,还可以使用beautifulsoup,这个可以去官网上下载。下面介绍下内置的三种解析方法。

###1.SAX (simple API for XML )

pyhton 标准库包含SAX解析器,SAX是一种典型的极为快速的工具,在解析XML时,不会占用大量内存。

但是这是基于回调机制的,因此在某些数据中,它会调用某些方法进行传递。这意味着必须为数据指定句柄,

以维持自己的状态,这是非常困难的。

###2.DOM(Document Object Model)

与SAX比较,DOM典型的缺点是比较慢,消耗更多的内存,因为DOM会将整个XML数读入内存中,并为树

中的第一个节点建立一个对象。使用DOM的好处是你不需要对状态进行追踪,因为每一个节点都知道谁是它的

父节点,谁是子节点。但是DOM用起来有些麻烦。

###3.ElementTree(元素树)

ElementTree就像一个轻量级的DOM,具有方便友好的API。代码可用性好,速度快,消耗内存少,这里主要

介绍ElementTree。