编程纯小白想问一下,要用python进行文本分析(NPL?),学习路线应该是怎样的(目标:熟练的分析文献)?

Python040

编程纯小白想问一下,要用python进行文本分析(NPL?),学习路线应该是怎样的(目标:熟练的分析文献)?,第1张

先学文本分析的思路方法,

比如文本表示最简单的方式是词袋法,把文本变成向量,每个词是向量的一个维度,所以中文需要分词,Python分词找jieba分词

文本表示向量以后,就可以开始对应你需要的任务,比如做分类聚类关联之类的事。比如垃圾邮件分类就是建模对文本内容判断真或假

不用读文献,有问题百度找博客就行了

# -*- coding: utf-8 -*-from tkinter import *result = []def get_text(event): result.append(event.char) text.delete('0.0', END) text.insert(END, ''.join(result)) canv.create_text(20, 20, text=text.get("0.0", END), anchor=W, width...

首先要写上这一句:

from numpy import *

(写上这句的前提也得你已经安了numpy)

(1) 定义一个零向量(4维):

>>>a=zeros(4)

>>>a

array([0.,0.,0.,0.])

定义一个List:

b=[1,2,3,4]

(2)向量可直接与List相加:

>>>c=a+b

>>>c

array([1.,2.,3.,4.])

(3)要给向量里每个元素都乘以同一个数:

>>>d=b*[3]

或者:

>>>c=3

>>>d=b*[c]

>>>d

array([3.,6.,9.,12.])

而不能是d=b*3,即要乘的这个数字得是个List形式

(4)两个向量相除(对应元素相除):

>>>e=[3,2,3,4]

>>>f=d/e

>>>f

array([1.,3.,3.,3.])