比如文本表示最简单的方式是词袋法,把文本变成向量,每个词是向量的一个维度,所以中文需要分词,Python分词找jieba分词
文本表示向量以后,就可以开始对应你需要的任务,比如做分类聚类关联之类的事。比如垃圾邮件分类就是建模对文本内容判断真或假
不用读文献,有问题百度找博客就行了
# -*- coding: utf-8 -*-from tkinter import *result = []def get_text(event): result.append(event.char) text.delete('0.0', END) text.insert(END, ''.join(result)) canv.create_text(20, 20, text=text.get("0.0", END), anchor=W, width...首先要写上这一句:from numpy import *
(写上这句的前提也得你已经安了numpy)
(1) 定义一个零向量(4维):
>>>a=zeros(4)
>>>a
array([0.,0.,0.,0.])
定义一个List:
b=[1,2,3,4]
(2)向量可直接与List相加:
>>>c=a+b
>>>c
array([1.,2.,3.,4.])
(3)要给向量里每个元素都乘以同一个数:
>>>d=b*[3]
或者:
>>>c=3
>>>d=b*[c]
>>>d
array([3.,6.,9.,12.])
而不能是d=b*3,即要乘的这个数字得是个List形式
(4)两个向量相除(对应元素相除):
>>>e=[3,2,3,4]
>>>f=d/e
>>>f
array([1.,3.,3.,3.])