python倒排索引（Inverted index）

2023-02-15 14:49:02Python019

python倒排索引（Inverted index）,第1张

s = raw_input()

lines = s.split('\n')

dictlines = lines[:100]

mydict = {}

# read

for i,line in enumerate(dictlines ):

for word in line.split():

mydict.setdefault(word,[]).append(i + 1)

# print indices

for word in mydict.keys():

print "%s: %s" % (word,", ".join(map(str,sorted(mydict[word]))))

def andSearch(words_list):

global mydict

a = set(range(1,101))

for word in words_list:

a = a.intersection(set(mydict[word]))

return a

def orSearch(words_list):

global mydict

a = set([])

for word in words_list:

a = a.union(set(mydict[word]))

return a

# Query

index = 100

u = lines[index]

while index < len(lines):

words_list = u.split()

if ":" in u:

if words_list[0] == "OR:":

a = orSearch(words_list)

else:

if words_list[0] == 'AND:':

words_list = words_list[1:]

a = andSearch(words_list)

if not a:

print ", ".join(map(str,list(a)))

else:

print "None"

index += 1

大致思想就是这样。。。。。。。。

cdays-3-test.txt 内容:

1 key1

2 key2

3 key1

7 key3

8 key2

10 key1

14 key2

19 key4

20 key1

30 key3

读取某一简单索引文件cdays-3-test.txt，其每行格式为文档序号 关键词，现需根据这些信息转化为倒排索引，即统计关键词在哪些文档中，格式如下：包含该关键词的文档数关键词 =>文档序号。其中，原索引文件作为命令行参数传入主程序，并设计一个collect函式统计 "关键字<－>序号" 结果对，最后在主程序中输出结果至屏幕。

索引关键词文档序号主程序

# 上一篇：共享单车数据可视化分析（PythonSeaborn）

# 下一篇：用python怎么读取mat文件的三维矩阵

给您推荐相同类型的内容：

python飞机大战如何使用全屏炸弹
1、首先打开电脑，在电脑上找到python飞机大战，并打开。2、其次打开游戏以后在其主页面找到道具，并点击进入。3、最后在道具界面找到全屏炸弹点击使用即可。春节这些天，闲赋在家，甚是无聊，便萌发了研究经典小游戏：飞机大战的念头，想
python 取得当前用户的Home目录
有三种获取home路径的方式 home_path = os.environ['HOME'] home_path = os.path.expandvars('$HOME') home_pat
Python2 与 Python3 的 map 函数
Python2 的 map 函数将函数 func 应用到一个序列的每个元素，或者多个序列的相同索引位置对应的元素，最终返回一个 list。 Python3 的 map 函数与 Python2 功能一致，最后返回的是一个 map 对象。可
用python怎么读取mat文件的三维矩阵
如图, C是一个三维矩阵, 可以用python的scipy包读取C, 并转换为三维数组的形式# coding=utf-8import scipy.io as sioimport numpy as npdata = sio.loadmat
pythonjson字典怎么导出
JSON(JavaScript Object Notation, JS 对象简谱) 是一种轻量级的数据交换格式。它基于ECMAScript (欧洲计算机协会制定的js规范)的一个子集，采用完全独立于编程语言的文本格式来存储和表示数据。JSO
python月薪多少？
现在，一线Python工程师的薪资已经超过20000元，如果你想学一门编程语言，那Python绝对是你的首选！Python岗位需求量10万从职友集最新Python招聘岗位需求来看，Python工程师的岗位需求量巨大，并且岗位需求量还在呈现上
树莓派开机自启python gui程序
如果希望在树莓派开机进入界面后，自动开始一个python的gui程序，按照如下方法，以my_program.py文件为例： 1.给文件设置运行权限 chmod +x my_program.py 2.在这个.py文件最开始，加上p
哪里能找到Python视频教程地址？
【033】Python（喵喵教程）百度网盘免费资源在线学习链接: https:pan.baidu.coms1ZS20DsOp-_70wVD9NNxGow提取码: 1ek8 【033】Python（喵喵教程）量化金融项目
Python中的锁都具有哪些？
大致罗列一下：一、全局解释器锁（GIL）1、什么是全局解释器锁每个CPU在同一时间只能执行一个线程，那么其他的线程就必须等待该线程的全局解释器，使用权消失后才能使用全局解释器，即使多个线程直接不会相互影响在同一个进程下也只有一个线程使用cp
python3 uiautomator2 (二) 、操作app
1、连接手机 2、启动 python -m weditor 3、以抖音为例，手机打开抖音 4、current: 获取当前包名和activity 控制台输入： uiautomator2 current 5、通过包名打开抖音
怎么用python中cv2模块的imwrite截取不规则四边形的图片。
.计算要裁剪区域四边形的相对水平方向的旋转角度；2.将原图旋转该角度，以使得要裁剪的区域旋转到水平方向；3.将要裁剪区域的坐标做相应的转换，转换为旋转后的坐标；4.对该区域进行裁剪。# -*- coding:utf-8 -*- import
深圳Python培训班哪家好
市面上的深圳Python培训学校排名很多，但是具体哪一家培训机构好，需要从多方面进行对比，首先是课程，要对比课程设置、上课形式和培训效果等；其次是师资；尽量选择经验丰富、行业认可、踏踏实实传授知识的老师。第三是教学，一定要为学员提供真实的实
Python中双冒号作用
Python sequence slice addresses can be written as a[start:end:step] and any of start, stop or end can be dropped .
python输出字母螺旋
用Python绘制螺旋文字在前面的文章中小编使用Python已经绘制了较多的螺旋式的图案了，那么我们可以使用python将文字也用螺旋的方式绘制出来吗？答案是肯定的！下面小编来给大家介绍如何使用python绘制螺旋式的文字。11导入turt
python怎么把汉字变成字符号
python怎么把汉字变成字符号：在python中可以使用转义字符输出汉字方法如下：首先会返回一串十进制数，这是目标在python里的序数。再用hex() 将十进制的序数转换为八进制的。输出时，用转义字符'u+八进制的序号&
如何在python中添加自定义模块
通过文件进行设置在Python的安装目录下，找到 Libsite-packages 文件夹，在该文件夹下新建一个以.pth为后缀名的文件，编辑文件，内容为要添加的库路径。（我的文件名命名为..pth）。添加路径示例：文件内容写入要引用
python 如何换行
1、首先运行终端或者cmd命令行（windows下）。执行python3.5的命令。2、然后输入如下图所示的内容。3、这种换行方法也可以在编辑器中进行，这里以vim为例，输入与上图类似的代码，保存为t.py脚本文件。4、在bash中执行如下
python使用br打包发布apk
如下；py如果没有Qt \ bin,您可以复制本文件Qt网站。如果找不到现有PyQt5插件目录的错误出现在包装过程中,然后,1)找到PyQt5文件夹图书馆插件路径下蟒蛇目录下安装,并复制内容2)按照下面的错误报告一个句子,例如,如
Python实现的快速排序算法详解
Python实现的快速排序算法详解本文实例讲述了Python实现的快速排序算法。分享给大家供大家参考，具体如下：快速排序基本思想是：通过一趟排序将要排序的数据分割成独立的两部分，其中一部分的所有数据都比另外一部分的所有数据都要小，然后再按此
Python 有哪些优雅的代码实现
列表切割list[start:end:step]如果从列表开头开始切割，那么忽略 start 位的 0，例如list[:4]如果一直切到列表尾部，则忽略 end 位的 0，例如list[3:]切割列表时，即便 start 或者 end 索引
python项目中包含多个文件&全局内容&函数定义时，语句的执行顺序
假如有一个py文件如下另一个py文件如下他们的执行顺序是这样的：并且！ config.py 里面的全局变量 parser 是一直存在的！可以被 get_config() 调用的！当你创建完.py文件后，而且输入代
python中判断变量是否存在
方法一：使用try: ... except NameError: ...。方法二：内置函数。 res1 = 'test' in locals ().keys() res2 = &#
python里每一行语句后面需要用分号来结束吗
在C、Java等语言的语法中规定，必须以分号作为语句结束的标识。Python也支持分号，同样用于一条语句的结束标识。但在Python中分号的作用已经不像C、Java中那么重要了，Python中的分号可以省略，主要通过换行来识别语句的结束。p
深圳Python培训班哪家好
市面上的深圳Python培训学校排名很多，但是具体哪一家培训机构好，需要从多方面进行对比，首先是课程，要对比课程设置、上课形式和培训效果等；其次是师资；尽量选择经验丰富、行业认可、踏踏实实传授知识的老师。第三是教学，一定要为学员提供真实的实
python的访问器方法有哪些
使用方法：class A(object):def foo(self,x):#类实例方法print "executing foo(%s,%s)"%(self,x) @classmethoddef cla
python日期加减比较问题请教
# time模块实现, 也是自带的# 字符串不好计算~但是时间戳是固定的呀...# 计算结果中, 假定今天24日, 输入24, 输出0天, 输入25, 输出-1天import timedef f(tm): stamp = time.m
八款常用的 Python GUI 开发框架推荐
作为Python开发者，你迟早都会用到图形用户界面来开发应用。本文将推荐一些 Python GUI 框架，希望对大家有所帮助。 Python 的 UI 开发工具包 Kivyhttps:www.oschina.
Python 入门书籍有哪些推荐？
1、Python基础教程：是经典的Python入门教程书籍，本书层次鲜明，结构严谨。这本书既适合初学者夯实基础，又能帮助Python程序员提升技能，即使是Python方面的技术专家，也能从书里找到实用性极强的内容。2、Python数据分析
Python模块的几种类型简介
1、系统内置模块os模块：os模块包含普遍的操作系统功能sys模块：提供了一系列有关Python运行环境的变量和函数random模块：random模块用于生成随机数time 模块: 主要包含各种提供日期、时间功能的类和函数date
python有小数就进一
lista=[12.85,12.98,25.78,45]#构建列表listb=[]#小数取整加一后的列表'''(Tab)处缩进代码'''for j in lista:#遍历list

推荐阅读

热门文章

最新发布

标签列表

python倒排索引（Inverted index）

给您推荐相同类型的内容：