python倒排索引（Inverted index）

2023-02-18 23:50:02Python0151

python倒排索引（Inverted index）,第1张

s = raw_input()

lines = s.split('\n')

dictlines = lines[:100]

mydict = {}

# read

for i,line in enumerate(dictlines ):

for word in line.split():

mydict.setdefault(word,[]).append(i + 1)

# print indices

for word in mydict.keys():

print "%s: %s" % (word,", ".join(map(str,sorted(mydict[word]))))

def andSearch(words_list):

global mydict

a = set(range(1,101))

for word in words_list:

a = a.intersection(set(mydict[word]))

return a

def orSearch(words_list):

global mydict

a = set([])

for word in words_list:

a = a.union(set(mydict[word]))

return a

# Query

index = 100

u = lines[index]

while index < len(lines):

words_list = u.split()

if ":" in u:

if words_list[0] == "OR:":

a = orSearch(words_list)

else:

if words_list[0] == 'AND:':

words_list = words_list[1:]

a = andSearch(words_list)

if not a:

print ", ".join(map(str,list(a)))

else:

print "None"

index += 1

大致思想就是这样。。。。。。。。

倒置字符串 将一句话的单词进行倒置，标点不倒置。比如 I like beijing. 经过函数后变为：beijing. like I

解题思路：

先将字符串整体逆置，然后再逆置以空格分隔的单词，这样就可以达到我们想要的效果。

例如：

输入：I like beijing.

输出：beijing. like I

因为Python默认是以ASCII作为编码方式的，如果在自己的Python源码中（即使是注释部分）包含了中文（或者其他非英语系的语言），此时即使你把自己编写的Python源文件以UTF-8格式保存了，但实际上，这依然是不行的。

解决方法：源代码文件第一行添加：#coding:utf-8，这样就可以避免了，也可以改为，在第一行增加：#-- coding: UTF-8 --

编写程序以字符串为单位，以空格或标点符号（字符串中仅含英文逗号','或小数点'.'作为标点符号）作为分隔符，对字符串中所有单词进行倒排，然后把已处理的字符串（应不含标点符号）打印出来。

Python语言是一款对缩进非常敏感的语言，给很多初学者带来了困惑，即便是很有经验的Python程序员，也可能陷入陷阱当中。最常见的情况是tab和空格的混用会导致错误，或者缩进不对，而这是用肉眼无法分别的。

在编译时会出现这样的错IndentationError:expected an indented block说明此处需要缩进，你只要在出现错误的那一行，按空格或Tab（但不能混用）键缩进就行。

往往有的人会疑问：我根本就没缩进怎么还是错，不对，该缩进的地方就要缩进，不缩进反而会出错。

字符串空格标点符号单词就可

# 上一篇：电脑关了文件没保存怎么办

# 下一篇：网页怎么调用CSS预加载

给您推荐相同类型的内容：

电脑里的系统备份文件怎样查找
查找电脑里的系统备份文件的具体操作步骤如下：1、在此以windows7系统为例，首先在电脑上点击“开始”按钮图标，接着在此弹出来的对话框内点击右侧的“控制面板”。2、接着在此打开的页面内点击下方的“备份和还原”功能选项。3、接着在此页面内
网页怎么调用CSS预加载
初始化时动态加载隐藏。 jquery ： $(function(){$("#id").show()显示$("#id").hide()隐藏})js ： function init(){documen
html怎么制作可修改的文字框
html制作可修改的文字框如下：1、首先在电脑桌面上，新建并打开一个记事本文件。2、这里要用到标签，这个标签包含了表单的一些元素，这里要用到元素。3、其中红框内type="text"意思是文本框，其中的text可以换成其
计算机应用软件都包括什么
1文字处理软件（用于输入、存贮、修改、编辑、打印文字材料等，例如WORD、WPS等。）2信息管理软件（用于输入、存贮、修改、检索各种信息。简称MIS。）3辅助设计软件（用于高效地绘制、修改工程图纸，进行设计中的常规计算等。）应用软件是
怎么挑选家用电脑怎样挑选电脑
1、CPU作为电脑的核心，购买时最好选择新一代的CPU。 2、内存可以根据工作、学习、游戏的不同挑选不同大小和频率的内存，主要有4G、8G和16G。 3、显卡是电脑中十分重要的一部分。主流显卡有AMD和英伟达。购买时，显卡型号前几位
python的源码值得去读吗
python的源码值得去读！1.无论是有没有其他语言的经验，入门Python都很简单。Python拥有简单直观的语法，方便的语法糖，以及丰富的第三方库。只要一个基础的Python教程，大家基本上都能无障碍的入门。2.在入门之后，很多人对于进
如何看笔记本光驱厚度
这个不同品牌的规格是不一样的。举个例子，联想吧，lenovo笔记本常见光驱种类有两种，厚度分别是12.7mm和9.5mm。大多数lenovo笔记本的光驱厚度为12.7mm。ideapady650；ideapadu330；昭阳k33使用的的9
电脑系统坏了的原因
生活中我们对电脑很熟悉，息息相关，那要是电脑出现了问题是什么原因呢，以下是我为你整理的资料，希望能帮到你。电脑系统坏了的原因：1、系统文件损坏，不能进入操作系统。 2、系统中了病毒，杀毒软件不能处理。 3、系统出现各
电脑怎么更新系统
电脑如何更新系统，下面分步骤介绍：工具：thinkpadt430、window10专业版、intel corei71、在电脑左下方打开window设置页面。2、在window设置中选择【更新和安全】。3、在【更新和安全】中选择【Wind
电脑已经连接打印机了怎样添加扫描功能?
1、点击开始按钮，然后在开始菜单中选择点击“设备和打印机”；2、在弹出来的界面中，点击窗口上方的“添加设备”项；3、然后选择你需要添加的打印机，如果添加失败的话，就会弹出下面的情况，之后点击窗口中的“控制面板-管理工具”项；4、然后选择服务
电脑开启了游客模式怎么退出
首先打开设置，找到“安全”进入之后界面如下，点击“隐私保护”接着点“开始使用”输入你手机之前设置的密码（这里的密码不是访客密码，是你自己的密码），由于我使用的数字密码，所以访客模式也是数字密码，同理，如果使用是图案解锁，访客模式也是图案解锁
css文字换行
用CSS让文字在一行内显示不换行的方法：一般的文字截断(适用于内联与块)：.text-overflow{display:block *内联对象需加*width:31emword-break:keep-a
目前所使用的计算机是什么计算机
电子数字计算机。目前所使用的计算机是电子数字计算机。计算机俗称电脑，是现代一种用于高速计算的电子计算机器，可以进行数值计算，又可以进行逻辑计算，还具有存储记忆功能。电脑，是计算机的俗称。……日常生活中我们所说的电脑，专指微型计算机，也叫PC
java怎么解析xml文件？
String xml="&ltxml&gt&ltToUserName&gt&lt![CDATA[toUser]]&gt&ltToUserName&gt"+
怎么恢复桌面上我的电脑图标
恢复桌面上我的电脑图标的方法如下：电脑：联想X666Plus版本：win10 专业版设置：个性化1、找到个性化一般最直接的方式就是在电脑屏幕空白的地方右击，显示设置下面就是个性化。稍微懂点电脑的人还可以直接点击左下角的开始，从系统
JS开发中基本数据类型有哪些
数据类型听我来慢慢跟你说，根据Ecmascript规范规定5种简单数据类型：Undefined, Null, Boolean, Number, String. 1种复杂数据类型：Object。其中5种简单数据类型又称为基本数据类型，复杂数
html怎么打印
需要准备的材料分别有：电脑、chrome浏览器、打印机。1、首先，打开想要打印的html网页，例如：zhidao.baidu.com。2、在网页中，鼠标右键空白处，点击打印按钮。3、此时会弹出打印面板，点击“打印”按钮即可完成打印。如何实
怎么用手机进电脑版网页啊？
手机上进入电脑版网页方法：操作工具：安装手机，QQ浏览器。第一步：在手机上下载，QQ浏览器、或其他浏览器安装，下面以QQ浏览器为例讲解（如图所示）。第二步：安装完成以后打开浏览器，点击下方的菜单栏进入（如图所示）。第三步：进入菜单栏以后点击
电脑键盘怎么拆卸
分类:电脑网络 &gt&gt硬件解析:键盘的清洁维护键盘是最常用的输入设备之一，即使一个键失灵，用起来也很不方便。由于键盘是一种机电设备，使用频繁，加之键盘底座和各按键之间有较大的间隙，灰尘容易侵
如何调试显卡?
怎么打开显卡设置建议：1.重新安装新版本显卡驱动~~2.在开始运行输入dxdiag揣看显卡信息，看是否正确安装驱动或修改相关设置~怎么调试显卡？桌面属性-〉属性-〉设置-〉高级那里也可以调试显卡，如果你装了驱动
苹果手机怎么与电脑同步？按照以下步骤操作吧
1、如果家里有wifi，直接按手机里的设置里的通用里的无线同步itunes，这时电脑要打开itunes2、如果想同步快一点，或者没wifi，就把手机通过数据线连上电脑，打开itunes，按手机那个图标再点右下角的同步就可以了（有时候会显
推荐8款HTML5相关的特殊效果看看都能够实现哪些功能
HTML5是HTML的升级版，HTML5有两大特点：首先，强化了 Web 网页的表现性能。其次，追加了本地数据库等 Web 应用的功能。广义论及HTML5时，实际指的是包括HTML、CSS和JavaScript在内的一套技术组合。今天我们推
请问电脑都有什么组成
电脑的组成包括软件和硬件，软件包括操作系统、应用软件等，是一系列按照特定顺序组织的计算机数据和指令的集合，而硬件包括电源、硬盘、磁盘、内存、主板、CPU等。 CPU：中央处理器单元，在PC机中的作用可以说相当于大脑在人体中的作用。所有的电脑
傅里叶复指数形式为什么Cn的实频谱是偶对称虚频谱是奇对称？
将指数形式用欧拉公式展开，也就是变成cos(wt)-jsin(wt)，带入原式，因为f(t)是实函数，所以不受影响，式子就分成了实部和虚部，注意，频谱的实部和虚部的自变量是w，显然，带有cos(wt)的实部积分项为偶函数，带有sin(wt)
硬盘空间怎么看
问题一：怎么看电脑硬盘还有多少空间？可通过如下方式进行查看：使用硬盘检测工具进行检测，具体使用需参考具体硬盘检测软件而言（这里不做详解，只叙述通过电脑本身工具进行查看方式）；打开我的电脑，看硬盘界面下的分区盘符，可看到每
HTML语言主要由于电子商务系统里的哪个层次(
HTML语言主要由于电子商务系统里的支柱。HTML即超文本标记语言，是WWW的描述语言。html是在sgml定义下的一个描述性语言，或可说html是sgml的一个应用程式，html不是程式语言，它只是标示语言。1，HTML是用来制作网页的标
CSS里为什么我给一个DIV加上浮动以后，下面的DIV就把它覆盖了？？？？
如果3个div上下排列，第三个div加上float:right的话，第三个div只是浮动到页面右面，不到到任何div下面。你浮动的是div，自然里面的文字不会浮动了。想要控制div里文字的话可以用属性text-align，具体步骤如下：1
分路器的网线怎么连接无线路由器是连接台式电脑
我想问下您是不是想在路由器下面再接分线器？如果是这样的话，您只需要找个网线直接把分线器和路由器的1.2.3.4中任意一口相连即可。但是您必须把克隆MAC这个步骤去掉，如果您设置上了，那您上网就容易出现问题了，路由器和分线器就不知道到底谁的等
CSS中3d导航为啥要加过渡效果
过渡效果是在鼠标指针浮到元素上时发生的效果。CSS过渡是元素从一种样式逐渐改变为另一种的效果，这边要注意的是，想要实现这一点，必须规定两项内容，规定您希望把效果添加到哪个CSS属性上规定效果的时长，规定您希望把效果添加到哪个CSS属性上，规
自己组装一台配置中上的台式电脑都需要哪些组件？？
自己组装台式机的基本硬件配置：1、cpu（处理器包括风扇）；2、主板（一般包括网卡、声卡等板载设备）；3、显卡（部分可集成于主板）；4、内存；5、硬盘；6、机箱及键盘鼠标；7、显示器；8、其他不是必需设备：（包括音箱、耳机、

推荐阅读

热门文章

最新发布

标签列表

python倒排索引（Inverted index）

给您推荐相同类型的内容：