Python实现协同过滤推荐算法，用的大一些的数据集就报错MemoryError

2023-02-25 20:11:02Python028

Python实现协同过滤推荐算法，用的大一些的数据集就报错MemoryError,第1张

python虽然易用，但是内存占用比较多；所以如果你有C/C++/Java基础，考虑用这些语言来实现；

CF算法需要计算大量的相似度，如果能把中间结果存起来，或者简化计算过程（如，你可能会重复计算一个item的均值）可以省下不少内存；（个人试过计算1w个用户Pearson是没问题的）

如果内存实在不够用，那就用时间换空间，把中间计算结果分成小文件存到磁盘上，用的时候再读取。

供参考。

目前主要有三种度量用户间相似性的方法，分别是:余弦相似性、相关相似性以及修正的余弦相似性。①余弦相似性(Cosine)：用户一项目评分矩阵可以看作是n维空间上的向量，对于没有评分的项目将评分值设为0，余弦相似性度量方法是通过计算向量间的余弦夹角来度量用户间相似性的。设向量i和j分别表示用户i和用户j在n维空间上的评分，则用基于协同过滤的电子商务个性化推荐算法研究户i和用户j之间的相似性为:②修正的余弦相似性 (AdjustedCosine)：余弦相似度未考虑到用户评分尺度问题，如在评分区间[1一5]的情况下，对用户甲来说评分3以上就是自己喜欢的，而对于用户乙，评分4以上才是自己喜欢的。通过减去用户对项的平均评分，修正的余弦相似性度量方法改善了以上问题。用几表示用户i和用户j共同评分过的项集合，Ii和寿分别表示用户i和用户j评分过的项集合，则用户i和用户j之间的相似性为：③相关相似性(Correlation)此方法是采用皮尔森(Pearson)相关系数来进行度量。设Iij表示用户i和用户j共同评分过的项目集合，则用户i和用户j之间相似性为:

本文主要内容为基于用户偏好的相似性进行物品推荐，使用的数据集为 GroupLens Research 采集的一组从 20 世纪 90 年代末到 21 世纪初由 MovieLens 用户提供的电影评分数据。数据中包含了约 6000 名用户对约 4000 部电影的 100万条评分，五分制。数据包可以从网上下载到，里面包含了三个数据表——users、movies、ratings。因为本文的主题是基于用户偏好的，所以只使用 ratings 这一个文件。另两个文件里分别包含用户和电影的元信息。

用户相似性余弦评分度量

# 上一篇：利用Python如何将数据写到CSV文件中

# 下一篇：Go语言的开源项目

给您推荐相同类型的内容：

python日期获取秒数
1、使用new Date()获取当前日期，new Date().getTime()获取当前毫秒数2、计算公式，等于获取的当前日期减去或者加上一天的毫秒数。一天的毫秒数的计算公式：24小时*60分钟*60秒*1000毫秒，也是8640000
ruby 1.9.2 array to_json 中文乱码
没有遇到过类似情况，你试一下$kcode = utf8这几个字转化正确：轻: u8f7b身: u8eab药: u836f剂: u5242Rails的初始准备见：Rails 处理跨站请求准备完这个，接下来我们就只要管Control怎么写就行了
使用ruby操作excel删除一个sheet或者清空一个sheet的内容？
清空内容可以用clearcontent或clear的方法。建议查阅一下Excel的对象模型。个人没试过ruby，以下只是一个想法，希望对你有用。每个Excel文件至少有一个sheet页呢，你想删除的sheet页是不是唯一的sheet页呢？
3 D编程跟python的区别
是差不多python是编程语言的一种，通过该语言编写程序的过程就是编程。python程序的每条语句结尾不需要分号，而JAVA和C语言的语句结尾需要分号。python是靠缩进来划分语句块，而C语言和JAVA是靠大括号来划分语句块。python
三维坐标系下，python如何获取鼠标点击事件，返回三维坐标x,y,z？
Python有一个内置的库 matplotlib，它提供了图形界面（GUI）的功能，允许用户直接在图形上点击并获取鼠标位置。下面是一个简单的例子，展示了如何使用 matplotlib 库获取鼠标点击事件并返回三维坐标：Copy code#
C语言怎么合并两个字符串?
代码：char str1="123"char str2="abc"strcat(str1,str2)printf("%s",str1)例如：#include &
java怎么点用python脚本？
首先得声明一下，java是java，python是python,你用java得环境跑python这不是找麻烦吗，但是并不是说不行，java有一个Jpython得库，你可以下载一下，这方面原理设计jni技术，建议了解一下，如果单纯想运行一个脚
如何配置go语言开发环境
1.1 Go 安装Go的三种安装方式Go有多种安装方式，你可以选择自己喜欢的。这里我们介绍三种最常见的安装方式：Go源码安装：这是一种标准的软件安装方式。对于经常使用Unix类系统的用户，尤其对于开发者来说，从源码安装可以自己定制。Go标准
各位有没有经历过Python和Ruby的选择
1. ruby的case可以匹配很多东西：范围数组，对象，正则表达，python没有caseswitch而使用ifelse比较死板点2. python的缩进很漂亮，虽然有时会造成些许麻烦。ruby的end蛮难看的，所以大家都被逼当on
go中的struct
go和其他语言一样，可以申明新的“结构体”，struct可以作为其他类型的属性活字段的容器，定义方式如下：type 关键字申明person为struct 类型，person包含 name 属性和 age 属性，对应的类型
Python实现对列表中重复元素进行去重的方法小结
1、运用新建字典的方式，去除重复的键 2、利用集合，直接将列表转化为集合，自动去重后转回列表。有一个问题，转换为集合的同时，数据无序了。 3、用列表的推导式case1:用集合的特性set()，去重后顺序会改变 case1.1：可
c语言中rand()函数怎么用?
rand函数功能为获取一个伪随机数（伪随机数的概念下面会有介绍）。一、函数名：rand()二、声明：int rand()三、所在头文件：stdlib.h四、功能：返回一个伪随机数。之所以说是伪随机数，是因为在没有其它操作下，每次执
go 语言适合做哪些开发
应用于搭建 Web 服务器，存储集群或类似用途的巨型中央服务器的系统编程语言。Go 是谷歌的编程语言，而不是社区的。在这位博主看来，虽然 Go 语言拥有一个贡献者社区，但是它并不是社区的项目，只是谷歌的一个项目。所以只要是谷歌反对的东西，
Standard Deviation Ruby的产品特性有哪些？
产品特性：可在摄像机内完成灰度色标图像处理能通过以太网发送标记位置和尺寸能通过以太网对摄像机进行设置全部摄像机的外部及视频同步集成式红外LED照明可调电源和LED闪光灯可升级固件后焦点配置，能使用C安装规格镜头可在摄像机内完成灰度色标图像处
使用Ruby循环结构重写以下伪代码段？
k = (j + 13)27while k &lt= 10k = k + 1i = 3 * k - 1end上面的Ruby代码使用了while循环结构来重写伪代码段。 while循环执行重复操作直到指定的条件不再满足为止。在这
Go 语言copy()：切片复制（切片拷贝）
2021-10-29 内置函数copu() 作用：可以将一个数组切片复制到另一个数组切片中，如果加入的两个数组切片不一样大，就会按照其中较小的那个数组切片的元素个数进行复制。用法：情况一：将slice1中的前三个元素，复
lua效率如何
效率高。lua调用C函数，每秒可以调用10000000次，大概1ms调用1k次。lua是一种轻量小巧型的脚本语言，用C语言编写，它是在运行时动态编译，所以每次修改不需要重新编译链接执行。lua脚本性能如何1. 可扩展性。Lua的扩展性非常卓
可能这是你见过最全的红唇评测-PART 1外观
红应该是所有爱美人士的必备单品，即使你平时并不是很爱化妆，但也能从化妆包中翻出几支口红吧。不管是各大品牌推出的海报款，还是跟着剧集被大家追捧的明星款，每年都会出新的流行色，不过有一个颜色是绝对永远不会过时的，那就是正红色！好吧，其实对于怎么
如何在windows下安装GIT
本文在Windows7下测试成功。安装和设置Git下载Git for Windows，采用默认安装，安装完成后就可以在本地使用Git了。但要将内容放到Github上，必须先在Github网站上注册个账户，然后在本机使用Git创建SSH Ke
goland map底层原理
map 是Go语言中基础的数据结构，在日常的使用中经常被用到。但是它底层是如何实现的呢？总体来说golang的map是hashmap，是使用数组+链表的形式实现的，使用拉链法消除hash冲突。 golang的map由两种重要的结构
python怎么安装 python安装教程
1、首先，登录python下载网址，可以在该页面上看到两类下载链接，分别是Python 3.x和Python 2.x版本。因为 Python在同时维护着3.x和2.x两个版本，这样既可让早期项目继续使用Python 2.x，也可让新的项目使
GO语言（三十）：访问关系型数据库（上）
本教程介绍了使用 Godatabasesql及其标准库中的包访问关系数据库的基础知识。您将使用的databasesql包包括用于连接数据库、执行事务、取消正在进行的操作等的类型和函数。在本教程中，您将创建一个数据
如何配置go语言开发环境
1.1 Go 安装Go的三种安装方式Go有多种安装方式，你可以选择自己喜欢的。这里我们介绍三种最常见的安装方式：Go源码安装：这是一种标准的软件安装方式。对于经常使用Unix类系统的用户，尤其对于开发者来说，从源码安装可以自己定制。Go标准
(1小时学会C语言51单片机)C语言入门教程
51作为学习入门，确实是最最基础的了，不过至少它可以让一个新手明白控制是怎么回事，反馈是怎么回事，程序是怎么下载进去运行，又是怎么控制到io输入输出的，如何去访问寄存器，掌握一套在嵌入式领悟最最基本的开发方法和学习思路。这部分如果有兴趣，建
go语言如何调用c函数
直接嵌入c源代码到go代码里面package main*#include &ltstdio.h&gtvoid myhello(int i) {printf("Hello C: %dn", i)}*i
ruby ide的gem包如何安装
你就直接安装 Aptana RadRails ，然后安装ruby-debug-ide插件就行 Aptana RadRails 对 rails支持很好的。不然你用ruby-debug也行，用控制台debug还直观很好用 gem instal
判断变量user是否等于字符串user的语句是
首先举例写一个用户密码登入接口单引号是用来将_user变量为luwei字符串，也就是说_user等于字符串luwei如果不加单引号_user=luwei那这个就是变量的意思_user='luwei'_password=&
python生成随机数组
从已有数组中提取随机数组要求：从两个不同数组中随机抽取数组，用到函数np.random.choiceimport numpy as np hyper=[1,2,5,8,9,12,13,14,17,19] noh=[3,4,6,
F∪R乚A是什么牌子的包？
FURLA芙拉 (Furla)于1927年成立公司，家族创始人Mr.Furlanetto，早先经营皮革制品的配件。1980年， Furla品牌正式创立。Furla)集团的总产值已经突破8千万欧。温婉优雅的设计特质一直深受女士欢迎。其它精
C语言中，什么是变量和变量名
变量就是可以改变的意思，可以在程序运行时修改值。对应不能修改的常量。变量名其实是内存地址的常量指针。我们自己定义的变量名在编译过后就没有了，编译后的程序中，变量名就变成一个十六进制数的内存地址，变量值就存储在这里。c语言变量名规则是：1、

推荐阅读

热门文章

最新发布

标签列表

Python实现协同过滤推荐算法，用的大一些的数据集就报错MemoryError

给您推荐相同类型的内容：