R语言游戏数据分析与挖掘：为什么要对游戏进行分析

2023-02-19 02:34:02Python021

R语言游戏数据分析与挖掘：为什么要对游戏进行分析,第1张

本书从实际应用出发，结合实例及应用场景，通过对大量案例进行详细阐述和深入分析，进而指导读者在实际工作中通过R语言对游戏数据进行分析和挖掘。这是一本关于数据分析实战的书籍，里面的知识、方法、理论是可以直接应用到整个互联网的。

全书一共13章，分为三篇：基础篇、实战篇和提高篇。

第一篇是基础篇（第1~4章）： 介绍了游戏数据分析的基本理论知识、R语言的安装与使用、R语言中的数据结构、常用操作和绘图功能。

第1章主要介绍了游戏数据分析的必要性和流程；第2章讲解了R语言和RStudio的安装及使用方法，并对数据对象和数据导入进行了介绍；第3章介绍了R语言绘图基础，包括常用图形参数设置、低级绘图函数和高级绘图函数；第4章介绍了lattice和ggplot2绘图包，并详细介绍了一些基于R语言可用于生成交互式图形的软件包，包括rCharts、recharts、rbokeh、plotly等。

第二篇是实战篇（第5~11章）： 主要介绍了游戏数据的预处理、常用分析方法、玩家路径分析和用户分析。

第5章介绍了游戏数据预处理常用的手段，包括数据抽样、数据清洗、数据转换和数据哑变量处理；第6章介绍了游戏数据分析的常用方法，包括指标数据可视化、游戏数据趋势分析、游戏数据相关性分析和游戏数据中的降维技术；第7章介绍了事件点击行为常用的漏斗分析和路径分析；第8章介绍了留存指标的计算、留存率计算与预测、常用分类算法原理和模型评估；第9章介绍了常用用户指标计算、LTV计算与预测、用户物品购买关联分析、基于用户物品购买智能推荐和社会网络分析；第10章介绍了渠道数据分析的必要性和对渠道用户进行质量评级；第11章介绍了常用收入指标计算、利用用户活跃度衡量游戏经济状况、RFM模型研究。

第三篇是提高篇（第12~13章）： 介绍了R语言图形界面工具Rattle和Web开发框架shiny包。

第12章介绍了R语言的图形界面工具Rattle，该工具能够在图形化的界面上完成数据导入、数据探索、数据可视化、数据建模和模型评估整个数据挖掘流程；第13章介绍了Web开发框架shiny包，使得R的使用者不必太了解CSS、JS，只需要了解一些HTML的知识就可以快速完成Web开发。

关键词： 程序语言，程序设计

完整课程可前往UWA学堂《R语言游戏数据分析与挖掘》阅读。

https://edu.uwa4d.com/course-intro/0/383

随着游戏市场竞争的日趋激烈，在如何获得更大收益延长游戏周期的问题上，越来越多的手机游戏开发公司开始选择借助大数据，以便挖掘更多更细的用户群来进行精细化、个性化的运营。数据分析重要的不是提供历史和现状，而是通过分析发现手机游戏现状，以及对未来进行预测。一切以数据出发，用数据说话，让数据更好地指导运营服务好玩家，对玩家的行为和体验不断进行分析和调整，使玩家可以在虚拟世界中得到各方面的满足。要实现这个目的，需要搭建专业的数据化运营团队。此外，游戏数据分析与其他行业的数据分析不同的是，游戏综合了经济、广告、社交、心理等方面的内容，这就对数据分析师提出了更高的要求。

伴随着游戏互联网的快速发展和智能终端的普及，移动游戏进入了全民时代。越来越多的玩家利用碎片化时间进行游戏，使得游戏数据呈现井喷式增长，同时也对数据存储技术、计算能力、数据分析手段提出了更高的要求。海量数据的存储是必须面对的第一个挑战，随着分布式技术的逐渐成熟，越来越多的互联网企业采用分布式的服务器集群分布式存储的海量存储器进行数据的存储和计算，从而解决数据存储和计算能力不足的问题。如何在海量的、复杂高维的游戏数据中发掘出有价值的知识，将是很多公司下一步亟待解决的难题。

虽然积累了海量的玩家数据，很多公司也开发了自己的BI报表系统，但是多数停留在“看数据”阶段，还是用传统的数据分析方法对数据进行简单的加工、统计及展示，并没有进行深度挖掘发现数据背后的规律和把握未来趋势。正是在这样的大背景下，游戏数据分析逐渐在游戏行业中变得重要。公司需要从传统的粗放型运营进化到精细化运营，从而了解如何有效地获取用户、评估效果；如何激活用户、评估产品质量；如何提升收益，并挖掘潜在的高价值用户。要满足精细化运营的需求，数据化运营就应运而生了。数据化运营就是在以海量数据的存储、分析、挖掘和应用的核心技术支持的基础上，通过可量化、可细分、可预测等一系列精细化的方式来进行的。

数据化运营是飞速发展的数据存储技术、数据挖掘技术等诸多先进数据技术直接推动的结果。数据技术的飞速发展，使数据存储成本大大减低，同时提供了成熟的数据挖掘算法和工具让公司可以去尝试海量数据的分析、挖掘、提炼和应用。有了数据分析、数据挖掘的强有力支持，运营不再靠“拍脑袋”，可以真正做到运营过程自始至终都心中有数。比如，在玩家的细分推送中，数据分析师利用数据挖掘手段对玩家进行分群，运营根据不同的用户群制定差异化策略，数据分析师再根据推送效果进行评估。

完整课程可前往UWA学堂《R语言游戏数据分析与挖掘》阅读。

https://edu.uwa4d.com/course-intro/0/383

1、游戏数据分析师

2、游戏产品运营人员

3、产品数据挖掘

探索式分析，主要是运用一些分析方法从大量的数据中发现未知且有价值信息的过程。对于初步探索性分析而言，数据可视化是一个非常便捷、快速、有效的方法，你可以使用作图、制表等方法来发现数据的分布特征，然后可以使用一些统计分析方法更深入地发现数据背后的信息。常用的探索性分析方法包括RFM分析、聚类分析、因子分析、对应分析等。

应用背景：

在产品迭代过程中，通常需要根据用户的属性进行归类，也就是通过分析数据，对用户进行归类，以便于在推送及转化过程中获得更大的收益。

分析方法：

RFM分析（Recency，Frequency，Monetary）

分析工具：

SPSS（数据分析的重量级应用，与SAS二选一）

一.RFM基础知识

所谓探索性分析，主要是运用一些分析方法从大量的数据中发现未知且具有价值信息的过程。

常用的探索性分析方法包括：RFM分析、聚类分析、因子分析、对应分析等。

RFM的含义：

R（Recency）：客户最近一次交易时间的间隔。 R值越大，表示客户交易发生的日期越久，反之则表示客户交易发生的日期越近。

F（Frequency）：客户在最近一段时间内交易的次数。 F值越大，表示客户交易越频繁，反之则表示客户交易不够活跃。