作者以前开发设计采集器参考了 Google 的那套设计思路。这套设计方式基本都能满足分析需求,如果要区分用户和用户行为,采集的数据模型需要开发跟数据同学约定好。
本篇讲解的采集器,需求来源于用户行为分析平台,数据模型是固定的,设计思路会有些不同。
说明
数据采集后,数据分析(机器学习)专家一般会对数据进行筛选、降维、建模。这个过程中数据筛选是花费最多的环节,所以在采集数据的环节,我们有必要定义好一定的数据规则(模型),在数据源头上,让采集器做更多的工作,减少数据筛选的工作量。这里扩展一下,当前工业上比较流行的机器学习库 TensorFlow 出了个 JS 版本,官方针对微信小程序开发了一套小程序插件 tfjs-wechat ,大家可以尝试一下,说不定可以让采集器智能化。
对于采集分析用户行为的数据,我们先从采集器使用的数据模型开始讲起。
当前数据分析平台的数据模型由两块组成:用户属性和用户事件。
用户属性
用户属性指的是:用户 id、年龄、姓名、性别、所在的地区、首次注册时间、vip 等。
用户事件
用户事件指的是:用户在小程序上做了什么操作,比如点击了购买按钮这个行为事件,访问了某个页面。
模型:
内置事件
内置事件指的是采集器自动处理上报的事件,分为两类。
自定义事件
自定义事件指的是用户自己设置的事件,通过调用采集器的 API 上报事件。比如:上报一个点击购买按钮的用户行为事件, sdk.track ("buy", {price: '¥10'}) , 其中事件名是 "buy",事件属性是 "price"。
用户内置属性
用户内置属性指的是平台内置的用户属性字段,通过调用采集器封装好的 API,传入属性值上报。比如:realName(姓名)、age(年龄)、city(城市)、country(国家)、$gender(性别)等。
用户自定义属性
用户自定义属性指的是用户自定义的用户属性字段, 通过调用采集器的 API,传入属性字段以及值。
先上模块关系图:
很多方式 比如用cookiees\检索记录\统计代码\最简单的就是用统计代码了 比如cnzz 量子恒道的
只要在网页插入js代码 就可以记录下用户访问的url 逗留时间 从而分析出用户的关注点
目前大部分采用代码埋点方案,在需要数据采集的地方抓取数据,然后上传。首先要清楚埋点的实际需求是什么?对于一个产品来讲埋点无非就是想了解用户的使用习惯和产品的使用情况,从而从客户和产品的角度去了解客户群体,及其对产品的一些使用想法。
可以选用第三方的数据统计系统,但有时候我们也会遇到数据是有了,但是当要把原始数据做导出分析时又遇到问题。自己产品的数据却不能被我们自己拥有。
所以更建议你选择自行搭建私有化部署的,比如开源私有化部署的用户行为分析系统Cobub Razor,www.cobub.com , Github地址:https://github.com/cobub/razor
希望可以帮到你~