本文共 633 字,大约阅读时间需要 2 分钟。
场景: 互联网软件跟踪收集用户的操作行为,从而对软件进行更加合理和人性化的修改和设计,例如chrome浏览器中用户最常用的按钮是哪些,浏览器中的按钮位置该如何排放?这些都需要收集用户的操作行为进行统计分析,最后确定浏览器的按钮如何排放,如何更加方便用户,让用户感觉很亲近,这点很重要哦^_^,用户很可能因为你的浏览器的某个功能很方便才会长久的使用下去(至少我是这样的) 既然需要收集用户的操作行为等信息,那这个的数据量是巨大的,每个用户打开浏览器可能操作上百次甚至上千次,再加上数以万计的用户操作,数据量可想而知。 对于这个大量数据插入,并且需要进行数据分析的场景,我认为这正是hbase的长处 下面做个简单的表设计 设计两张表: 1) monitor_item 行键 : monitor_id 列族:info: 列: name(值为监控项名称) 2)opreation_log: 行键 : monitor_id 列族:user: 列: ip (用户的访问ip,以竖线分隔) 列: version(用户使用的版本,以竖线分隔) 分析过程: 1.在monitor_item表中添加需要监控的列表 2.将浏览器返回的信息插入到操作记录中 3.根据行键monitor_id查询获得用户的操作ip,然后进行去重操作,即可统计各个按钮的使用数量 4.根据行键monitor_id查询获得用户的操作ip和version,根据ip进行去重操作,即可统计用户中软件各个版本的使用情况 |
转载地址:http://bqfmi.baihongyu.com/