3分钟了解用户行为分析 用户行为数据分析案例( 二 )


2.3.2缺失值清洗:确定缺失值范围 , 去除不需要字段 , 填充缺失内容
2.3.3格式内容清洗:根据元数据格式和后续分析需要的格式对数据进行处理
timestamps字段是时间戳字符类型 , 而后面要做存留分析和用户活跃时间段需要用到时间戳中的日期字段和时间字段 , 在这里需要提前分下列 。
2.3.4逻辑错误清洗去除重复值 , 异常值
——去除重复值:并把用户ID,商品ID , 时间戳设置为主键
——异常值处理:查询并删除2017年11月25日至2017年12月3日之外的数据
剔除不在本次分析范围的数据
查询并删除小于2017-11-25的
——验证数据:
2.4描述分析:2.4.1这个数据集中用户的日活跃和周活跃时间有什么规律吗?——分析思路:
从“时间戳“字段中抽取出“日期”和“小时”的数据 , 创建一个“活跃时间”字段 , 并从“行为类型”中用分组方式把用户的“浏览”“收藏”“加购物车”“购买”行为抽离出来 , 组成一个视图表 , 导出到Excel中用透视表分析用户的日活跃规律和周活跃规律 。
——SQL提数:
增加活跃时间字段
查询用户 活跃时间分布 , 并创建视图
——Excel可视化:
活跃曲线整体为上升状态 , 同为周六日 , 12月2号 , 3号相比11月25日 , 26日活跃度更高 。
是否是用户增长带来的?
用户在周六周日相比其他时间更活跃(周六周日为休息日 , 用户有更多时间)
一天内用户活跃的最高峰期为21点(用户在这个时间段空闲较多)
正常工作职场工作者的睡前时间 , 996的应该也下班啦~
2.4.2在当日活跃的用户次日 , 三日 , 四日……还有多少活跃?——分析思路:
用户存留的分析可以分为“新用户存留”和“活跃用户存留”
新用户存留一般指:新注册用户在一定时间周期内还会不会再登录
活跃用户存留需要根据产品类型和用户场景选择“关键行为”和选择“时间周期”
-关键行为:淘宝作为购物网站 , 用户浏览 , 收藏 , 加购 , 购买商品与交易行为高度相关都可作为关键行为 。
-时间周期:淘宝拥有海量的SKU , 基本可以满足用户各方面的需求 , 理论上用户每天都有购买需求 , 时间周期可以按天 。
SO , 实际上这个问题就是在求 , 数据集第一日在APP有关键行为的用户在第二天 , 第三天……还会继续在APP中有关键行为的用户占比
我们需要先列出每用户每天及当天后面又活跃的日期 , 用于后面求次日存留 , 三日存留……
之后按日期对用户进行分组 , 并抽取之后9天依然活跃的用户数量
最后用活跃用户表中后续活跃用户除首日活跃数量乘100加%号
——SQL提数:
列出每用户每天及当天后面又活跃的日期 , 并创建“活跃时间间隔表”用于后面求次日存留 , 三日存留……
对“活跃时间间隔表视图”引用进行分组统计 , 计算每日存留人数并创建视图
对存留人数表进行计算 , 统计活跃用户留存率
——Excel可视化:
用户增长:从2017年11月15日致2017年12月3日 , 活跃用户新增38%存留增长:从2017年11月15日致2017年12月3日 , 活跃用户次日留存增长18.67% , 当日的活跃用户留存也在快速增长 , 第七日留存比次日留存高18.56% 。假设随时间增长的留存率提升来源于新dau提升策略的优化 , 后续存留的提升来源于召回策略的优化 。


以上关于本文的内容,仅作参考!温馨提示:如遇健康、疾病相关的问题,请您及时就医或请专业人士给予相关指导!

「四川龙网」www.sichuanlong.com小编还为您精选了以下内容,希望对您有所帮助: