一、数据集
阿里天池在2018年给予了一份 从2014-11-18 0:00 至2014-12-18 23:00 月度区域内淘宝客户端 用户个人行为 的数据——User Behavior Data on Taobao App。
User Behavior Data on Taobao App-数据集-阿里云天池该数据集含6列原素:
· user_id:用户的序号
· item_id:商品的序号
· behavior_type:用户个人行为种类,分成点一下,个人收藏,加上到加入购物车和支付,相对应的值各自为1,2,3和4。
· user_geohash:个人行为产生的地址(不全)
· item_category:商品的类型
· time:个人行为产生的時间
二、提问问题
依据这一份数据大家分析下列3个领域的问题:
分析用户在应用全过程中多见的电子商务分析指标值,明确每个环节的流动率;分析時间针对用户应用app状况的危害;找到极具市场价值的关键付钱用户群,对这一部分用户的行为表现开展分析。文中将选用AAARR漏斗模型和RFM模型对数据开展分析。
1.AARRR漏斗模型
AARRR漏斗模型相匹配了内容运营流程中的5个环节,即获得用户(Acquisition ),激话用户(Activation),提升存留(Retention),收益(Revenue )和强烈推荐(Refer)。这五个环节每一个环节都是会有一部分用户外流,用户总数展现桶状,因而被称作AARRR漏斗模型。创建AARRR漏斗模型分析这五个环节的指标值,有利于找到用户外流的缘故,加强商品的优势,提升用户存留。
2.RFM模型
RFM模型是考量顾客价值和顾客得盈工作能力的主要设备和方式。该工业模型根据一个顾客的最近选购个人行为(Recency)、选购的整体頻率(Frequency)及其花了要多少钱(Money)3项指标值来叙述该用户的使用价值情况。
三、数据清除
该数据集数据量大,因此文中运用MySql对数据集开展清除
1.挑选子集合:
运用isnull函数公式发觉 user_geohash(个人行为产生地址)有8334824条数据是空值,且没法对它进行添充,因此在此次分析中,将绕开user_geohash。
2.字段名重新命名
将原来字段名简单化为userid,item,behavior,category
ALTER TABLE tianchi_mobile_recommend_train_user CHANGE user_id userid VARCHAR(20);ALTER TABLE tianchi_mobile_recommend_train_user CHANGE item_id item VARCHAR(20);ALTER TABLE tianchi_mobile_recommend_train_user CHANGE behavior_type behavior VARCHAR(20);ALTER TABLE tianchi_mobile_recommend_train_user CHANGE item_category category VARCHAR(20);3.删除重复值
数据中,用户个人行为只精准到了钟头,并不可以判断在一个小时内产生的用户个人行为是不是真正,因此不做解决。
4.一致化处理
为了更好地便于后面的時间科学研究,将time拆分为多列,一列表示时间,一列表明日期。
ALTER TABLE tianchi_mobile_recommend_train_userADD column h VARCHAR(10) NULL;UPDATE tianchi_mobile_recommend_train_userset h=SUBSTRING_INDEX(time,' ',-1)time=SUBSTRING_INDEX(time,' ',1)四、搭建实体模型
1.构建AARRR实体模型
截止到2014年底,淘宝有着会员注册近5亿,日活跃性用户超1.2亿,线上产品总数超过10亿,在C2C销售市场,淘宝占95.1%的市场占有率。淘宝在手机端发展潜力迅速,据艾瑞咨询2014年最新发布的网上购物汇报数据,手机版淘宝 天猫商城的市场规模做到85.1%。
淘宝客户端顾客数量大,覆盖面积广,在中国乃至亚洲地区都是有普遍的用户基本。
用户应用淘宝网的一般步骤为:点一下——(个人收藏/加上到加入购物车)——支付。个人收藏和加上到加入购物车并不是必需个人行为,用户可以根据点一下后立即支付。
在2014.11.18-2014.12.18期内,一共有9969名用户,在其中有3本人沒有点一下个人行为,占总产量的0.335%,可以忽略。
SELECT COUNT(DISTINCT userid) AS UV,(SELECT COUNT(*) FROM tianchi_mobile_recommend_train_user WHERE behavior='1') AS PV,(SELECT COUNT(*) FROM tianchi_mobile_recommend_train_user WHERE behavior='1')/COUNT(DISTINCT userid) AS 'PV/UV'FROM tianchi_mobile_recommend_train_userAPP浏览用户数量(UV):9969
网页页面总浏览量(PV):1885533
跳失率=仅点一下一次的用户总数/ 总用户数量=0.0059
SELECT count(*)/(SELECT COUNT(DISTINCT userid) from tianchi_mobile_recommend_train_user) as 跳失率from (select useridfrom tianchi_mobile_recommend_train_userwhere behavior='1'group BY useridH ** ING COUNT(*)=1) as a在统计分析時间内,仅有0.59%的用户仅点一下一次就离开app,由此可见有着充分的诱惑力让用户滞留在APP中。
SELECT COUNT(DISTINCT userid) as 点一下用户,(SELECT COUNT(DISTINCT userid) from tianchi_mobile_recommend_train_userwhere behavior=2 or behavior=3) as 个人收藏或加上加入购物车用户,(SELECT COUNT(DISTINCT userid) from tianchi_mobile_recommend_train_userwhere behavior=4) as 支付用户from tianchi_mobile_recommend_train_userwhere behavior=1;付款总数占点一下总数的60.6%,转换率特别高,表明淘宝客户端在较大水平上可以达到顾客的要求,吸引住用户不断应用。
select behavior,COUNT(*)from tianchi_mobile_recommend_train_userGROUP BY behavior殊不知从次数看来,点一下频次是支付的97倍,是加上到加入购物车、个人收藏总数的20倍,用户点一下多次才会造成一次支付。
殊不知,从点一下频次到支付频次的转换仅有1.03%,顾客均值必须点一下50次才可以造成1次支付,表明顾客应用app的历程中,必须消耗很多的时间精力才可以寻找到适宜的商品,提议淘宝优化强烈推荐实体模型,为客人给予精确的产品推介。
2.不一样时域和频域下用户行为模式分析
1)30日内总体状况
将数据集按日梳理,观查30日内,用户点一下、个人收藏、加上到加入购物车、支付状况。
select time,sum(case when behavior=1 then 1 else 0 end ) as 浏览量,sum(case when behavior=2 then 1 else 0 end ) as 个人收藏数,sum(case when behavior=3 then 1 else 0 end ) as 加上到加入购物车,sum(case when behavior=4 then 1 else 0 end ) as 支付量from tianchi_mobile_recommend_train_userGROUP BY timeORDER BY timea “双十二”大中型营销活动对用户个人行为的危害
根据柱形图大家发觉,自12月10日至12月12日,“点一下”、“个人收藏”和“加上到加入购物车”频次急剧提升,可是“支付”总数却展现下降,在12月12日当日,全部数据与此同时提升。
联系实际得知,在2014年12月12日淘宝网举行了中大型的营销活动,当日选购享有特惠。再此以前用户根据“点一下”、“个人收藏”和“加上到加入购物车”三种方法找寻产品,直到在12日当日提到支付,以享有特惠。因而导致了10日、11日“点一下”、“个人收藏”和“加上到加入购物车”频次提升,可是“支付”频次却降低了的状况。
在双十二活动当日,极大的特惠吸引住了大量的用户登陆、应用app,导致“点一下”总数提升。
类似“满300减30”“满1000减30”等立减主题活动引诱用户将商品增加到加入购物车,找寻更实惠的支付方式,导致了“加上到加入购物车”个人行为的提升。
而“个人收藏”既不可能像“加上到加入购物车”一样,协助用户造就特惠,营销个人行为自身也不会吸引住顾客专业去“个人收藏”,因此“个人收藏”个人行为的增加发展趋势较别的三者较差。
b 淘宝客户端用户日常个人行为分析
总体看来,“点击量”和“加上到加入购物车频次”的数据行情基本一致,“点击量”提升,“加上到加入购物车频次”一样提升,且增长幅度类似。相较来说“个人收藏”尽管在发展趋势上与别的三种数据基本一致,可是主要表现比较轻缓。
为了更好地进一步科学研究“点一下”和“支付”数据行情,大家优化柱形图,加上礼拜信息内容。
在12月12日以前,“点一下”和“支付”总数行情是有周期性的。如下图中小圆圈标明的一部分,12.12以前,每一个星期五,“点一下”“支付”都是会有大幅的降低。这可能是由于,每星期周五是最后一个工作中日,大家在工作之余更想要别的休闲娱乐方法,而不是应用淘宝买东西。
而在周六和周日,大家空闲时间提升,淘宝客户端的“点一下”总数大幅提升,到下周一开始工作时,“点一下”总数一些较小幅度降低。
而“支付”频次在周五大幅降低,在周六、周日、周一或提升,或降低,并无显著规律性。
因而淘宝卖家若是要想广告投放、提升店面关注度,应绕开周五和周一,选在在周六周日举行活动。倘若想提升销售量,要绕开周五举行营销活动。
2)日用户个人行为分析
select time,h,sum(case when behavior=1 then 1 else 0 end ) as 浏览量,sum(case when behavior=2 then 1 else 0 end ) as 个人收藏数,sum(case when behavior=3 then 1 else 0 end ) as 加上到加入购物车,sum(case when behavior=4 then 1 else 0 end ) as 支付量from tianchi_mobile_recommend_train_userGROUP BY time,hORDER BY time,h选择不会受到“双十二”营销活动危害的11月24日-12月1日,以钟头为企业,进一步用户个人行为与时间段的关联。
淘宝客户端用户在每日不一样时间范围的手段十分规律性。为了更好地能进一步认清这类规律性,大家随后选择一日(11月26日)开展分析。
从0点逐渐,大家已经睡眠质量歇息,人气值不断降低,直到4点-5点降至最少,以后,大家相继醒来主题活动,逐渐平稳升高,直到早上10点。在10点至18点期内,“点一下”、“个人收藏”、“加上到加入购物车”“支付”频次等数据比较稳定。18点上下,恰逢大家晚饭时间,用户个人行为有一些较小幅度减少,18点以后,“点一下”、“个人收藏”、“加上到加入购物车”频次大幅、不断提升,直到22点,用户逐渐歇息,人气值减少。
淘宝网用户人气值较高的时时刻刻集中化在20点至22点中间,店家可以在这段时间举行活动,有益于提升店铺流量及销售量。
3.RFM模型
由于数据集中沒有额度有关数据,因此大家只对于消费者行为和选购频率进行分析。
最近的消费行为Recency:数据的范围为一个月,按照时间距离远近可以分为0-6,7-12,13-18,19-24,25-30共5档,分别对应评分5到1。
CREATE TABLE ch as SELECT userid,DATEDIFF('2014-12-18',MAX(time))from tianchi_mobile_recommend_train_userwhere behavior=4GROUP BY userid;购买频率Frequency:付款用户中消费次数从低到高为1-161次,将其分为5档,1-32,33- ** ,65-96,97-128,129-161分别对应评分1到5,并与Recency合并。
select f.userid,Recency,Frequencyfrom f join r on f.userid=r.useridorder by Recency,FrequencyRecency、Frequency同时为5的用户为目前最具价值的用户,应当加以重视;而Recency=1,Frequency=5的用户购买间隔较短,但购买频次很高,是潜在的价值用户;而Recency=5,Frequency=1的用户粘性差,在运营过程中应重点提高用户使用app的频率,通过送优惠券、积分的手段保留用户。
五、总结与建议
本文使用2014.11.18-2014.12.18期间淘宝app用户行为数据,分析了淘宝在用户转化方面的优点及不足,并对淘宝大型促销活动“双十二”活动期间用户行为进行详细的分析。
于此同时,分析了用户在周度、日度的行为规律,提出了合理化建议,建议如下:
在淘宝,超过一半的用户能够找到心仪的产品并付款,但是,在使用淘宝app的过程中,用户需耗费大量的精力去寻找产品,建议淘宝优化推荐模型,使推荐精准化。除开淘宝大型促销活动,淘宝用户的行为在一定时间范围内存在一定的规律性,商家在举办以吸引顾客为目的的商业活动时,应尽量避开周五和周一,并选取20点-22点之间进行活动。窦之:逻辑回归:搭建淘宝app用户一次购买推荐模型扫码咨询与免费使用
申请免费使用