淘宝人群报告总结分析(合集4篇)

山崖发表网工作总结2024-01-25 10:25:1239

淘宝人群报告总结分析 第1篇

1)删除重复值

查询结果显示数据集并无重复数据。

2)缺失值处理

查询结果显示数据集并缺失值。

3)异常值处理

异常值定义为超出分析时间的数据。因为给定的数据中,时间相关的字段是时间戳类型,而时间戳是指格林威治时间1970年01月01日00时00分00秒(北京时间1970年01月01日08时00分00秒)起至现在的总秒数,无法直接与日期进行比较,因此,需要对其进行格式化转换,才能继续分析。用函数 FROM_UNIXTIME(时间戳,时间格式) 将时间戳这一列(timestamp)转为不同格式的时间并存放到不同到新列中。

添加后的表格如下图:

删除超出时间范围的数据(异常值):

删除异常值44行。

淘宝人群报告总结分析 第2篇

RFM模型通过一个客户的近期购买行为(R)、购买的总体频率(F)以及花了多少钱(M)3项指标来描述该客户的价值状况,如图11所示。

由于数据集中没有订单金额信息,我们就只从R、F方面分析。

1)查看对应用户的消费间隔R值

#1.先找出每个用户最后一次购买时的日期,与最后一天的时间间隔

CREATE VIEW pay_B AS

SELECT uid,DATEDIFF('2017-12-03',MAX(ti_st)) AS B FROM sam_ub

WHEREbeh='buy'

GROUP BY uid;

#2.再根据时间间隔等级R值降序排序

SELECT uid,(CASE WHEN B BETWEEN 0 AND 2 THEN 3

        WHEN B BETWEEN 3 AND 5 THEN 2

        WHEN B BETWEEN 6 AND 8 THEN 1

        ELSE 0 END) AS R

FROM pay_B

ORDER BY R DESC;

2)计算消费频次F

付费用户中消费次数从低到高为1-93次,将其分为6档1-10,11-20,21-30,31-40,41-50,50以上,对应F评分分别为1-6分,根据其活跃度将用户分为忠诚、活跃等类型。

#1.先计算出用户的消费次数

CREATE VIEWpay_times AS SELECT uid,COUNT(good_id) AS times FROM sam_ub WHEREbeh= _buy_

GROUP BY uidORDER BY COUNT(gid) DESC;

#2.再分级排序

SELECT uid,(CASE WHEN times BETWEEN 1 AND 10 THEN 1

        WHEN times BETWEEN 11 AND 20 THEN 2

        WHEN times BETWEEN 21 AND 30 THEN 3

        WHEN times BETWEEN 31 AND 40 THEN 4

        WHEN times BETWEEN 41 AND 50 THEN 5

        WHEN times >= 51 THEN 6 ELSE 0 END) AS F

FROM pay_times

ORDER BY F DESC;

3)查看每个用户的R、F和R+F

SELECT id,R,F,R+F RF

FROM (SELECT uid, (CASE WHEN B BETWEEN 0 AND 2 THEN 3

WHEN B BETWEEN 3 AND 5 THEN 2

WHEN B BETWEEN 6 AND 8 THEN 1

ELSE 0 END) AS R

FROM pay_b

ORDER BY R DESC) r

JOIN (SELECT uid ,(CASE WHEN times BETWEEN 1 AND 10 THEN 0

WHEN times BETWEEN 11 AND 20 THEN 1

WHEN times BETWEEN 21 AND 30 THEN 2

WHEN times BETWEEN 31 AND 40 THEN 3

WHEN times BETWEEN 41 AND 50 THEN 4

WHEN times >= 51 THEN 5 ELSE NULL END) AS F

FROM pay_times

ORDER BY F DESC;

综合评分为8的用户是极度忠诚用户,需要维持好与用户的关系,积极推送用户心仪的商品;大于6的用户属于忠诚客户,可以积极推送营销信息;综合评分在为3-5范围内的用户,属于活跃用户,可以积极推送所关注店铺的上新活动和优惠信息;对于评分小于3的用户,属于一般用户,可以把他们当做发展用户,通过打折、优惠券、积分兑换等活动唤起用户注意力,提高产品黏性;而对于那些没有过购买行为的用户,属于新用户,可以通过新人特别优惠引起他们的购买欲望,让用户喜欢使用淘宝网购。

4)极度忠诚的用户行为分析

根据3)的查询结果,我们可以看出:有一位用户的R、F和R+F均为第一,说明他是淘宝的极度忠诚用户。

查看用户ID为9610的每天的行为:

SELECT ti_st,SUM(CASE

beha_type WHEN 'pv' THEN 1 ELSE 0 END) '浏览量',

    SUM(CASE beh WHEN 'fav' THEN 1 ELSE 0END) '收藏量',

    SUM(CASE beh WHEN 'cart' THEN 1 ELSE 0END) '加购量',

    SUM(CASE behe WHEN 'buy' THEN 1 ELSE 0END) '消费量'

FROM sam_ub

WHERE uid='9610'

GROUP BY ti_st;

结果表明:该用户的浏览量和购买量很高,而收藏和加购量极低,代表这个极度忠诚的用户往往在浏览完之后直接购买,侧面支持了在统计浏览次数、收藏次数、和加入购物车次数在前20名的商品时的推断——倾向于浏览后直接购买的用户还是存在很多的。对于这类用户,往往就需要精准预测用户想要的商品以及对应的心理价位。

淘宝人群报告总结分析 第3篇

分析背景

1)政策:国家越来越重视电子商务的发展,相关监管工作也逐步展开和实施。这些新的变化有利于政府未来对电子商务的规范化引导和推进,更有利于电子商务市场的长远发展。

2)经济:2020年,国内经济总量突破了101万亿元,人均国内生产总值(GDP)超过万元,电商行业占国民经济比重越来越大。

3)社会:相关的物流以及支付等相关社会配套支持服务不断完善,使得网络购物越来越普及,网络购物的人数在不断增多。

4)技术:网络技术发展迅猛,特别是分类搜索引擎的普及,交互式社区平台技术的完善,都从技术上保障了网络购物市场向深层次不段发展。

分析目的

通过对淘宝用户行为数据的分析,找出转化率低的环节并分析原因,帮助商家提高产品销量,增加营业额,定位目标客户,精细化运营。

淘宝人群报告总结分析 第4篇

(1)分析这段时期内每天的用户行为(日访问总量,日收藏总量,日加购量,日购买量)

SELECT ti_st,

SUM(CASE beh WHEN 'pv' THEN 1 ELSE 0 END) '浏览量',

SUM(CASE beh WHEN 'fav' THEN 1 ELSE 0 END) '收藏量',

SUM(CASE beh WHEN 'cart' THEN 1 ELSE 0 END) '加购量',

SUM(CASE beh WHEN 'buy' THEN 1 ELSE 0 END) '付费量'

FROM sam_ub

GROUP BY ti_st

ORDER BY ti_st;

将查询结果用图5表示之后,发现周六和周日的浏览量、收藏量、加购量和购买量均高于工作日,说明用户偏好在非工作日网购,可以认为该人群的属性更偏向于职场人。因此,对于这些用户的营销活动可以选在周六和周日进行。

而且用户的加购量比收藏量要高很多,这说明用户更常使用购物车来选择自己想要购买的商品,因此我们可以刺激加购向购买的转化率,比如现在的跨店满减活动就是需要加购来获得优惠的。

(2)分析某一天内用户每小时的行为

以2017年11月28日(周二)为例:

SELECT hours,

SUM(CASE beh WHEN 'pv' THEN 1 ELSE 0 END) '浏览量',

SUM(CASE beh WHEN 'fav' THEN 1 ELSE 0 END) '收藏量',

SUM(CASE beh WHEN 'cart' THEN 1 ELSE 0 END) '加购量',

SUM(CASE beh WHEN 'buy' THEN 1 ELSE 0 END) '付费量'

FROM sam_ub

WHERE ti_st='2017-11-28'#以2017年11月28日(周二)为例

GROUP BY hours

ORDER BY hours;

为了验证工作日与非工作日的用户活跃特征是否一样,我们以2017年12月2日(周六)为例:

SELECT hours,

SUM(CASE beh WHEN 'pv' THEN 1 ELSE 0 END) '浏览量',

SUM(CASE beh WHEN 'fav' THEN 1 ELSE 0 END) '收藏量',

SUM(CASE beh WHEN 'cart' THEN 1 ELSE 0 END) '加购量',

SUM(CASE beh WHEN 'buy' THEN 1 ELSE 0 END) '付费量'

FROM sam_ub

WHERE ti_st='2017-12-02'  #以2017年12月2日(周六)为例

GROUP BY hours

ORDER BY hours;

由图6和图7的趋势可以看出,工作日和非工作日中这四个指标的走势很相近,都是在晚上9点达到一个高峰,说明在9点,用户的活跃度相对更高。因此,在晚上九点左右,适合做营销活动(比如直播、前*名立减),拉新和刺激更多人消费。

显示全文

注:本文部分文字与图片资源来自于网络,转载此文是出于传递更多信息之目的,若有来源标注错误或侵犯了您的合法权益,请立即后台留言通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意

点击下载文档

文档为doc格式

发表评论

评论列表(7人评论 , 39人围观)

点击下载
本文文档