5660

淘宝APP用户行为数据分析

User Behavior Data from Taobao for Recommendation

淘宝 用户行为

UserBehavior是阿里巴巴提供的一个淘宝用户行为数据集,用于隐式反馈推荐问题的研究。

免积分下载
数据集市
2020年04月11日
905.80MB

相关数据

谷歌随机生成的3D模型数据集
谷歌随机生成的3D模型数据集
为了在模拟中训练机器人的抓地力和其他任务,随机生成的3D模型... 免积分下载
欧洲议会平行语料库1996-2011
欧洲议会平行语料库1996-2011
平行语料库对于统计机器翻译(SMT)的研究至关重要,欧洲议会... 免积分下载
IMDB电影评论数据集
IMDB电影评论数据集
IMDB上25,000条电影评论数据集 免积分下载

数据介绍

本数据集包含了2017年11月25日至2017年12月3日之间,记录了一百万名有行为的淘宝用户行为记录样本,包含1,0015,0806条数据,987994个不同用户,4162024个不同商品,3623个不同商品分类。

有行为的约一百万随机用户的所有行为(行为包括点击、购买、加购、喜欢)。数据集的组织形式和MovieLens-20M类似,即数据集的每一行表示一条用户行为,由用户ID、商品ID、商品类目ID、行为类型和时间戳组成,并以逗号分隔。

关于数据集中每一列的详细描述如下:

列名称 说明
用户ID 整数类型,序列化后的用户ID
商品ID 整数类型,序列化后的商品ID
商品类目ID 整数类型,序列化后的商品所属类目ID
行为类型 字符串,枚举类型,包括('pv', 'buy', 'cart', 'fav')
时间戳 行为发生的时间戳

注意到,用户行为类型共有四种,它们分别是

行为类型 说明
pv 商品详情页pv,等价于点击
buy 商品购买
cart 将商品加入购物车
fav 收藏商品

关于数据集大小的一些说明如下

维度 数量
用户数量 987,994
商品数量 4,162,024
商品类目数量 9,439
所有行为数量 100,150,807

论文引用

1. Han Z, Xiang L, Pengye Z, et al. Learning Tree-based Deep Model for Recommender Systems. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2. Han Z, Daqing C, Ziru X, et al. Joint Optimization of Tree-based Index and Deep Model for Recommender Systems. arXiv:1902.07565.

数据来自阿里云的:天池数据集

还没有任何文件记录.