该数据集由淘宝网和天猫网提供的婴儿用品信息数据;
Ali_Mum_Baby是一个数据集,其中包含超过900万儿童的信息(生日和性别),这些信息由共享信息的消费者提供,以便接收更好的推荐或搜索结果。
Tianchi_mum_baby
它包含了超过900 万名 儿童的生日和性别,这是由淘宝或天猫的消费者提供的。
Column | Description |
---|---|
user_id | User ID (Bigint). |
birthday | Children’s birthday (e.g. 20130423). |
gender | Children’s gender (“0” denotes female, “1” denotes male, “2” denotes unknown). |
Tianchi_mum_baby_trade_history
该表包含淘宝会员的历史交易信息。
Column | Description |
---|---|
item_id | Item ID (Bigint). |
user_id | User ID (Bigint). |
cat_id | Category ID (Bigint). |
cat1 | Root category ID (Bigint). |
property | Property of the corresponding item (String). |
buy_mount | Purchase quantity (Bigint). |
day | Timestamp. |
典型研究课题
根据父母的购买行为来预测孩子的年龄,或者根据孩子的信息(年龄,性别等)来预测用户会购买哪种商品。
参考和相关出版物
Peng Jiang, Yadong Zhu, Yi Zhang, Quan Yuan, Life-stage Prediction for Product Recommendation in E-commerce. To appear in Proceedings of the 21th ACM SIGKDD international conference on Knowledge discovery and data mining, ACM, 2015.