5194

10W+知乎用户数据集

10w zhihu user dataset

社会科学 知乎 爬虫数据

来自北京大学开放研究数据平台,利用scrapy作为工具,爬取了知乎平台上十万余条用户个人主页数据,涵盖了用户性别、所在地、个性签名等多项属性。

免积分下载
数据集市
2020年03月29日
204.6 MB

相关数据

Twitter情感分析训练语料库
Twitter情感分析训练语料库
该情感分析数据集 包含1,578,627条分类推文,每行标记... 免积分下载
多领域情感评论文本数据集
多领域情感评论文本数据集
多领域情感数据集包含从Amazon.com获取的部分产品评论... 免积分下载
Euler图学习开源数据集
Euler图学习开源数据集
Euler图学习平台自研算法对应的开源图数据与样本数据 免积分下载

数据介绍

来自北京大学开放研究数据平台,利用scrapy作为工具,爬取了知乎平台上十万余条用户个人主页数据,涵盖了用户性别、所在地、个性签名等多项属性。

数据集更新日期

2019年8月28日

数据引用:

@data{DVN/XLRXFR_2019,
author = {姚, 若愚},
publisher = {Peking University Open Research Data Platform},
title = "{10W+知乎用户数据集}",
year = {2019},
version = {V1},
doi = {10.18170/DVN/XLRXFR},
url = {https://doi.org/10.18170/DVN/XLRXFR}
}

许可证:

CC0 - "Public Domain Dedication"

还没有任何文件记录.