7771

斯坦福大学Sentiment140情感分析数据集

Sentiment140

情感分析 评论数据 自然语言处理 Twitter 语料

Sentiment140数据集是斯坦福大学的一个课堂项目产生的一个用于情感分析的数据集,数据抓取自twitter;这个流行的数据集能让你完美地开启自然语言处理之旅。

免积分下载
数据集市
2019年09月23日
77.6MB

相关数据

Twitter情感分析训练语料库
Twitter情感分析训练语料库
该情感分析数据集 包含1,578,627条分类推文,每行标记... 免积分下载
多领域情感评论文本数据集
多领域情感评论文本数据集
多领域情感数据集包含从Amazon.com获取的部分产品评论... 免积分下载
Euler图学习开源数据集
Euler图学习开源数据集
Euler图学习平台自研算法对应的开源图数据与样本数据 免积分下载

数据介绍

Sentiment140数据集是斯坦福大学的一个课堂项目产生的一个用于情感分析的数据集,数据抓取自twitter;这个流行的数据集能让你完美地开启自然语言处理之旅。

数据格式: 0 - tweet的极性(0=消极,2=中性,4=积极) 1 - tweet的ID(2087) 2 - tweet日期(Sat May 16 23:58:44 UTC 2009) 3 - 查询(lyx)。 如果没有查询,那么这个值是NO_QUERY。 4 - tweet用户(robotickilldozr) 5 - tweet文本(Lyx is cool)

这里有一篇使用Python分析的介绍文章: https://towardsdatascience.com/another-twitter-sentiment-analysis-bb5b01ebad90?gi=6f4ae6795f75

数据规格

发布时间 2009年
制作者 斯坦福大学计算机科学专业的研究生Alec Go,Richia Bhayani和Lei Huang
语言 英语
序号 名称 大小
1 trainingandtestdata.zip 77.6MB