Sentiment140数据集是斯坦福大学的一个课堂项目产生的一个用于情感分析的数据集,数据抓取自twitter;这个流行的数据集能让你完美地开启自然语言处理之旅。
Sentiment140数据集是斯坦福大学的一个课堂项目产生的一个用于情感分析的数据集,数据抓取自twitter;这个流行的数据集能让你完美地开启自然语言处理之旅。
数据格式: 0 - tweet的极性(0=消极,2=中性,4=积极) 1 - tweet的ID(2087) 2 - tweet日期(Sat May 16 23:58:44 UTC 2009) 3 - 查询(lyx)。 如果没有查询,那么这个值是NO_QUERY。 4 - tweet用户(robotickilldozr) 5 - tweet文本(Lyx is cool)
这里有一篇使用Python分析的介绍文章: https://towardsdatascience.com/another-twitter-sentiment-analysis-bb5b01ebad90?gi=6f4ae6795f75
发布时间 | 2009年 |
制作者 |
斯坦福大学计算机科学专业的研究生Alec Go,Richia Bhayani和Lei Huang |
语言 | 英语 |
序号 | 名称 | 大小 |
---|---|---|
1 | trainingandtestdata.zip | 77.6MB |