来自学生评估的 2707 个多选科学题
Allen Institute for Artificial Intelligence (AI2)的Project Aristo专注于构建一个系统,该系统能够获取并存储大量的可计算形式的知识,然后将这些知识应用于不同年级水平的学生的标准化考试中的各种科学问题。我们邀请更广泛的人工智能研究社区,通过提供学生科学评估问题的数据集,来与我们共同应对这一重大挑战。 这些都是英语语言问题,它跨越了文件中所显示的几个年级水平。每个问题都是对应4个选择回答。其中一些问题包括一个图表,作为问题文本的一部分,作为回答选项,或者两者兼而有之。图在文本中表示,文件名对应于对应文件夹中的图文件本身。这些问题被预先划分为培训、开发和测试集。 数据集包括以下字段: questionID: a unique identifier for the question originalQuestionID: the question number on the test totalPossiblePoints: how many points the question is worth AnswerKey: the correct answer option isMultipleChoiceQuestion: 1 = multiple choice, 0 = other includesDiagram: 1 = includes diagram, 0 = other examName: the source of the exam schoolGrade: grade level year: year the source exam was published question: the question itself subject: Science category: Test, Train, or Dev (data comes pre-split into these categories)
相关论文:
1.Clark, Peter. “Elementary School Science and Math Tests as a Driver for AI: Take the Aristo Challenge!” AAAI (2015).