约30,000,000个句子及其翻译
JRC Names 是一个跨语言实体名称语料库,该语料库包含了大量跨语言人名和组织名称(称之为“实体”),包括不同语言的实体名称,包括汉语、英语、拉丁语、希腊语、阿拉伯语、斯拉夫语、日本语等。
Elektra 是一个自动驾驶汽车项目,由 CVC 研究中心以及 UAB 和 UPC 大学的研究小组开发。
2192幅高质量中国传统山水画组成的新数据集,这些山水画来自普林斯顿艺术博物馆藏品。
三字经中文带拼音对照文本数据集,包含中文以及拼音,同时包含了每段的解释和启示。
这是一个文本数据集;包含圣经旧约和新约的中英文对照内容。
小型数据集,包含 7 种关系类型和总共 1529 个注释示例。
由电影评论组成,其中持肯定和否定态度的各1,000 篇;另外还有标注了褒贬极性的句子各5,331 句,标注了主客观标签的句子各5,000 句。