包含两个词典数据中文概念词典(Chinese Concept Dictionary,CCD)和多语言概念词典(Multilingual Concept Dictionary,MCD)。
(1)中文概念词典(Chinese Concept Dictionary,CCD)实现了对WordNet1.6版本英语概念的汉语对应,概念总数接近10万(其中的词语总数远超10万),包括名词类概念66025个、动词类概念12127个、形容词类概念17915个和副词类概念3575个。向多家研究机构和跨国公司转让了使用许可权,推动了汉英语义分析的进展。
(2)多语言概念词典(Multilingual Concept Dictionary,MCD)基于CCD、日语WordNet、韩语WordNet与CoreNet,通过自动方法加人工专家核对构建而成。目前,多语言概念词典下已有8400个日语概念(主要为语言中的中高层概念)和9700个韩语概念(同样是中高层概念),并形成与CCD相关概念的联接信息。在WordNet框架下,大体描述了东亚语言(汉语、日语和韩语)的基本概念体系。
数据引用:
@data{DVN/JAU6RB_2017,
author = {Liu, Yang and Yu, Shiwen},
publisher = {Peking University Open Research Data Platform},
title = "{Multilingual Concept Dictionary}",
year = {2017},
version = {V2},
doi = {10.18170/DVN/JAU6RB},
url = {https://doi.org/10.18170/DVN/JAU6RB}
}
数据库格式:
mdb access数据库格式。
数据下载:
为了遵守数据使用条款,数据集市网站暂不提供数据文件的下载,请到北京大学开放研究数据平台进行数据下载。
使用条款:
数据下载和使用需遵守如下条款: (1)我只会将所下载数据用于个人学术,而不会用于任何盈利活动或商业用途。 (2)我不会以任何形式公布、发表所获之全部或部分所下载数据,不会将所下载数据以任何形式出版。 (3)我不会将所下载数据的全部或一部分、或将其内容稍加修改以原名称或更换名称发表或转让给他人,不会以出售、出租、租借、借贷或以其他方式赠予他人。 (4)我承诺在本协议约定范围内任何使用所下载数据的地方对数据进行规范引用。 具体格式例如:【刘扬; 俞士汶, 2017, "多语概念词典", http://dx.doi.org/10.18170/DVN/JAU6RB, 北京大学开放研究数据平台, V1】。