清华大学自然语言处理与社会人文计算实验室共享资源协议

时间:2023-02-21 15:23:12 阅读: 最新文章 文档下载
说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。


清华大学自然语言处理与社会人文计算实验室

共享资源协议



甲方:清华大学自然语言处理与社会人文计算实验室 乙方:(此处填写申请人所在单位)

协议内容:

1. THULAC面向国内外大学、研究所、企业以及个人研究者免费开放源。乙方提交该协议

表示同意:1该资源或程序库不用于商业目的;2不将资源或程序库扩散给第三方。 2. 为了增进同行交流,促进自然语言处理技术的发展,甲方将相关自然语言处理算法代码

和模型资源免费共享给乙方,列表如下: 共享内

详细内容



THULAC中文分词和词性标注训练算法、测试算法



1-中文分词模型,由北京大学人民日报分词语料库训练产生。



2-中文分词与词性标注联合模型。由多个分词语料库训练数据联合学习产生。 3-中文分词与词性标注联合+词表。更加复杂精确的模型,并含有多个大规模词表。



3. 乙方同意在发表论文或申报成果时声明“使用了清华大学THULAC工具”,并按如下格式

引用:

中文: 孙茂松, 陈新雄, 郭志芃, 张开旭, 刘知远. THULAC:一个高效的中文词法分析工具包. 2016.

英文: Maosong Sun, Xinxiong Chen, Zhipeng Guo, Kaixu Zhang, Zhiyuan Liu. THULAC: An Efficient Lexical Analyzer for Chinese. 2016.

4. 甲方将继续丰富和完善相关功能模块,为了能够给乙方及时提供最新资源和程序库,乙

方需要完整提供如下信息,以及乙方负责人的电子签名: 乙方负责人 乙方联系人





乙方负责人电子签名:

机构名称



职务

电话

电子邮件



机构所在国别地区



网站

通讯地址



邮编






本文来源:https://www.wddqw.com/doc/c68eaa7031d4b14e852458fb770bf78a65293af9.html