清华大学自然语言处理与社会人文计算实验室共享资源协议

时间：2023-02-21 15:23:12 阅读：最新文章文档下载

说明：文章内容仅供预览，部分内容可能不全。下载后的文档，内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的，是否完整无缺。

清华大学自然语言处理与社会人文计算实验室

共享资源协议

甲方：清华大学自然语言处理与社会人文计算实验室乙方：（此处填写申请人所在单位）

协议内容：

1. THULAC面向国内外大学、研究所、企业以及个人研究者免费开放源。乙方提交该协议

表示同意：（1）该资源或程序库不用于商业目的；（2）不将资源或程序库扩散给第三方。 2. 为了增进同行交流，促进自然语言处理技术的发展，甲方将相关自然语言处理算法代码

和模型资源免费共享给乙方，列表如下：共享内

详细内容

容算法源

THULAC中文分词和词性标注训练算法、测试算法

码

1-中文分词模型，由北京大学人民日报分词语料库训练产生。

模型资源

2-中文分词与词性标注联合模型。由多个分词语料库训练数据联合学习产生。 3-中文分词与词性标注联合+词表。更加复杂精确的模型，并含有多个大规模词表。

3. 乙方同意在发表论文或申报成果时声明“使用了清华大学THULAC工具”，并按如下格式

引用：

中文：孙茂松, 陈新雄, 郭志芃, 张开旭, 刘知远. THULAC：一个高效的中文词法分析工具包. 2016.

英文： Maosong Sun, Xinxiong Chen, Zhipeng Guo, Kaixu Zhang, Zhiyuan Liu. THULAC: An Efficient Lexical Analyzer for Chinese. 2016.

4. 甲方将继续丰富和完善相关功能模块，为了能够给乙方及时提供最新资源和程序库，乙

方需要完整提供如下信息，以及乙方负责人的电子签名：乙方负责人乙方联系人

姓名

乙方负责人电子签名：年月日

机构名称

职务

电话

电子邮件

机构所在国别地区

网站

通讯地址

邮编

本文来源：https://www.wddqw.com/doc/c68eaa7031d4b14e852458fb770bf78a65293af9.html

相关文章：

正在阅读：

清华大学自然语言处理与社会人文计算实验室共享资源协议01-01

上一篇：社会问题研究课程论文参考文献下一篇：清华大学人文学院绿色世界公众史学研究中心简介