语义计算(SEMANTIC COMPUTING) 学术报告开始,许承瑜教授介绍了自己两年来对“语义计算”的研究原因与历程。他谈到计算机所面临的挑战,从有结构数据到无结构数据的处理、传统的桌上型电脑到无所不在的电脑,比如手机提供电脑的功能和用什么样的方式取代电脑的更高级的功能、以及电脑如何跟嵌入式硬件的结合;软件如何包装起来成为服务以与别人共享;传统的应用到面向领域的应用,比如生物学、医学、社会学、GIS等,从原来大家都需要的商品到一个行业需要的商品开发等都有一定的困难。 许承瑜教授谈到了语义计算的意义和内容,他说非结构化信息的使用范围发生了大幅度的增长,这些信息的形式包括文档、电子邮件、电话录音以及多媒体内容。企业中现在有超过 85% 的信息都是非结构化信息,这些“人性化”的信息对于计算机而言非常难于理解和使用。而基于语义的计算能够解决这一问题。基于语义计算技术使计算机能够理解各段信息之间的联系,进而执行复杂的分析操作,而这一切都是自动且实时进行的。 基于语义计算技术与包括关键词搜索在内的传统方法有何不同?基于语义计算技术的能力远远超出了诸如关键词搜索,这些只能进行数据查找与检索的传统方法。举例而言,关键词搜索引擎不能理解信息的含义,因此这些产品只能用于找出带某个字词的文档,然而由于无法理解含义,所以那些使用了不同字词但主题却相同(即有相关性)的文档将被忽略。而那些主题与用户期望搜索的内容完全不同的文档却经常被返回,从而使得用户必须修改查询方式来适应这种搜索引擎。除此之外,基于语义的计算还能提供关键词搜索引擎无法提供的许多功能,例如自动形成超链接以及聚类。举例而言,自动形成超链接可以向用户提供众多在语境上与原有的文档相互联系的文档、服务和产品,这就要求计算机能够完全理解原有文档的含义。语义计算技术处理的问题都是内容,怎么把内容变成我们意念所得到的东西;怎么把意念转换成有用的内容;如何把二者结合在一起;怎么能够把新的功能实现出来;复杂的事情怎么简单的表达;怎么把无结构的数据用意念来表达,面向多媒体,文本的服务如何与传统结构化的数据结合在一起来解决大家的问题;还有怎么把文本、多媒体GIS等内容跟自然语言结合起来去解决问题。为了解决上述问题,为了使计算机能够自动收集、分析并组织信息,就必须赋予其提取语义的能力。只有拥有基于语义计算技术的系统才能做到这一点。 许承瑜教授还谈到了他们对语义计算的定义:即将人的意念与内容结合起来,继而发现意念在内容上的意义,将无结构的意念变成一个有结构的内容信息。他谈到1980年AI没有成功的教训,继而思考我们如何才能让自然语言帮我们做搜索,发明新技术等应用。还有怎么让这些技术互相交叉融合在一起解决新的问题。语义计算分为四个层次:语义的分析,描述语言,语义应用和语义推论。描述语言是一种自然语言,它能够精简和准确的表达人的意念。还提到一个重要的概念:语义对象,这是一种结构化的复杂数据,储存在数据库里面。 然后,许教授还以网络发布服务系统和计划系统作为例子讲述了语义计算的应用研究。在传统的网络发布服务系统中有几个服务都需要执行的时候,需要我们手动合成服务,从而将几个服务集中在一起以解决某一个问题。同时存在另外一些难题,如:怎么用旧的服务开发出新的服务、怎么把服务串在一起、怎么克服严重的依赖匹配,以及,自动组合还只能靠输入得到输出,而不能支持自动的组合匹配等问题。那怎么做才能做到动态的解决呢?用数据库支持可以做到。方法是在相关服务的基础上扩展一些功能,比如:将input和output等元素加入到常用的SQL语言中去。以语义计算为基础改良后,解决了一些问题,才会发展成为一个好的平台。同时提出语义计算不是很适用计划系统方面的应用,复杂度太高,需要有前置的条件。 接下来,徐教授介绍了本次报告的第二部分:自动服务组合,就是按照服务类型和它们之间的联系,将服务动态组合起来的方法与技术。介绍了数据挖掘的原理,算法和在语义计算平台中的应用,在继承关系数据库的基础上,在上面加其它的东西以更好的完成其功能,其次用户复杂应用需求增加,越来越需要处理复杂问题的工具。还谈到了语义搜索(通过对于此单词的多个概念在语义本体中定位,并采用语义扩展算子进行语义扩展,形成一个新的检索概念集。以此检索概念集对处理对象,进行精确检索,从而获得检索结果。),语义编程(即在本质上为事务构成进行硬件编码),状态数据库(输入初始状态就能输出最终状态)等等内容。 最后,许承瑜教授作出总结,希望能与我们实验室有更好的合作,并告诫大家:做研究要大胆的设想,小心的实现。 本文来源:https://www.wddqw.com/doc/87230e323968011ca3009117.html