收藏本站 | 联系我们 | 设为首页 | English
全文千赢国际娱乐技术的发展脉络
来源:  作者:本站
基于规则的机器千赢国际娱乐的技术是最成熟的,也是到目前为止应用最广的,目前有影响的机器千赢国际娱乐系统都是基于规则的。基于规则的机器千赢国际娱乐系统就是对语言语句的词法、语法、语义和句法进行分析、判断和取舍,然后重新排列组合,生成等价的目标语言。

  基于中间语言的方法是对源语言进行分析后产生一种成为中间语言的表示形式,然后直接由这种中间语言的表示形式生成目标语言。所谓中间语言就是自然语言的计算机表示形式的系统化,它试图创造出一种独立于各种自然语言,同时又能表示各种自然语言的人工语言。

  基于规则的机器千赢国际娱乐发展到今天,相对来说已比较成熟。虽然经过长期的努力,人们已经建立含有成千上万个规则的规则库,覆盖了相当大的语言现象,但是从理论上讲,这种过程仍然很有限。因为语言是一个民族经过几千年的积累,是约定俗成而又动态发展的。随着社会的不断发展,新的词汇和语言现象不断出现。现有的机器千赢国际娱乐系统的规则再多,也只是特定语言现象的概括和总结。因此,基于规则的机器千赢国际娱乐方法借鉴了其他方法的优点,并产生很多变化,主要体现在以下几个方面:

  在规则的获取方面,传统的规则方法主要依靠语言学家总结规则进行调试,而现在更加重视从语料库中获取规则(如采用错误驱动的学习算法);

  传统的规则方法往往偏重描述粗粒度的、全局化的大范围语言学规则知识,而现在则更加重视描述细粒度的、局部的小范围的语言学知识,呈现出“小规则库、大词典”的趋势;

  在知识表示方面,为了以更小的粒度、更加准确地对千赢国际娱乐知识进行描述,一般要对单纯的上下文无关规则做一些改进;

  传统的规则方法采用的往往是非此即彼的确定性原则,系统的鲁棒性较差,而现在规则系统中一般都引入各种形式的概率或评分函数,系统的鲁棒性有所提高。

  基于语料库的机器千赢国际娱乐方法

  基于统计的机器千赢国际娱乐方法和基于实例的机器千赢国际娱乐方法都是使用语料库作为千赢国际娱乐知识的来源。二者的区别在于:在基于统计的机器千赢国际娱乐方法中,知识的表示是统计数据,而不是语料库本身,千赢国际娱乐知识的获取是在千赢国际娱乐之前完成,千赢国际娱乐的过程中不再使用语料库;而在基于实例的机器千赢国际娱乐方法中,双语语料库本身就是千赢国际娱乐知识的一种表现形式(不一定是惟一的),千赢国际娱乐知识的获取在千赢国际娱乐之前没有全部完成,在千赢国际娱乐的过程中还要查询并利用语料库。

  统计千赢国际娱乐的数学模型是由IBM公司的Brown等人提出来的。统计机器千赢国际娱乐的基本思想是,把机器千赢国际娱乐看成是一个信息传输的过程,用一种信道模型对机器千赢国际娱乐进行解释。假设一段源语言文本S,经过某一噪声信道后变成目标语言T,也就是说,假设目标语言文本T是由一段源语言文本S经过某种奇怪的编码得到的,那么千赢国际娱乐的目标就是要将T还原成S,这也就是一个解码的过程。
上一页12 下一页
关于本站 | 会员服务 | 隐私保护 | 法律声明 | 站点地图 | RSS订阅 | 友情链接
免责声明:凡本站注明来源为xx所属媒体的作品,均转载自其它媒体转载目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。