按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
以描述。关于上下文敏感文法的句法分析相当复杂,需要很长
的机器时间。另一个原因是对于大部分实际问题来说,设计者
面对大量模式样本,如何根据这些样本归纳出描述这些样本
的文法也就是所谓的“文法推断”,问题不象原先估计的那
样容易解决。目前已经摸索到解决这些问题的途径:把统计模
式识别和句法模式识别统一起来,取长补短,建立新的模型
词意句法模式识别。词意信息是十分重要的,人们说话
或理解别人的话都不能离开记忆。长期记忆的模型往往是某
种结点和链的网络这种记忆可以沿着链束获得,也可以借助
于对刺激的直接的辨别和再认来获得
明人们的记忆中着重的是概念是词意,而不是句法。句法模
式识别基本上是按乔姆斯基短语结构文法体系建立起来的
。考虑的仅是句法,有局限性。词意句法模式识别既考
虑句法又考虑词意,通过采用属性文法,文法中包括句法部
分和词意部分并且加上元素的属性和连接关系的属性,把统
计模式识别和句法识别有机地统一起来。与统计方法及句法
相比较,词意句法方法与人识别模式的方法接近的程度加大
了,通过对模式识别中这一新的领域的深入研究,可能为建
立形象思维学提供富有启发性的素材。
二、短语结构语言 记忆认识与思维都与语言密切
第 301 页
字母表是构成语言
字母表
度有限的符号链。链的长度
的数目。一个语言所包含的句子总是无限多。
,宏文法
,近
有关,大脑信息加工的研究和模拟中就有一系列语言学或与
语言有关的课题。已经有一些关于科学语言的介绍
代语言学的特点是利用数学作为工具来研究语言。语言学
和数学相结合形成了数理语言学。数理语言学又可以划分为
统计语言学和代数语言学,前者着重研究词汇和文体的统计
特征以及语言内在结构的统计规律,后者主要研究语言的
学模型。最初关于语言的数学结构的探讨,其目的在于了解
自然语言的性质,通过研究发现具有一组产生式规则的短语
结构文法可以用来作为描述语言的方法。五十年代这一概念
发展和加以形式化。
由心理语言学家乔姆斯基和巴希勒尔以及他们的合作者加以
年以后发展了由巴库士范式定义的
程序语言,是短语结构语言中的一类语言上
下文无关语言。这一发现打开了从理论上取代仅仅用启发式
的办法来研究程序语言的可能性。自从乔姆斯基提出短语结
构文法以后,还提出过许多其他的文法模型,有些模型中采
用特殊形式的产生式。例如附标文法(阿荷
(费希切
夫特
,散射上下文无关文法(格瑞巴赫和哈普克洛
,还有的文法是对所用的产生式的次序加以限
制,如程序文法(罗申克瑞兹。另外在自然语言和程
序语言方面都进行了大量的工作。
有一个
乔姆斯基针对过去语言研究中的归纳方法,建立起一个
演绎性的形式语言系统。根据他的理论,某种语言
的有限个符号的集合,如英语的
中的符号从左往右排构成长
表示链中所包含的符号
中的符号所
第 302 页
优秀的
学生
〈动词〉〈副词
能够成的所有链用表示,所研究的语言是的一个子
集。中还包含着空链,空链包括语言单位之间的间隔,如
时,起着重要的作用。表示。
一段话语与另一段话语之间的停顿。空链在描写句子的结构
中除去空链所成的集合用
这些符号在以后将会遇到。
是一个动词短
下面简单的谈谈短语结构语言,虽然它的概念来源于分
析英文句子。为方便起见,我们用一个中文句子“优秀的学
生学习努力”为例加以说明,然后再转到讨论文法。这里
“优秀的学生”是一个名词短语作为主语,它包括着形容词
“优秀的”和名词“学生”,“学习努力
语,它包括动词“学习”和副词“努力”。这个句子可以由
下面的步骤形成。
〈句子〉
、〈名词短语〉〈动词短语〉
、〈形容词〉〈名词〉〈动词短语〉
、优秀的〈名词〉〈动词短语〉
、优秀的学生〈动词短语〉
、优秀的学生〈动词〉〈副词〉
、优秀的学生学习〈努力〉
、优秀的学生学习努力
〈句子〉
上述这些步骤可以依次按下列产生规则:
〈名词短语〉〈动词短语
〈名词短语〉〈形容词〉〈名词〉
〈动词短语〉
形容词〉
〈名词〉
第 303 页
是产生式的左部, 是产生式的右部。
学习
努力
表示“可以再写成”。
这样一个句子的产生还可以用树形图表示如下:通过
上面的分析我们来定义产生短语结构语言的短语结构文
法,一个短语结构文法是形如
四元式,其中和
量)。在上面例子中
) 的
是非终止符和终止符字母表( 或变
={〈句子〉,〈名词短语〉,〈动词
短语〉,〈形容词〉,〈名词〉,〈动词〉,〈副词〉
={优秀的,学生,学习,努力}
和的总和构成的总字母表,且
写, 是产生式(或再规则)有限集产生式形式表示成
其中都是中的变量组成的链,且中至少包括一个
非终止符, 是
子
中一个特殊的符号,称为起始符,对应于上面例中的〈句
。把句子的生成与图象的生成加以比较,也可以用短语结
构文法来产生或描述图象。例如,用下列短语结构文法生成:
次中性染色体〉)
〈动词〉
〈副词〉
上式中的
第 304 页
〈臂对〉
〈臂对〉
〈臂对〉
〈臂对〉
:〈次中性染色体〉
〈边〉〈臂对〉
〈臂对〉〈边〉
〈臂〉〈右部〉
〈左部〉〈臂
〈臂对〉
臂部〉〈臂〉(接下页)
〈臂对〉
右部〉,〈臂〉,〈边〉
, { 〈次中性染色体〉, 〈臂对〉, 〈左部
第 305 页
型(没有限制)的文法,即产生
可以
来
型文法到
〈臂〉
( 接上页)
〈右部〉
〈边〉
边〉
〈臂〉
〈臂〉
〈边〉
〈边〉
〈边〉
〈边〉
〈臂〉
〈臂〉
〈臂〉
乔姆斯基根据产生式的不同形式把短语结构文法
分成种类型。第一种称为
式的箭头两端的链可以是任意的。这样的文法过于广泛
而没有什么用处,一般说来不能确定一条由终止符组成的链
是否由型文法产生。由型文法产生的语言称为
型文法,
型语言。第
二种称为型文法的产生式的形式是有限制的,形式
为: 其中且
的情况下,
由型文法叫做上下文敏感文法。上下文
( 零链)。这意味着在上下文分别为
来加以代换,所以
型文
,其中
敏感文法产生的语言称为上下文敏感语言。第三种称为
法或上下文无关文法,产生式的形式为:
可以用,
代换而这种代换与型文法或有
),这意味着非终止符
的上下文无关。第四种称为
或其中
都是单个符号。从
限状态文法,产生式的形式为:
,这里
型文法,对于产生式的限制是逐步增加的。因此它们之间
便有这样的关系:
第 306 页
要研究高维图象文法。克尔希(
型型型型
很明显它们所产生的语言之间也有这种关系。
我们可以用不同的观点来看待语言,文法是从生成的观
点来看,另一种是从接受的观点来看,那就是识别(自动
机)的观点。短语结构文法中的每一种文法与
,上下文
种类型的自
动机对应,即该种文法产生的语言恰好能够由对应的自动机
接受。文法和自动机是密切联系而不可分的。有限状态文法
与有限状态自动机(
无关文法与非确定下推自动机(
机(
,上下文敏感文法与线性有界自动
型文法与图灵机
)相对应。
短语结构文法所产生的语言是字母表中的符号组成的
链。这种链是通过产生式规则生成的。对于描述某些一维的
模式,如声音、波形等是有效的。上面谈到的染色体是把外
形转换成一维的表示,对于描述图象及高维模式满足不了要
求,所以就需要研究高维模式文法。
三、图象文法 符号链是一维的,符号之间只有左右
连接关系,而图象模式是二维的,连接关系就不仅仅是左右
连接。用产生符号链的链文法来产生二维的图象需要首先把
象转换成一维的链,这样很不方便,效率也低,很自然就
)可能是第一
条产生式,产生式
个给出一个完整的图象文法的人。他构造了一个能够产生任
意等边直角三角形的