4.语义周边角色的标注细则¶
4.1总述¶
语义周边角色,就是语义事件的参与者角色,也即语义角色,这里的“周边”,是与中枢论元相对而言,强调语义周边角色的标注对象是与中枢论元有语义关系的周边论元。语义周边角色常常由指称概念充当。
我们对原有语义依存体系的改进,体现在两方面:一是在结构上从依存树结构突破到依存图结构,二是理论基础出发进行了再整理和分层归类,也确定了一整套新的语义角色标签集合。以董振东和鲁川的体系为基础,结合袁毓林的语义体系,确定出了一套全面、简单、实用,同时能适应自然语言处理高层应用要求的语义依存关系体系。语义周边角色分为了三类,分别是主体角色、客体角色以及情境角色。每一类有粗粒两个颗粒度的待标角色,粗粒度角色共有17个,细粒度角色共45有个。下表是我们的语义周边角色系统中所有的层级以及相应语义角色:
所以,在接下来的4.2、4.3、4.4小节中,将分别详细叙述每一类的标注细则,包括定义、分类、例句以及易混淆对比等,尤其是对于一些角色的可操作性划分处理,将给出一定的句法语义标准。
对于例句语义关系的表示,主要采取三元组形式——(父节点,子节点,语义关系)。其中父节点指向子节点,这是依存弧的指向问题;语义关系是依存标签的问题,除非特殊说明,统一展示的是细粒度标注标签。
最后,在4.5小节中,将结合对第一版语料库的标注数据统计,对整体语义周边角色的标注细则进行一个总结。
4.2主体角色¶
主体是一切运动的主体,是作为静态的和动态的各种运动的主体之事物。主要有施事角色和当事角色两大类。
4.2.1施事AGT¶
施事AGT(agent)是发出具体行为动作的主体或动作持续以及表现心理活动的有意识的主体,具有主观能动性。一般来说,有生命的物体可以充当施事角色,可以是人,也可以是动物等;句法变换进行提问时,可以用“谁、什么人”等进行提问;在句法配位上,基本情况是出现在动词之前,但是也可以出现在动词之后,例如:畜牧场跑了一群羊。“一群羊”作为施事角色,出现在动词“跑”的后面。
从细粒度标注集来说,施事角色可以细分为施事角色(Agt)和感事角色(Aft)。
4.2.1.1施事Agt
施事角色Agt有以下两种类型:
-
表现具体行为动作的有意识的主体。
①我一定在九点之前把文件送到。(送到,我,施事Agt)
②明天我将去看他。(看,我,施事Agt)
-
表现动作持续的有意识的主体。
①去年他在非洲工作。(工作,他,施事Agt)
②经理在思索问题。(思索,经理,施事Agt)
4.2.1.2感事Aft
感事角色Aft(afffection)表现心理活动的有意识的主体。同样作为有意识的主体,感事在动词的选择上与施事不同,主要是心理活动类动词。主要包括以下两类。
-
“情感”的主体。
①我讨厌伦敦。(讨厌,我,感事Aft)
②他们从不吃惊。(吃惊,他们,感事Aft)
-
”感知“的主体。
①难民听到了炮声。(听,难免,感事Aft)
②刑警懂得了密码的含义。(懂得,刑警,感事Aft)
4.2.2当事EXP¶
当事角色EXP(experiencer)是非行为动作的发出者,不具有主观能动性,这是与施事的最大不同。具体来说,包括无意识运动的主体、非可控运动的主体以及各种关系的主体。具体包括当事角色Exp、领事角色Poss。
4.2.2.1当事Exp
当事角色Exp有以下几种类型:
-
静止状态的主体。
①宝塔很高。(高,宝塔,当事Exp)
②猫在床下面。(在,猫,当事Exp)
-
自身变化的主体。
①苹果树正在开花。(开花,苹果树,当事Exp)
②柳条还没绿呢?(绿,柳条,当事Exp)
-
非可控运动变化的主体。
①主席台设在天安门城楼上。(设,主席台,当事Exp)
②病人疼得哭了起来。(疼,病人,当事Exp)
-
表判断的主体。
①他是最好的老师。(是,他,当事Exp)
②这不是新书。(是,这,当事Exp)
-
交代事件观点的非有意识主体。
①研究表明人的睡眠必须满足一天8个小时。(表明,研究,当事Exp)
②报告显示病人的病情有缓和。(显示,报告,当事Exp)
4.2.2.2领事Poss
领事角色Poss(possessor)表示领属关系的主体或整体部分关系的整体。分为以下两类。
-
领属关系的主体。
①他有一个养鸡场。(有,他,领事Poss)
②他今天还有很多工作要做。(有,他,领事Poss)
-
整分关系的整体。
①螃蟹长着八条腿。(长,螃蟹,领事Poss)
②土壤含有水分和养料。(含有,土壤,领事Poss)
-
发出行为的主体,描述所发出的行为事件一般用的是抽象名词,与主体之间用“的”连接。
①你的错误会使其他人承担严重的后果。
②总统的演说振奋人心。
注意,领事除了可以表示语义周边角色与中枢论元之间的关系外,还可以表示周边角色之间的领属关系或整分关系。注意,对于这种用法,在使用粗粒度标签的时候,采用的是修饰角色FEAT。这是因为,它们与中心语之间表示句法上的定中关系,而定中关系都可以表示为修饰角色FEAT。例如:
①敌人的暴行令人发指。(暴行,敌人,领事Poss)/(暴行,敌人,修饰FEAT)
②男孩的妈妈来了。(妈妈,男孩,领事Poss)/(妈妈,男孩。修饰FEAT)
4.2.3主体角色小结¶
从粗粒度标注标签集来说,主体角色包含两类:施事角色Agt和当事角色Exp,二者主要区别在于施事具有主观能动性而当事不具备这种特性。施事对应的中枢论元一般是动作行 为动词,而当事对应的中枢论元一般是心理活动动词、判断等表关系、情状的动词。从细粒度标注标签集来说,主体角色包含四类:施事Agt、感事Aft、当事Exp以及领事Poss。为了维护标注规范的客观性以及保证标注规范的可操作性,接下来将从聚合标准、组合标准以及语义标准对主体角色进行一系列的界定,也可称作评估标准或衡量标准。
其中,聚合标准指主体角色能出现在什么样的句型中以及能充当什么样的句法成分;组合标准指的是主体角色能够与特殊动词、介词或者副词的组合能力;语义标准指的是与经常与主体角色共现的中枢论元所具有的语义特征。
下表是主体角色聚合标准:
表格 8主体角色聚合标准
聚合标准 | 施事 | 当事 | 感事 | 领事 |
---|---|---|---|---|
作主语 | + | + | + | + |
作定语 | - | - | - | + |
形容词谓语句 | - | + | - | + |
名词谓语句 | - | + | - | + |
从句法成分上讲,主体角色都能作主语,特殊之处在于,领事角色可以作定语。例如:
①老虎·伍兹的招牌笑容是球迷的最爱。(招牌,老虎·伍兹,领事Poss)
②她把孩子从父亲怀里抢了过去。(怀里,父亲,领事Poss)
句1“老虎·伍兹”是“笑容”的领属,句2“父亲”与“怀里”是整体与部分的关系,所以领事角色可以作定语。
从句型上讲,主体角色都可以出现在动词谓语句中,所以动词谓语句不作为区别特征,而当事角色可以出现在形容词谓语句中,因为形容词做谓语是对主体性质或情状的描述。例如:
①宝塔很高。(高,宝塔,当事Exp)
②海风特别凉爽。(凉爽,海风,当事Exp)
其中,领事角色也可以出现在形容词谓语句中,这主要出现在当领事角色Poss表达修饰关系的时候,例如:
①他的眼睛很亮。(亮,眼睛,当事Exp)(眼睛,他,领事Poss)
严格来说,这个句子并不是由领事角色充当谓词的主体角色的,但是它作为句子的一部分也确实出现在了形容词谓语句中,所以我们把领事角色的出现环境加了形容词谓语句。但是在粗粒度标签集中,充当修饰成分的领事角色被标注为FEAT,归属为情境角色。这也是我们根据功能,将领事角色提升到不同类别的周边的原因,因为出现的环境是不同的。
而当事角色和领事角色可以出现在名词谓语句中。从意义上说,名词谓语句限于说明时间、天气、籍贯、年龄、容貌、数量等的口语短句,其主体多是当事角色和领事角色。如:
①潘老太太刚好八十八岁。(岁,潘老太太,当事Exp)
②她大眼睛,红脸蛋。(眼睛,她,领事Poss)
下表是主体角色组合标准:
表格 9主体角色组合标准
组合标准 | 施事 | 当事 | 感事 | 领事 |
---|---|---|---|---|
出现在动作行为动词前 | + | - | - | - |
出现在心理活动动词前 | - | - | + | - |
出现在存在动词前 | - | + | - | + |
出现在判断动词前 | - | + | - | - |
出现在“不+V”形式前 | + | + | + | - |
出现在“没有+V”动词前 | + | + | - | + |
出现在“V(了/一/不)V”形式前 | + | + | - | - |
出现在“V+成/完”形式前 | + | + | + | - |
出现在介词“把”前或“被”后 | + | - | - | - |
施事角色一般出现在行为动词前面,而动作行为动词可以受否定词“不/没有”的修饰,可以重叠,也可以出现在“把字句/被字句”中。例句不表。
当事角色可以出现存在动词、判断动词前,这些动词可以受“不/没有”的修饰,可以重叠,也可以生成一种结果,例如:
①大厦有30层高。(高,大厦,当事Exp)
②弟弟不是中学生。(是,弟弟。当事Exp)
③桌子上没有灰尘。(有,桌子,当事Exp)
④弟弟像不像爸爸。(像,弟弟,当事Exp)
⑤水管锈成实心的了。(锈,水管,当事Exp)
我们定义的感事角色有两种情况:“感知”的主体和“情感”的主体。所以,感事角色主要出现在心理活动动词前,能受否定词“不”的修饰;同时,一部分感知的主体可以感知得到一种结果。例如:
①小明崇拜周杰伦。(崇拜,小明,感事Aft)
②小明不喜欢数学。(喜欢,小明,感事Aft)
③小明听完了报告。(听。小明,感事Aft)
领事角色主要表示领属以及整体与部分的关系,所以主要出现在存在动词前,受否定副词“没有”的修饰。例如:
①螃蟹有八条腿。(有,螃蟹,领事Poss)
下表是主体角色语义标准:
表格 10主体角色语义标准
语义标准 | 施事 | 当事 | 感事 | 领事 |
---|---|---|---|---|
主动 | + | - | + | - |
致使 | + | - | - | - |
属性 | - | + | - | - |
心理 | - | - | + | - |
变化 | - | + | - | - |
相关 | - | + | - | + |
[主动]指主体参与者能够主动地对客体施加动作及影响;[致使]指事件主体请求、命令客体状态变化的活动;[属性]指谓词描述的是事物主体自身的属性;[心理]指主体内心的动态活动喜好憎恶等;[变化]指事件主体自发的由一种状态到另一种状态的变化或进展;[相关]指谓词描述的是主客体之间的关系。
施事角色具有[主动+] [致使+]特征,例如:
齿鲸主要吃大鱼和海兽。(吃,齿鲸,施事Agt)
当事角色具有[属性+] [变化+] [相关+]特征,例如:
骄傲是他垮台的原因。(是,骄傲,当事Exp)
感事角色具有[主动+] [心理+]特征,例如:
他把那件事给忘了。(忘,他,感事Aft)
领事角色具有[相关+]特征,例如:
我们今天仍有这种感觉。(有,我们,领事Poss)
4.3客体角色¶
客体角色是事件主体之外的第二个参与的实体。根据不同的语义特征,客体角色有受事PAT、客事CONT、涉事DATV、系事LINK四类。
4.3.1受事PAT¶
受事角色是受主体的行为动作所改变的直接客体。受事一般与施事相对应,是受施事影响而导致位置、性质、结果等发生改变的对象,最明显的语义特征是具有被动性。对应的细粒度标注标签集只有受事Pat一种。
4.3.1.1受事Pat
受事Pat(Patient)作为受主体直接影响的对象,主要有以下几种语义类别。
-
某个动作发生后,消失或转移的客体。
①字典是从日本买的。(买,字典,受事Pat)
②从桌子上把书拿走。(拿走,书,受事Pat)
-
受动作支配的客体。
①他的衣服被雨淋湿了。(淋湿,衣服,受事Pat)
②怎样解决这个难题?(解决,难题,受事Pat)
-
“给予”或“获取”等行动改变所有权的客体。
①他赠弟弟一支笔。(赠,笔,受事Pat)
②我军缴获了敌人四辆坦克。(缴获,坦克,受事Pat)
4.3.2客事CONT¶
客事角色Cont(content)指事件所涉及但是并未改变的客体以及动作行为产生的新事物或结果。对应的细粒度标注标签集有客事(Cont)、成事(Prod)、结局(Cons)。
4.3.2.1客事Cont
客事角色Cont(content)主要有四种语义类别,一种是客观的信息类,这种信息可以被学习、被感知、被传播、被查询、被参阅、被借鉴,但是不能被改变,所以是客事;第二种是主观的情感类,这种情感是主体自身的一种感受,与他人无关,不涉及动作行为的变化,所以也是客事;还有一类就是表示客观事物的具体内容语义;最后一类指的是被作用于某种动作但本身未受任何改变的客观事物。
-
信息类。
①你要多学点知识。(学,知识,客事Cont)
②我相信苏珊的话。(相信,话,客事Cont)
③他说出了每个工人的心愿。(说,心愿,客事Cont)
④你在申请延长签证时遇到什么困难了吗?(延长,签证,客事Cont)
⑤详情请参阅语法章。(参阅,语法章,客事Cont)
-
情感类。
①老师对她的学生感到满意。(感到,满意,客事Cont)
②我渴望幸福。(渴望,幸福,客事Cont)
-
内容类。
①这种药物具有止咳功能。(功能,止咳,客事Cont)
②手册里有用法说明。(说明,用法,客事Cont)
-
受到某种作用但本身不受改变的客观事物。
①教育对国民发展起着重要作用。(作用,起着,客事Cont)
②被告未提交答辩状。(答辩状,提交,客事Cont)
4.3.2.2 成事Prod
成事Prod(product)特指主体所创建或产生的新事物。成事是由无到有的一个具象的事物或行为,其对应的主体可以是有意识的事物,也可以是无意识的事物。
-
有意识主体创建的事物。
①他写了一本小说。(写,小说,成事Prod)
②中国与美国建立了新型的外交关系。(建立,关系,成事Prod)
-
无意识主体产生的事物。
①那棵树结了很多果实。(结,果实,成事Prod)
②树木生出了新的枝条。(生,枝条,成事Prod)
4.3.2.3 结局Cons
结局Cons(consequence)与成事不同,更注重事件状态的转变过程。例如:
①工厂爆炸造成污染。(造成,污染,结局Cons)
②这件事导致谣言丛生。(导致,谣言,结局Cons)
结局Cons角色与成事Prod角色类同,都表现新的事物、新的状态,但是成事一般表示的产生了一个新的具象事物,而结局表示的是某事件所发生的状态变化结果。
4.3.3涉事DATV¶
涉事角色DATV也称与事,是动作行为的非主动参与者,有人也说,涉事角色是语义事件的第三方参与者。从语义上说,是事件接受者、伴随者、来源者以及比较的基准等等;从句法上说,经常出现在双宾语句中的间接宾语位置。对应的细粒度标注标签集有涉事(Datv)、源事(Origin)以及比较(Comp)三种。
4.3.3.1涉事Datv
典型的涉事Datv(Dative)与受事、客事相比,最主要的语义特征在于它的参与性,它不是与施事、当事直接相关的周边角色。经常由介词引出。具体来说,可以有以下语义类别。
-
信息或实体的接受者。
①班长给他一套工具。(给,他,涉事Datv)
②大家都叫他毛伯伯。(叫,他,涉事Datv)
-
事件过程中出现的伴随者或共现者。也即有些语法书上讲的“共同施事”。
①他同王芳结婚了。(结婚,王芳,涉事Datv)
②他邀请评论家来参观。(邀请,评论家,涉事Datv)
注:在“A+‘和、跟、与’+B +v”的句型中,v的语义如果是需多人参与才能进行的,标B为涉事,例如“合作、结婚、打球”等。如果v的动作语义一个人单独也能完成,且A和B的位置可以互换,那么认为“和、跟、与”是连词,标A和B是并列关系。详见5.4.2并列关系的说明。
-
所关涉的对象。
①妈妈为女儿着想。(着想,女儿,涉事Datv)
②你对流行音乐很有欣赏力。(有,音乐,涉事Datv)
4.3.3.2源事Orig
源事角色Orig(Origin)也是事件中的参与者,它特指事件中客体来源的邻体。一般都要由介词“向、从”引入。例如:
①大家向教授请教问题。(请教,教授,源事Orig)
②湿润的风从南方吹来。(吹,南方,源事Orig)
4.3.3.3比较Comp
比较Comp(compare)也是事件中的参与者,它特指事件中与主题进行比较的基准。一般都要由比较标记词“比“引入。例如:
①月球比地球小。(小,地球,比较Comp)
②老李比他师父更好。(好,师父,比较Comp)
4.3.4系事LINK¶
系事LINK是跟事件的参与者有关系的客体。一般由表示某种关联的动词连接主客体,表达主客体之间的某种具体的、或抽象的关系。中枢论元一般是判断动词或者“有、像”等表示关系的谓词。对应的细粒度标注标签集有属事和类事两种。
4.3.4.1属事Belg
属事Belg(belongings)表达的是领属关系中的所属者。
-
所属对象有具体的实体。比如亲属、财务、事物的构成部分等。
①他有一个妹妹。(有,妹妹,属事Belg)
②奶奶有一根拐杖。(有,拐杖,属事Belg)
③螃蟹有八条腿。(有,腿,属事Belg)
④土壤含有水分和养料。(含有,水分,属事Belg)
-
所属对象是抽象的性质。
①他很有志气。(有,志气,属事Belg)
②人生有痛苦也有欢乐。(有,痛苦,属事Belg)
4.3.4.2类事Clas
类事Clas(classification)是事件中主体进行判断或隐性比较的对象、事件主体最终归类的状态。
-
事件主体进行判断或隐性比较的对象。
①弟弟是中学生。(是,中学生,类事Clas)
②这就是西部大开发的标志性工程青藏铁路。(是,工程,类事Clas)
③哥哥像狐狸。(像,狐狸,类事Clas)
-
事件主体最终归类的状态。
①雪化成了水。(化,水,类事Clas)
②新厂长拜老工人为师。(拜,师,类事Clas)
4.3.5客体角色小结¶
客体角色是与主体角色相对应的角色,是语义事件中另一个重要的参与实体。从粗粒度标注标签集来说,文本语义依存图标注规范规定了四种客体角色,分别是:受事PAT、客事CONT、涉事DATV、系事LINK。从细粒度标注标签集来说,规定了九种客体角色,分别是:受事Pat、客事Cont、涉事Datv、源事Orig、比较Comp、成事Prod、结局Cons、属事Belg以及类事Clas。
综上,我们已经对每一种客体角色的选取进行了分析,同样,我们将从聚合标准、组合标准以及语义标准对客体角色进行一系列的界定。由于细粒度标注标签集涉及到的语义角色数量多,不易进行区别性特征的比较,所以我们对客体角色的粗粒度标签进行比较。
下表是客体角色聚合标准:
表格 11客体角色聚合标准
聚合标准 | 受事 | 客事 | 涉事 | 系事 |
---|---|---|---|---|
作宾语 | + | + | + | + |
形容词谓语句 | - | - | + | - |
所有客体角色都能作宾语,这是相对于主体角色都能作主语而言,并不在内部具有区别特征。客体角色都能出现在动词谓语句中,而形容词谓语句情况略有不同。其中,涉事角色可以出现在形容词谓语句中,特指引入的比较对象,例如:
月亮比地球小。
下表是客体角色组合标准:
表格 12客体角色组合标准
组合标准 | 受事 | 客事 | 涉事 | 系事 |
---|---|---|---|---|
出现在介宾结构中 | - | - | + | + |
作句子的近宾语 | - | - | + | - |
作句子的远宾语 | - | + | - | + |
出现在心理活动动词后 | - | + | - | - |
出现在“V+成/完”形式后 | - | + | - | + |
出现在“V(了/一/不)V”形式后 | + | + | - | - |
出现在介词“把”后或“被”前 | + | - | - | - |
受事角色能够出现在上述6、7等句法环境中,例如:
①英子写不写作业?(写,作业,受事PAT)
②英子把作业写了。(写,作业,受事PAT)
③作业被英子写了。(写,作业,受事PAT)
客事角色能够出现在上述3、4、5、6等句法环境中,例如:
①张老师给学生讲历史。(讲,历史,客事CONT)
②姐姐喜欢文学作品。(喜欢,作品,客事CONT)
③主席给大家讲了讲今年的工作任务。(讲,任务,客事CONT)
涉事角色能够出现在上述1、2等句法环境中,例如:
①张老师给学生讲历史。(讲,学生,涉事DATV)
成事角色能够出现在上述5等句法环境中,例如:
①姐姐写完了一本小说。(写,小说,客事CONT)
系事角色能够出现在上述①③⑤等句法环境中,例如:
①新厂长拜老工人为师。(拜,师,系事LINK)
下表是客体角色语义标准:
表格 13客体角色语义标准
语义标准 | 受事 | 客事 | 涉事 | 系事 |
---|---|---|---|---|
被动 | + | + | - | - |
变化 | + | + | - | - |
完成 | + | + | - | - |
相关 | - | - | + | + |
来源 | - | - | + | - |
[被动]指客体参与者受支配,[完成]指客体参与者在受支配之后有完成一件事或者某个动作产生了某种结果,[来源]指客体参与者是动作行为的起初拥有者。
受事角色具有[被动+] [变化+] [完成+]特征,例如:
①不要嘲笑他。(嘲笑,他,受事PAT)
②他赠弟弟一支笔。(赠,弟弟,受事PAT)
客事角色具有[被动+] [变化+] [完成+]特征,例如:
①张老师给学生讲历史。(讲,历史,客事CONT)
②难民听到了炮声。(听,炮声,客事CONT)
③他写了一本小说。(写,小说,客事CONT)
涉事角色具有[相关+] [来源+]特征,例如:
①张老师给学生讲历史。(学生,讲,涉事DATV)
成事角色具有[变化+] [完成+]特征,例如:
①他写了一本小说。(写,小说,PROD)
系事角色具有[相关+]特征,例如:
①小宋有很多朋友。(有,朋友,系事LINK)
4.4情境角色¶
情境角色是事件涉及到的外围角色。在一个事件中,除了主体、客体等参与者之外,还有一系列情境因素,例如主体使用的工具、材料,事件发生的时间、空间,引起事件发生的原因、目的等。情境角色就是详细描述这些场景的角色。从粗粒度标标签集出发,共涉及十种情境角色,分别是:工具、材料、方式、范围、缘由、时间、空间、度量、状态以及修饰。
4.4.1工具TOOL¶
工具TOOL相对应的细粒度标注标签集只有工具Tool一种。
4.4.1.1工具Tool
工具角色Tool(Tool)是事件中所使用的工具。典型的工具角色由介词“用”等引出,也可不用介词引入,工具格通常是由物体充当,但是一些有生命的、或者是抽象的事物也可以作为事件所凭借的工具。例如:
①妈妈用砂锅熬稀饭。(熬,砂锅,工具Tool)
②绑匪用人质要挟。(要挟,人质,工具Tool)
③医生建议药物治疗。(治疗,药物,工具Tool)
4.4.2材料MATL¶
材料角色MATL相对应的细粒度标注标签集只有材料Matl一种。
4.4.2.1材料Matl
材料角色Matl(material)是事件中所使用的材料。典型的材料角色由介词“用”等引出,也可不用介词引入。例如:
①妈妈用小米熬稀饭。(熬,小米,材料Matl)
②学生们用纸折飞机。(折,纸,材料Matl)
注意:材料与工具不同,工具是事件发生的凭借,等事件结束后,其自身不受影响,不发生性质或位置的转变;而材料会发生变化。例如“妈妈用小米熬稀饭”中的“小米”是材料,因为,当“稀饭熬成”之后,“小米”的性质已经发生变化,而“妈妈用砂锅熬稀饭”中的“砂锅”是工具,因为当“稀饭熬成”后,“砂锅”自身并没有变化。
4.4.3方式MANN¶
方式角色MANN相对应的细粒度标注标签集有方式Mann和依据Accd两种。
4.4.3.1方式Mann
方式角色Mann(Manner)角色是事件中出现的方式、方法。典型的方式角色由介词“用、以”等引出,也可不用介词。可以表示主体的态度或方法,也可以表示行动的情形或样式。可以回答主体角色“怎么样”或者动作“怎么样”这一类的问题。
-
事件主体的态度或方法。
①妈妈用小火熬稀饭。(熬,小火,方式Mann)
②哥哥高高兴兴地走进门。(走,高高兴兴,方式Mann)
-
事件行动的情形或样式。
①诸葛亮吩咐军士齐声高喊。(高喊,齐声,方式Mann)
②足球慢慢地滚进空门。(滚,慢慢,方式Mann)
4.4.3.2依据Accd
依据角色Accd(according)角色是事件所依照的根据、凭借。典型的依据角色由“依照、按照”等词引出,并做为一个话题,放在句首。
①按照中国的传统观念,玉是圣洁的象征。(是,观念,依据Accd)
②依照说明书,他把电扇组装好了。(组装,说明书,依据Accd)
4.4.4范围SCO¶
范围SCO角色相对应的细粒度标注标签集只有范围Sco一种。
4.4.4.1范围Sco
范围Sco(scope)指的是事件中所关涉的方面、限定的界限、被审视的角度、发生作用的范围,通常都为抽象名词。根据不同的语义关系,一般由不同的介词引出,一般可以出现在“在……方面”、“在……角度上”、“在……中”的结构中。例如
①数学方面他是专家。(是,方面,范围Sco)
②这项技术在世界范围内得到应用。(得到,范围,范围Sco)
③临床上称其为肿瘤骨。(称,临床,范围Sco)
④染色体易位是造血系统肿瘤中常见的致病机制。(常见,造血系统肿瘤,范围Sco)
⑤此药主要用于重症和危重症。(用于,重症,范围Sco)
注意,范围角色不仅可以连接中枢论元和周边论元,也可以是周边论元之间的语义关系。有下面两种情况:
-
由指示代词“这、那”进行的限定或疑问代词“哪、什么”指代的范围。
①这场比赛处在最终阶段。(场,这,范围Sco)
②他把那笔钱打进我的银行了。(笔,那,范围Sco)
③走哪条路呢?(条,哪,范围Sco)
④那儿什么工具都有。(工具,什么,范围Sco)
-
“整”+数词/量词 表达足的意思时。
①明天我整40岁了。(岁,整,范围Sco)
②整整十本书。(本,整整,范围Sco)
4.4.5缘由REAS¶
缘由REAS角色相对应的细粒度标注标签集有缘故Reas和意图Int两种。
4.4.5.1缘故Reas
缘故Reas(reason)是引起事件发生或发展变化的原因。原因和结果都出现在一个单句中(以期与事件关系进行区别),原因一般由介词“由于、以”或连词“因为”引出。例如:
①我的脸由于羞愧涨得通红。(涨,羞愧,缘故Reas)
②他因为堵车迟到了。(迟到,堵车,缘故Reas)
③美沙酮中毒。(中毒,美沙酮,缘故Reas)
注意:这里的缘故角色主要是名词性短语充当的引起事件的原因,如果一个事件是另一个事件发生的原因,我们用事件关系来表达。详见5.3节。
4.4.5.2意图Int
意图Int(intention)是事件所要达到的目的。一般有介词“为了”引出。例如:
①他为了自己的健康,搬到海淀区居住。(搬,健康,意图Int)
②为了金牌他拼尽全力。(拼,金牌,意图Int)
注意:这里的意图角色主要是名词短语充当的引起事件的目的,如果一个事件是另一个事件发生的目的,我们用事件关系来标注。
4.4.6时间TIME¶
时间TIME事件发生的时间。在实际生活场景中,事件发生所涉及到的时间因素情形各异。所以,时间对应的细粒度标注标签集有5个,分别是:时间Time、时间起点Tini、时间终点Tfin、时段Tdur、时距Trang。
4.4.6.1时间Time
时间Time(time)指的是事件发生的时点或日期。可以变换成“……时”。
-
事件发生的时点。
①住校生6点吃饭。(吃饭,6点,时间Time)
②周一早上升旗。(升旗,早上,时间Time)
-
事件发生的日期。
①去年夏天,我从上海乘船到外婆家。(乘船,夏天,时间Time)
②该车建造于1885年。(建造,1885年,时间Time)
-
事件发生的时间频率。
①他有时给我干点儿零活。(干,有时,时间Time)
4.4.6.2时间起点Tini
时间起点Tini(Initial time)指的是事件起始的时间。经常由介词“从”引出,可以变换成“从……起”或者“……以来”。例如:
①从明天起,做一个幸福的人。(做,明天,时间起点Tini)
②建国以来政治运动就几乎没有停止过。(停止,建国,时间起点Tini)
4.4.6.3时间终点Tfin
时间终点Tfin(Final Time)指的是事件结束的事件。经常由介词“到、至”引出。例如:
①我们一直谈到深夜。(谈到,深夜,时间终点Tfin)
②昨天他从2点至5点跑了3小时。(跑,5点,时间终点Tfin)
4.4.6.4时段Tdur
时段Tdur(Time Duration)指的是事件进程所持续的时间段。例如:
①他当兵三年了(当兵,三年,时段Tdur)
②台湾近八年物价一直在上涨。(上涨,近八年,时段Tdur)
4.4.6.5时距Trang
时距Trang(Time Range)指的是自说话时间起到事件发生的时间段。注意时距与时段的区别,从时态逻辑上来讲,时距讲的是从说话时间起之后的时间,属于将来时态;而时段指过去的时间到现在,是过去时态。
①你两天后来取结果。(取,两天,时距Trang)
②再有三天学校就开学了。(开学,三天,时距Trang)
小结:根据场景的不同,时间TIME可以细化为多个语义角色。例如下句:
昨天,他从2点至5点跑了3个小时,今天还要再跑4个小时。
其中:“昨天”和“今天”是时间Time,“2点”是时间起点Tini,“5点”是时间终点Tfin,“3个小时”是时段Tdur,“4个小时”是时距Trang。但是在粗粒度标注层级上,都将它们标注为时间角色TIME。
4.4.7空间LOC¶
空间LOC是与事件发生时的处所。在实际生活场景中,事件所涉及到的空间因素情形多样。所以,相对应的细粒度标注标签集有5个,分别是:空间Loc、原处所Lini、终处所Lfin、通过处所Lthru、趋向Dir。
4.4.7.1空间Loc
空间Loc(location)指的是事件所在的自然空间。通常由介词“在”引出,并且可以变换为“在……上/里/内”等结构。例如:
①我在大学学习三年了。(学习,大学,空间Loc)
②暴风雨时我正在树下躲避。(躲避,树下,空间Loc)
注:空间标签通常会与范围标记同现,例如“病房附近的房间空着”(房间,病房,空间Loc)(病房,附近,范围标记mRang)
4.4.7.2原处所Lini
原处所Lini(Initial Location)表示空间位置改变时,事件发生的初始位置,一般由介词“从”引出。例如:
①我把他送出家门。(送出,家门,原处所Lini)
②从美国进口了一台计算机。(进口,美国,原处所Lini)
4.4.7.3终处所Lfin
终处所Lfin(Final Location)表示空间位置改变时,事件发生的结束位置,一般由介词“到”引出。例如:
①我明天去哈尔滨。(去,哈尔滨,终处所Lfin)
②代表团抵达雅典。(抵达,雅典,终处所Lfin)
4.4.7.4通过处所Lthru
通过处所Lthru(Location through)表示空间位置改变时,事件发生时从初始位置移动到结束位置之间的空间,一般出现在动词“经、过”等的后边。例如:
①他从北京经上海飞到香港。(经,上海,通过处所Lthru)
②火车正在过长江大桥。(过,长江大桥,通过处所Lthru)
4.4.7.5趋向Dir
趋向Dir(direction)表示空间位置改变时,事件中主体所面对的方向或者移动所趋向的方向,一般出现在“对、向。朝着”等词的后边。
-
静态主体所对的方向。
①这房子朝南。(朝,南,趋向Dir)
②天安门对着人民英雄纪念碑。(对,人民英雄纪念碑,趋向Dir)
-
动态主体运动的方向。
①客机飞向图书馆。(飞,图书馆,趋向Dir)
②部队奔向前方。(奔,前方,趋向Dir)
小结:根据场景的不同,空间3_Loc可以细化为不同的语义角色。例如下句:
他一路向南,从北京经上海飞到香港,在那里参加一场慈善拍卖会。
在这个句子中,“南”是趋向Dir,“北京”是原处所Lini,“上海”是通过处所Lthru,“香港”是终处所Lfin,“那”里是空间Loc。但是在粗粒度标签层级上都标注为空间角色LOC。
4.4.8度量MEAS¶
度量角色MEAS指事件中的数量,名量或动量。数词一律表示为数量角色,量词表示为数量短语。且数量短语的核心为量词,但是注意,只有在句子中,数量短语充当的近视数量词,才标为数量短语,若是数量短语担任其他主客体角色,则量词标为其他主客体角色。
相对应的细粒度标注标签集有7个,分别是:数量Quan、数量词组Qp、起始量Nini、终止量Nfin、变化量Nvar、频率Freq、顺序Seq。
4.4.8.1数量Quan
数量Quan(Quantity)指的是事件中主客体的数。就汉语的情况,可以是单纯的数值,也可以是数量短语。
-
单纯的没有量词的数值。
①一年有365天。(天,365,数量Quan)
②教室里有200人。(人,200,数量Quan )
-
名量词表数值。
①弟弟跑了四百米。(米,四百,数量Quan)
②同学们栽了三百捆树苗。(捆,三百,数量Quan)
-
动量词表次数。
①他来回跑了四趟。(趟,四,数量Quan)
②这部电影他看了三遍。(遍,三,数量Quan)
对于数量Quan的标注,有以下两点注意事项:
1 量词分为物量词和动量词两大类,其中物量词表示人和事物的计算单位,动量词表示动作次数和发生的时间。对于语义事件中的有些借用动量词,它们有可能会充当其他语义角色,例如:踢了两脚,“两脚”是“踢”的次数,同时也是“用脚踢”,即“脚”是“踢”的工具。但是由于依存弧上不可能标注为两个语义标签,所以,我们确立一个规则,即把它们标注为相应的语义角色。例如:
①公爵抽了农奴两鞭子。(抽,鞭子,工具Tool),(鞭子,两,数量角色Quan)
语义依存图标注结果如下图所示:
2 对于省略了数词仅有量词的情况,量词和所修饰核心词之间应标为数量词组。例如:
①我买了本书。(买,书,客事Pat),(书,本,数量词组Qp)
4.4.8.2数量词组Qp
数量词组Qp(quantity phrase)是由数词加上量词组成的表数量的短语。数量词组的核心词是量词。对于完整的数量短语“数词+量词+中心语”来说,中心语一般依附在结构外的核心成分上,而量词依附在中心语上,数词依附在量词上,细粒度标注标签分别为Qp和Quan,而粗粒度标签为MEAS。标注范式为:
数量词组往往会省略数词,只保留量词,我们依然将量词标注为数量词组角色Qp。例如:
①我买了本书。(书,本,数量词组Qp)
4.4.8.3起始量Nini
起始量Nini(initial number)表示数量、频率、顺序等变化的起始值。可以是基数词、也可以是序数词。
-
基数词表示起始量。
①产量从100吨增长到200吨。(增长,100吨,起始量Nini)
-
序数词表示起始量。
①成绩从第一降到第五。(降,第一,起始量Nini)
4.4.8.4终止量Nfin
终止量Nfin(final number)表示数量、频率、顺序等变化的终止值。可以是基数词,也可以是序数词。
-
基数词表示终止量。
①产量从100吨增长到200吨。(增长,200吨,终止量Nfin)
-
序数词表示终止量。
①成绩从第一降到第五。(降,第五,终止量Nfin)
4.4.8.5变化量Nvar
变化量Nvar(variable number)表示增加或减少的量。一般有基数词担任。
-
表示增加的变化量。
①产量从100吨增长到200吨,增加了100吨。(增加,100吨,变化量Nvar)
-
表示减少的变化量。
①成绩从第一降到第五,下降了4名。(下降,4名,变化量Nvar)
4.4.8.6频率Freq
频率Freq(Frequency)表示时间发生的频次。由一些副词或者是每+数量短语作为标记,表示频率。例如:
①他经常来我家。(来,经常,频率Freq)
②这个药每六小时服一片。(服,六小时,频率Freq)
4.4.8.7顺序Seq
顺序Seq(Sequence)是表示事件发生的顺序或所处的阶段。一般有序数词或表阶段性的词语担任顺序角色。例如:
①他第一个到达终点。(个,第一,顺序Seq)
②他跑第一。(跑,第一,顺序Seq)
③这种疗法初步显示出抗癌性。(显示,初步,顺序Seq)
4.4.9状态STAT¶
状态STAT角色表示事件发生时的情形、状态等。相对应的细粒度标注标签集有4个,分别是:状态Stat、起始状态Sini、终止状态Sfin以及历经状态Sproc。
4.4.9.1状态Stat
状态Stat(state)表示实体在事件发生时所处的自身状态或外部环境境况。常出现在“在……中”结构中。例如:
①他在逆境中拼搏。(拼搏,逆境,状态Stat)
②许多女工生活在水深火热之中。(生活,水深火热,状态Stat)
③正常情况下是可以痊愈的。(痊愈,情况,状态Stat)
4.4.9.2起始状态Sini
起始状态Sini(Initial State)是事件发生的初始状态。常由介词“从”引出。例如:
①人类是从类人猿进化来的吗?(进化,类人猿,起始状态Sini)
②计算机把英语翻译成汉语。(翻译,英语,起始状态Sini)
4.4.9.3终止状态Sfin
终止状态Sfin(Final State)是事件发生的结束状态。例如:
①计算机把英语翻译成汉语。(翻译,汉语,终止状态Sfin)
②这是一条从失败到胜利的路。(到,胜利,终止状态Sfin)
4.4.9.4历经状态Sproc
历经状态Sproc(State Process)是事件发生时所处的状态或经历的所有状态。例如:
①他经过考试被录用了。(录用,考试,历经状态Sproc)
②他经历了千辛万苦终于到达山顶。(到达,千辛万苦,历经状态Sproc)
③治疗的过程中呈黄色。(呈,过程,历经状态Sproc)
4.4.10修饰FEAT¶
修饰角色FEAT(feature)与上述角色不同。上述角色描写的基本上都是周边论元与中枢论元的关系,但是修饰角色不是。严格来说,修饰角色不属于周边论元,但是在实际标注工作中,这些成分对于整个事件的语义也有影响,经过我们的总结归纳,修饰角色对应的细粒度标注标签集四种,分别是:描写Desc、宿主Host、名词修饰语Nmod和时间修饰语Tmod。
4.4.10.1描写角色Desc
描写角色Desc(description)表达的是一种特征。具体来说,有以下语义类别:
-
一些出现在动词后面充当补语的成分,经常用来描述谓词状态,主体的特征等。
①他长得很胖。(长,胖,描写Desc)
②张红跑得很快。(跑,快,描写Desc)
-
如果周边论元的添加部分是描述事物特征的形容词,也标为Feat。
①漂亮的女孩。(女孩,漂亮,描写Desc)
②绿色的书包。(书包,绿色,描写Desc)
-
专门的界定概念,核心部分是指称概念,添加部分的角色都是“描写”。多为区别词。
①大型机床。(机床,大型,描写Desc)
②慢性疾病。(疾病,慢性,描写Desc)
③重度烧伤。(烧伤,重度,描写Desc)
④相应的措施。(措施,相应,描写Desc)
4.4.10.2宿主角色Host
宿主角色Host(Host)是属性的主体,或带有意义、功能、作用、价值的主体,通常出现的名词短语中。
①桌子的高度。(高度,桌子,宿主Host)
②住房面积。(面积,住房,宿主Host)
③教育的意义是让人找到自身的价值。(意义,教育,宿主Host)(价值,自身,宿主Host)
④关节功能。(功能,关节,宿主Host)
4.4.10.3名称修饰语Nmod
名称修饰语Nmod(Name Modified)通常指带有特定名字的修饰语,多是对命名实体的标注。例如:
①果戈里大街。(大街,果戈里,名称修饰语Nmod)
②史密斯先生。(先生,史密斯,名称修饰语Nmod)
4.4.10.4时间修饰语Tmod
时间修饰语Tmod(Time Modified)指出现在时间短语中的修饰成分。例如:
①十一月三十日。(三十日,十一月,时间修饰语Tmod)
②星期一上午。(上午,星期一,时间修饰语Tmod)
4.4.11情境角色小结¶
情境角色是对现实世界的细致描绘,想要细致的了解句子语义事件所包含的意义,必须对各种场景进行标注,才能达到使计算机深层理解人类语言的目的。同样,我们也对情境角色进行了三个层面上的比较。在聚合标准和语义标准的层面上,情境角色之间虽然差别不大,但是不易混淆,在组合标准上,情境角色之间的主要差异在于和介词的搭配。
第一组:方式、工具、材料、范围、缘由。
表格 14情境角色组合标准1
组合标准 | 方式 | 工具 | 材料 | 范围 | 缘由 |
---|---|---|---|---|---|
出现在介词“用”后 | + | + | + | - | - |
出现在介词“在”后 | - | - | - | + | - |
出现在介词“为”后 | - | - | - | - | + |
“在+范围”和“为+缘由”以介词为标记,区别特征明显,但是方式角色、工具角色和材料角色都可以出现在介词“用”的后边,三者差异不显著。在实际语料中,方式角色、工具角色以及材料角色还有其他出现的语言特征,这里我们只对介词后的情况进行对比。
第二组:状态、起始状态、终止状态、历经状态。
表格 15情境角色组合标准2
组合标准 | 状态 | 起始状态 | 终止状态 | 历经状态 |
---|---|---|---|---|
出现在介词“在”后 | + | - | - | - |
出现在介词“自/从”后 | - | + | - | - |
出现在介词“到”后 | - | - | + | - |
由表可知,这些不同状态差异明显,“在+状态”,“从+起始状态”,“到+终止状态”,历经状态没有介词标记。同理,这三类介词标记可以拓展到时间角色(时间、时间起点,时间终点,时距)、空间角色(空间、原处所、终处所、通过处所)、度量(数量、起始量、终止量、数量短语)。
4.5小结¶
综上所述,是文本语义依存图结构标注规范关于语义周边角色标注细则的说明。我们需要在这里对一些需要强调的地方再进行一次总结说明:
-
语义周边角色的标注细则,主要讲述的是在文本语义事件中,每一种周边论元的界定以及它们与中枢论元存在何种语义关系;
-
我们规定的语义周边角色有一个整体框架:即主体角色、客体角色以及情境角色。分为两个颗粒度:其中粗粒度标注标签集有17种,细粒度标注标签集有45种。详情请参见附表。
-
对于一些易混淆的语义角色,从三个角度对它们进行了区分,分别是聚合标准、组合标准和语义标准,以期在语义标签界限不甚分明的时候,能够起到区分作用。
对于第一版语料库中各语义周边角色的分布状态,我们也做了统计,相应的出现频次如下表:
表格 16语义周边角色频次统计表
语义周边角色标签 | 频次 | 语义周边角色标签 | 频次 |
---|---|---|---|
施事 | 23582 | 时间 | 7407 |
当事 | 24697 | 时间起点 | 218 |
感事 | 4728 | 时间终点 | 223 |
领事 | 12571 | 时距 | 1655 |
受事 | 8907 | 时段 | 37 |
客事 | 11222 | 空间 | 9755 |
成事 | 2173 | 原处所 | 441 |
源事 | 292 | 终处所 | 1721 |
涉事 | 8212 | 通过处所 | 248 |
比较 | 736 | 趋向 | 1505 |
属事 | 2720 | 范围 | 8191 |
类事 | 6267 | 数量 | 13268 |
结局 | 823 | 数量短语 | 10078 |
依据 | 514 | 变化量 | 190 |
缘由 | 740 | 起始量 | 46 |
意图 | 34 | 终止量 | 181 |
方式 | 5883 | 频率 | 424 |
工具 | 623 | 顺序 | 1331 |
材料 | 299 | 修饰 | 29069 |
状态 | 294 | 宿主 | 846 |
起始状态 | 157 | 名称修饰语 | 7845 |
终止状态 | 122 | 时间修饰语 | 1211 |
历经状态 | 176 |
语义周边角色是对语义事件事件中的参与者等成分进行的标注,它十分重要。对于它的标注,是整个标注过程的关键部分,是语义理解的直接体现,也是对于反关系、嵌套事件关系标注的基础。