836词性标注集 ltp采用
来自ling
==
https://github.com/HIT-SCIR/ltp/blob/master/docs/appendix.rst#%E9%99%84%E5%BD%95
附录
附录
词性标注集
-----------
LTP 使用的是863词性标注集,其各个词性含义如下表。
+-----+---------------------+------------+-----+-------------------+------------+
| Tag | Description | Example | Tag | Description | Example |
+=====+=====================+============+=====+===================+============+
| a | adjective | 美丽 | ni | organization name | 保险公司 |
+-----+---------------------+------------+-----+-------------------+------------+
| b | other noun-modifier | 大型, 西式 | nl | location noun | 城郊 |
+-----+---------------------+------------+-----+-------------------+------------+
| c | conjunction | 和, 虽然 | ns | geographical name | 北京 |
+-----+---------------------+------------+-----+-------------------+------------+
| d | adverb | 很 | nt | temporal noun | 近日, 明代 |
+-----+---------------------+------------+-----+-------------------+------------+
| e | exclamation | 哎 | nz | other proper noun | 诺贝尔奖 |
+-----+---------------------+------------+-----+-------------------+------------+
| g | morpheme | 茨, 甥 | o | onomatopoeia | 哗啦 |
+-----+---------------------+------------+-----+-------------------+------------+
| h | prefix | 阿, 伪 | p | preposition | 在, 把 |
+-----+---------------------+------------+-----+-------------------+------------+
| i | idiom | 百花齐放 | q | quantity | 个 |
+-----+---------------------+------------+-----+-------------------+------------+
| j | abbreviation | 公检法 | r | pronoun | 我们 |
+-----+---------------------+------------+-----+-------------------+------------+
| k | suffix | 界, 率 | u | auxiliary | 的, 地 |
+-----+---------------------+------------+-----+-------------------+------------+
| m | number | 一, 第一 | v | verb | 跑, 学习 |
+-----+---------------------+------------+-----+-------------------+------------+
| n | general noun | 苹果 | wp | punctuation | ,。! |
+-----+---------------------+------------+-----+-------------------+------------+
| nd | direction noun | 右侧 | ws | foreign words | CPU |
+-----+---------------------+------------+-----+-------------------+------------+
| nh | person name | 杜甫, 汤姆 | x | non-lexeme | 萄, 翱 |
+-----+---------------------+------------+-----+-------------------+------------+
命名实体识别标注集
-------------------
LTP中的NE 模块识别三种NE,分别如下:
+------+--------+
| 标记 | 含义 |
+======+========+
| Nh | 人名 |
+------+--------+
| Ni | 机构名 |
+------+--------+
| Ns | 地名 |
+------+--------+
语义角色类型
------------
+----------+-------------------------+----------------------+-----------------------------------------------------------------------+
| 关系类型 | Tag | Description | Example |
+==========+=========================+======================+=======================================================================+
| ARG0 | causers or experiencers | 施事者、主体、触发者 | [政府 ARG0]鼓励个人投资服务业。 |
+----------+-------------------------+----------------------+-----------------------------------------------------------------------+
| ARG1 | patient | 受事者 | 政府鼓励[个人 ARG1]投资服务业。 |
+----------+-------------------------+----------------------+-----------------------------------------------------------------------+
| ARG2 | range | 语义角色2 | 政府鼓励个人[投资服务业 ARG2]。 |
+----------+-------------------------+----------------------+-----------------------------------------------------------------------+
| ARG3 | starting point | 语义角色3 | 巴基斯坦[对谈判前景 ARG3]表示悲观。 |
+----------+-------------------------+----------------------+-----------------------------------------------------------------------+
| ARG4 | end point | 语义角色4 | 产检部门将产检时间缩短到[一至三天 ARG4]。 |
+----------+-------------------------+----------------------+-----------------------------------------------------------------------+
| ADV | adverbial | 状语 | 我们[即将 ADV]迎来新年。 |
+----------+-------------------------+----------------------+-----------------------------------------------------------------------+
| BNF | beneficiary | 受益人 | 义务[为学童及老师 BNF]做超音波检查 。 |
+----------+-------------------------+----------------------+-----------------------------------------------------------------------+
| CND | condition | 条件 | [如果早期发现 CND],便能提醒当事人注意血压的变化。 |
+----------+-------------------------+----------------------+-----------------------------------------------------------------------+
| CRD | coordinated arguments | 并列 | 跟南韩、[跟美国 CRD]谋求和平关系的举动也更加积极。 |
+----------+-------------------------+----------------------+-----------------------------------------------------------------------+
| DGR | degree | 程度 | 贫铀弹含有放射性比铀强[20万倍 DGR]。 |
+----------+-------------------------+----------------------+-----------------------------------------------------------------------+
| DIR | direction | 方向 | [从此处 DIR] 我们可以发现寇克斯报告的精髓。 |
+----------+-------------------------+----------------------+-----------------------------------------------------------------------+
| DIS | discourse marker | 会话标记 | 警方上午针对目击者做笔录,[而 DIS]李士东仍然不见踪影。 |
+----------+-------------------------+----------------------+-----------------------------------------------------------------------+
| EXT | extent | 范围 | 回归3年多[来 EXT] ,香港成为台商对大陆贸易的财务运作及资金调度中心。 |
+----------+-------------------------+----------------------+-----------------------------------------------------------------------+
| FRQ | frequency | 频率 | 这类听证会在赖昌兴拘押期间每30天举行[一次 FRQ]。 |
+----------+-------------------------+----------------------+-----------------------------------------------------------------------+
| LOC | locative | 地点 | 请听美国之音特邀记者康妮[在加拿大温哥华 LOC]发来的报道。 |
+----------+-------------------------+----------------------+-----------------------------------------------------------------------+
| MNR | manner | 方式 | 以便他能继续[作为俄罗斯官员 MNR]从事他在一个特殊机构中的工作。 |
+----------+-------------------------+----------------------+-----------------------------------------------------------------------+
| PRP | purpose or reason | 目的 | 执政党和在野党[为了应付这场攻守战 PRP]都发出了紧急动员令。 |
+----------+-------------------------+----------------------+-----------------------------------------------------------------------+
| QTY | quantity | 数量 | 每年创汇[100万 QTY]美元。 |
+----------+-------------------------+----------------------+-----------------------------------------------------------------------+
| TMP | temporal | 时间 | [下星期 TMP]布什将提出一项周密计划。 |
+----------+-------------------------+----------------------+-----------------------------------------------------------------------+
| TPC | topic | 话题 | [这么大的事情 TPC],你怎么不和我说? |
+----------+-------------------------+----------------------+-----------------------------------------------------------------------+
| PRD | predicate | 谓语动词 | |
+----------+-------------------------+----------------------+-----------------------------------------------------------------------+
| PSR | possessor | 持有者 | |
+----------+-------------------------+----------------------+-----------------------------------------------------------------------+
| PSE | possessee | 被持有 | |
+----------+-------------------------+----------------------+-----------------------------------------------------------------------+
依存句法关系
---------------------
+------------+-----+---------------------------+----------------------------+
| 关系类型 | Tag | Description | Example |
+============+=====+===========================+============================+
| 主谓关系 | SBV | subject-verb | 我送她一束花 (我 <-- 送) |
+------------+-----+---------------------------+----------------------------+
| 动宾关系 | VOB | 直接宾语,verb-object | 我送她一束花 (送 --> 花) |
+------------+-----+---------------------------+----------------------------+
| 间宾关系 | IOB | 间接宾语,indirect-object | 我送她一束花 (送 --> 她) |
+------------+-----+---------------------------+----------------------------+
| 前置宾语 | FOB | 前置宾语,fronting-object | 他什么书都读 (书 <-- 读) |
+------------+-----+---------------------------+----------------------------+
| 兼语 | DBL | double | 他请我吃饭 (请 --> 我) |
+------------+-----+---------------------------+----------------------------+
| 定中关系 | ATT | attribute | 红苹果 (红 <-- 苹果) |
+------------+-----+---------------------------+----------------------------+
| 状中结构 | ADV | adverbial | 非常美丽 (非常 <-- 美丽) |
+------------+-----+---------------------------+----------------------------+
| 动补结构 | CMP | complement | 做完了作业 (做 --> 完) |
+------------+-----+---------------------------+----------------------------+
| 并列关系 | COO | coordinate | 大山和大海 (大山 --> 大海) |
+------------+-----+---------------------------+----------------------------+
| 介宾关系 | POB | preposition-object | 在贸易区内 (在 --> 内) |
+------------+-----+---------------------------+----------------------------+
| 左附加关系 | LAD | left adjunct | 大山和大海 (和 <-- 大海) |
+------------+-----+---------------------------+----------------------------+
| 右附加关系 | RAD | right adjunct | 孩子们 (孩子 --> 们) |
+------------+-----+---------------------------+----------------------------+
| 独立结构 | IS | independent structure | 两个单句在结构上彼此独立 |
+------------+-----+---------------------------+----------------------------+
| 核心关系 | HED | head | 指整个句子的核心 |
+------------+-----+---------------------------+----------------------------+
语义依存关系
-------------------
+-------------+----------------------------------------------------------------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| 角色系统 | 标签表示 | 概念说明&举例 |
+====+========+======================================================================+==============================================================================================================================================================================================================================================================================================+
| 语 | 主体 | 施事 | 指发出具体行为动作的主体或动作持续以及表现心理活动的有意识的主体,具有主观能动性。如:明天我将去看他。(看,我,施事AGT) |
| 义 | 角色 | AGT | |
| 周 | +----------------------------------------------------------------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| 边 | | 当事 | 指非行为动作的发出者,不具有主观能动性。包括无意识运动的主体、非可控运动的主体以及各种关系的主体。如:宝塔很高。(高,宝塔,当事EXP) |
| 角 | | EXP | |
| 色 +--------+----------------------------------------------------------------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| | 客体 | 受事 | 指受主体的行为动作所改变的直接客体。一般与施事相对应,是受施事影响而导致位置、性质、结果等发生改变的对象,最明显的语义特征是具有被动性。如:从桌子上把书拿走。(拿走,书,受事PAT) |
| | 角色 | PAT | |
| | +----------------------------------------------------------------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| | | 客事 | 指事件所涉及但是并未改变的客体以及动作行为产生的新事物或结果。如:我相信苏珊的话。(相信,话,客事CONT) |
| | | CONT | |
| | +----------------------------------------------------------------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| | | 涉事 | 也称与事,是动作行为的非主动参与者,也可以说,涉事角色是语义事件的第三方参与者。从语义上说,是事件接受者、伴随者、来源者以及比较的基准等等;从句法上说,经常出现在双宾语句中的间接宾语位置。如:班长给他一套工具。(给,他,涉事DATV) |
| | | DATV | |
| | +----------------------------------------------------------------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| | | 系事 | 是跟事件的参与者有关系的客体。一般由表示某种关联的动词连接主客体,表达主客体之间的某种具体的、或抽象的关系。如:弟弟是中学生。(是,中学生,系事LINK) |
| | | LINK | |
| +--------+----------------------------------------------------------------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| | 情境 | 工具 | 是事件中所使用的工具。典型的工具角色主要由介词“用”等引出,通常是由物体充当,但是一些有生命的、或者是抽象的事物也可以作为事件所凭借的工具。如:妈妈用砂锅熬稀饭。(熬,砂锅,工具TOOL) |
| | 角色 | TOOL | |
| | +----------------------------------------------------------------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| | | 材料 | 是事件中所使用的材料。如:学生们用纸折飞机。(折,纸,材料MATL) |
| | | MATL | |
| | +----------------------------------------------------------------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| | | 方式 | 包括事件中出现的方式、方法以及事件所依照的根据、凭借。如:军士齐声高喊。(高喊,齐声,方式MANN) |
| | | MANN | |
| | +----------------------------------------------------------------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| | | 范围 | 指事件中所关涉的方面、限定的界限、被审视的角度、发生作用的范围,通常都为抽象名词。一般由不同的介词引出,可以出现在“在……方面”、“在……角度上”、“在……中”等的结构中。如:数学方面他是专家。(是,方面,范围SCO) |
| | | SCO | |
| | +----------------------------------------------------------------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| | | 缘由 | 包括引起事件发生或发展变化的原因以及事件所要达到的目的。如:他因为堵车迟到了。(迟到,堵车,缘由REAS) |
| | | REAS | |
| | +----------------------------------------------------------------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| | | 时间 | 指事件发生所涉及到的各种时间因素。如:周一早上升旗。(升旗,早上,时间TIME) |
| | | TIME | |
| | +----------------------------------------------------------------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| | | 空间 | 指事件所涉及到的各种空间因素。如:我明天去哈尔滨。(去,哈尔滨,空间LOC) |
| | | LOC | |
| | +----------------------------------------------------------------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| | | 度量 | 指事件中的数量,名量或动量。如:一年有365天。(天,365,度量MEAS) |
| | | MEAS | |
| | +----------------------------------------------------------------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| | | 状态 | 表示事件发生时的情形、状态等。如:人类是从类人猿进化来的吗?。(进化,类人猿,状态STAT) |
| | | STAT | |
| | +----------------------------------------------------------------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| | | 修饰FEAT | 包括描写主体属性、特征的标签以及、时间修饰语和名词修饰语的标签。如:她是个漂亮的女孩。(女孩,漂亮,修饰FEAT) |
+----+--------+----------------------------------------------------------------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| 语 | 反关系 | 反关系指,当述谓概念转位修饰指称概念时,其述谓性质消失,增添了修饰性质,与中心语的关系相当于句法上的定中关系。需要注意的是,虽反关系的句法结构有变化,但是待标成分所充当的语义角色却是一样的。举例来说:①选手受伤了。(受伤,选手,当事EXP)②受伤的选手。(选手,受伤,反当事rEXP)反关系标签统一表示为r+语义周边角色标签,如rEXP,rLOC等等,此处不一一列举。 |
| 义 +--------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| 结 | 嵌套 | 一个事件作为一个整体概念被嵌套进另一个主体事件内,被嵌套的事件称为“降级”事件。有两种情况:1. 被嵌套的事件相当于一个论元。爷爷看见小孙女在操作计算机。(看见,操作,嵌套客事dCONT)2. 被嵌套的事件相当于一个修饰成分。爷爷拍摄了小孙女在操作计算机的照片。(照片,操作,嵌套客事dCONT)嵌套关系标签统一表示为d+语义周边角色标签,如dCONT,dPAT等等,此处不一一列举。 |
| 构 | 关系 | |
| 关 +--------+----------------------------------------------------------------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| 系 | 事件 | 并列关系eCOO | 指两个或多个平行的语义事件,重在叙述和描写。如:兄弟俩边走边说。(走,说,并列eCOO) |
| | 关系 +----------------------------------------------------------------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| | | 先行关系ePREC | 指在时间、空间上发生有序的事件或在逻辑、语义上关联性较强的先行发生的事件。如:要想成功,就要努力。(成功,努力,先行ePREC) |
| | +----------------------------------------------------------------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| | | 后继关系eSUCC | 主要描述语义上更进一步的结果类事件,包括时间、空间或逻辑、语义上后续发生的事件。如:他穿好衣服,走出门去。(穿,走,后继eSUCC) |
+----+--------+----------------------------------------------------------------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| 语 | 标点 | 标点标记mPUNC | 是对语义事件中的出现的标点符号的标注。如:他喜欢音乐。(喜欢,句号。,mPUNC) |
| 义 | 标记 | | |
| 依 +--------+----------------------------------------------------------------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| 附 | 依附 | 否定标记mNEG | 是对事件中否定关系的标记。如:她不像她母亲。(像,不,mNEG) |
| 标 | 标记 +----------------------------------------------------------------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| 记 | | 关系标记mRELA | 是对句法事件中各种关系的标记,如一些连词、介词等。如:但是我没有放弃看书。(放弃,但是,mRELA) |
| | +----------------------------------------------------------------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| | | 依附标记mDEPD | 是概念或事件的语义依附的形式标记,如一些助词。如:他在这里住了三十年。(住,了,mDEPD) |
+----+--------+----------------------------------------------------------------------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
哈工大ltp词性列表
Tag Description Example
a adjective 美丽
b other noun-modifier 大型, 西式
c conjunction 和, 虽然
d adverb 很
e exclamation 哎
g morpheme 茨, 甥
h prefix 阿, 伪
i idiom 百花齐放
j abbreviation 公检法
k suffix 界, 率
m number 一, 第一
n general noun 苹果
nd direction noun 右侧
nh person name 杜甫, 汤姆
ni organization name 保险公司
nl location noun 城郊
ns geographical name 北京
nt temporal noun 近日, 明代
nz other proper noun 诺贝尔奖
o onomatopoeia 哗啦
p preposition 在, 把
q quantity 个
r pronoun 我们
u auxiliary 的, 地
v verb 跑, 学习
wp punctuation ,。!
ws foreign words CPU
x non-lexeme 萄, 翱
标签 | 描述 | 含义 | 标签 | 描述 | 含义 |
---|---|---|---|---|---|
a | adjective | 形容词 | ni | organization name | 机构名 |
b | other noun-modifier | 其他名词修饰词 | nl | lacation name | 位置名词 |
c | conjunction | 连词 | ns | geographical name | 地点名词 |
d | adverb | 副词 | nt | temporal noun | 时间名词 |
e | exclamation | 叹词 | nz | other proper noun | 其他专有名词 |
g | morpheme | 语素 | o | onomatopoeia | 拟声词 |
h | prefix | 前缀 | p | preposition | 介词,前置词 |
i | idiom | 成语、习语 | q | quantity | 量词 |
j | abbreviation | 缩写 | r | pronoun | 代词 |
k | suffix | 后缀 | u | auxiliary | 助词 |
m | number | 数字 | v | verb | 动词 |
n | general noun | 一般名词 | wp | punctuation | 标点 |
nd | direction noun | 方位名词 | ws | foreign words | 外文词 |
nh | person name | 人名 | x | non-lexeme | 非词根 |
ICTCLAS 词性列表
jieba的词性标注与ICTCLAS相近; 哈工大的pyltp使用哈工大的词性列表
POS = {
"n": { # 1. 名词 (1个一类,7个二类,5个三类)
"n": "名词",
"nr": "人名",
"nr1": "汉语姓氏",
"nr2": "汉语名字",
"nrj": "日语人名",
"nrf": "音译人名",
"ns": "地名",
"nsf": "音译地名",
"nt": "机构团体名",
"nz": "其它专名",
"nl": "名词性惯用语",
"ng": "名词性语素"
},
"t": { # 2. 时间词(1个一类,1个二类)
"t": "时间词",
"tg": "时间词性语素"
},
"s": { # 3. 处所词(1个一类)
"s": "处所词"
},
"f": { # 4. 方位词(1个一类)
"f": "方位词"
},
"v": { # 5. 动词(1个一类,9个二类)
"v": "动词",
"vd": "副动词",
"vn": "名动词",
"vshi": "动词“是”",
"vyou": "动词“有”",
"vf": "趋向动词",
"vx": "形式动词",
"vi": "不及物动词(内动词)",
"vl": "动词性惯用语",
"vg": "动词性语素"
},
"a": { # 6. 形容词(1个一类,4个二类)
"a": "形容词",
"ad": "副形词",
"an": "名形词",
"ag": "形容词性语素",
"al": "形容词性惯用语"
},
"b": { # 7. 区别词(1个一类,2个二类)
"b": "区别词",
"bl": "区别词性惯用语"
},
"z": { # 8. 状态词(1个一类)
"z": "状态词"
},
"r": { # 9. 代词(1个一类,4个二类,6个三类)
"r": "代词",
"rr": "人称代词",
"rz": "指示代词",
"rzt": "时间指示代词",
"rzs": "处所指示代词",
"rzv": "谓词性指示代词",
"ry": "疑问代词",
"ryt": "时间疑问代词",
"rys": "处所疑问代词",
"ryv": "谓词性疑问代词",
"rg": "代词性语素"
},
"m": { # 10. 数词(1个一类,1个二类)
"m": "数词",
"mq": "数量词"
},
"q": { # 11. 量词(1个一类,2个二类)
"q": "量词",
"qv": "动量词",
"qt": "时量词"
},
"d": { # 12. 副词(1个一类)
"d": "副词"
},
"p": { # 13. 介词(1个一类,2个二类)
"p": "介词",
"pba": "介词“把”",
"pbei": "介词“被”"
},
"c": { # 14. 连词(1个一类,1个二类)
"c": "连词",
"cc": "并列连词"
},
"u": { # 15. 助词(1个一类,15个二类)
"u": "助词",
"uzhe": "着",
"ule": "了 喽",
"uguo": "过",
"ude1": "的 底",
"ude2": "地",
"ude3": "得",
"usuo": "所",
"udeng": "等 等等 云云",
"uyy": "一样 一般 似的 般",
"udh": "的话",
"uls": "来讲 来说 而言 说来",
"uzhi": "之",
"ulian": "连 " # (“连小学生都会”)
},
"e": { # 16. 叹词(1个一类)
"e": "叹词"
},
"y": { # 17. 语气词(1个一类)
"y": "语气词(delete yg)"
},
"o": { # 18. 拟声词(1个一类)
"o": "拟声词"
},
"h": { # 19. 前缀(1个一类)
"h": "前缀"
},
"k": { # 20. 后缀(1个一类)
"k": "后缀"
},
"x": { # 21. 字符串(1个一类,2个二类)
"x": "字符串",
"xx": "非语素字",
"xu": "网址URL"
},
"w": { # 22. 标点符号(1个一类,16个二类)
"w": "标点符号",
"wkz": "左括号", # ( 〔 [ { 《 【 〖 〈 半角:( [ { <
"wky": "右括号", # ) 〕 ] } 》 】 〗 〉 半角: ) ] { >
"wyz": "全角左引号", # “ ‘ 『
"wyy": "全角右引号", # ” ’ 』
"wj": "全角句号", # 。
"ww": "问号", # 全角:? 半角:?
"wt": "叹号", # 全角:! 半角:!
"wd": "逗号", # 全角:, 半角:,
"wf": "分号", # 全角:; 半角: ;
"wn": "顿号", # 全角:、
"wm": "冒号", # 全角:: 半角: :
"ws": "省略号", # 全角:…… …
"wp": "破折号", # 全角:—— -- ——- 半角:--- ----
"wb": "百分号千分号", # 全角:% ‰ 半角:%
"wh": "单位符号" # 全角:¥ $ £ ° ℃ 半角:$
}
}
中科院(nlpir、ictcla)词性标注集与哈工大(ltp)词性标注集对照表
dic = {
'n': 'n',
'nr': 'nh',
'nr1': 'nh',
'nr2': 'nh',
'nrf': 'nh',
'nrj': 'nh',
'ns': 'ns',
'nsf': 'ns',
'nt': 'ni',
'nz': 'nz',
'nl': 'n',
'ng': 'n',
't': 'nt',
'tg': 'nt',
's': 'nl',
'f': 'nd',
'v': 'v',
'vd':'n',
'vn': 'v',
'vshi':'v',
'vyou':'v',
'vf':'v',
'vx':'v',
'vi':'n',
'vl':'n',
'vg':'n',
'a': 'a',
'ad': 'd',
'an': 'a',
'ag': 'a',
'al': 'a',
'b': 'b',
'bl': 'b',
'z': 'n',
'r': 'r',
'rr': 'r',
'rz': 'r',
'rzt': 'nt',
'rzs': 'nl',
'rzv': 'v',
'ry': 'r',
'ryt': 'nt',
'rys': 'nl',
'ryv': 'v',
'rg ': 'r',
'm': 'm',
'mq': 'm',
'q': 'q',
'qv': 'q',
'qt': 'q',
'd': 'd',
'p' : 'p',
'pba' : 'p',
'pbei' : 'p',
'c': 'c',
'cc': 'c',
'u': 'u',
'uzhe': 'u',
'ule': 'u',
'uguo': 'u',
'ude1': 'u',
'ude2': 'u',
'ude3': 'u',
'usuo': 'u',
'udeng': 'u',
'uyy': 'u',
'udh': 'u',
'uls': 'u',
'uzhi': 'u',
'ulian': 'u',
'e': 'e',
'y': 'e',
'o': 'o',
'h': 'h',
'k': 'k',
'x': 'nz',
'xe': 'nz',
'xs': 'nz',
'xm': 'nz',
'xu': 'nz',
'w': 'wp',
'wkz':'wp',
'wky': 'wp',
'wyz':'wp',
'wyy': 'wp',
'wj':'wp',
'ww': 'wp',
'wt': 'wp',
'wd':'wp',
'wf':'wp',
'wn':'wp',
'wm': 'wp',
'ws': 'wp',
'wp': 'wp',
'wb': 'wp',
'wh': 'wp',
'g': 'g',
'l': 'i',
'R': 'h',
}