这是 perluniprops 命令,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
perluniprops - Perl 中 Unicode 版本 7.0.0 字符属性的索引
商品描述
本文档提供有关处理 Unicode 数据库部分的信息
具有字符属性,即在单个代码点上定义的部分。
(下面的“Unicode 数据库中的其他信息”简要提到了其他数据
Unicode 提供。)
Perl 可以提供对所有非临时 Unicode 字符属性的访问,尽管不能
默认情况下全部启用。 省略的是 Unihan 属性(可通过
CPAN 模块 Unicode::Unihan) 和某些已弃用或 Unicode 内部属性。
(安装可以选择重新编译 Perl 的表来改变这一点。参见“Unicode
Perl 不接受的字符属性”。)
大多数情况下,从 Perl 核心访问 Unicode 属性是通过常规的
表达式匹配,如下一节所述。 出于某些特殊目的,以及
访问不适合正则表达式匹配的属性,所有的
Perl 处理的 Unicode 字符属性可通过标准访问
Unicode::UCD 模块,如“属性可通过
Unicode::UCD”。
Perl 还为 Unicode 提供了一些额外的扩展和缩写的同义词
属性。
本文档仅列出所有可用的属性,并不试图解释什么
每个属性的真正含义。 每个 Perl 扩展都有简短的描述; 看
perlunicode 中的“其他属性”以获取有关这些的更多信息。 有一些细节
关于 perlunicode 中的块、脚本、General_Category 和 Bidi_Class,但要找出
有关官方 Unicode 属性的复杂性,请参阅 Unicode 标准。
一个好的起点是http://www.unicode.org/reports/tr44/>.
请注意,您可以定义自己的属性; 参见“用户定义的字符属性”
代码。
查看房源 无障碍 通过 “\p{}” 和 "\P{}"
Perl 正则表达式 "\p{}" 和 "\P{}" 构造允许访问大多数
Unicode 字符属性。 下表显示了所有这些结构,包括单一的和
复合形式。
复合肥产线 形式 由两个部分组成,由等号或冒号分隔。 这
第一个组件是属性名称,第二个组件是特定的值
要匹配的属性,例如“\p{Script: Greek}”和“\p{Script=Greek}”
两者都表示匹配 Script 属性值为希腊语的字符。
集成的 形式, 像 "\p{Greek}", 大多是 Perl 定义的对应的快捷方式
复合形式。 该表显示了这些等效项。 (在我们的例子中,“\p{Greek}”是一个
只是 "\p{Script=Greek}" 的快捷方式。) 还有一些 Perl 定义的单一形式
这不是复合形式的快捷方式。 其中之一是“\p{Word}”。 这些也是
表中列出。
在解析这些结构时,Perl 总是忽略任何地方的大小写差异
{括号}内。 因此,“\p{Greek}”与“\p{greek}”的意思相同。 但请注意
在左大括号完全改变意义之前改变“p”或“P”的大小写
从“匹配”(对于“\p{}”)到“不匹配”(对于“\P{}”)。 套管
本文件是为了提高可读性。
此外,空格、连字符和下划线通常被忽略
{括号},因此即使“/x”修饰符没有被添加或删除,也可以自由添加或删除
在正则表达式中指定。 但在下表中一个 'T' 在开头
entry 意味着对该条目使用更严格(更严格)的规则:
单一形式 ("\p{name}") 更严格的规则:
空格、连字符和下划线很重要,除了:
· 与非单词字符相邻的空格
· 下划线分隔数字中的数字
这意味着,例如,您可以自由添加或删除相邻的空白区域
(但在)大括号内而不影响含义。
复合形式(“\p{name=value}”或“\p{name:value}”)更严格的规则:
上面为单一表格给出的更严格的规则适用于右边的所有内容
冒号或等号; 较宽松的规则仍然适用于左侧的所有内容。
这意味着,例如,您可以自由添加或删除相邻的空白区域
(但在)大括号和冒号或等号内。
Unicode 认为某些属性已过时,但仍然可用。 有
过时的几种类型:
安定
可以稳定属性。 这样的决定并不表明
财产应该或不应该被使用; 相反,它是一个声明,即
不会为新编码的字符维护或扩展属性。 这样的
属性标有“S'在表中。
已过时
一个属性可能会被弃用,也许是因为它的原始意图已经被
被另一个属性替换,或者因为它的规格有某种缺陷。
这意味着强烈不鼓励使用它,以至于会发出警告
如果使用则发出,除非正则表达式在 a 的范围内
“没有警告‘已弃用’”声明。 一种 'D' 标记表中的每个这样的条目,
并且该属性最长、最具描述性版本的条目将
给出它被弃用的原因,也许还有建议。 Perl 可能会发出这样的
警告,即使对于 Unicode 未正式弃用的属性,当
曾经有它们匹配的字符或代码点,但没有
更长。 这是为了警告您您的程序可能无法像之前那样工作
Unicode 发布。
不推荐使用的属性可能在未来的 Perl 版本中不可用,因此它是
最好远离他们。
不推荐使用的属性也可以稳定,但未显示这一事实。
过时的
用 ' 标记的属性O' 在表中被认为是(普通的)过时的。
通常,此名称用于 Unicode 曾经用于的属性
内部目的(但不再是)。
一些 Perl 扩展是为了向后兼容而存在的,不鼓励使用
正在使用,但不会过时。 一个 'X' 标记表中的每个此类条目。 未来
Unicode 版本可能会在没有警告的情况下强制删除其中一些扩展,
被另一个具有相同名称的属性替换,这意味着不同的东西。 用
显示的等效项。
Block 属性中的匹配项具有以“In_”开头的快捷方式。 例如,
"\p{Block=Latin1}" 可以写成 "\p{In_Latin1}"。 为了向后兼容,如果
与另一个快捷方式没有冲突,这些也可以写成“\p{Latin1}”或
“\p{Is_Latin1}”。 但是,注意,有很多这样相互冲突的捷径。 使用这些
不鼓励使用 Block 的表单,并且将其标记为这样,不仅是因为潜在的
混淆是什么意思,但也因为后来发布的 Unicode 可能会抢占
捷径,你的程序将不再正确。 使用“In_”表格代替
避免这种情况,或者更清楚地使用复合形式,例如,“\p{blk:latin1}”。 看
perlunicode 中的“块”以获取有关此内容的更多信息。
下表有两列。 左列包含要查看的“\p{}”结构
up,前面可能是上面提到的标志; 右列包含
有关它们的信息,例如描述或同义词。 该表同时显示了单
和具有它们的每个属性的复合形式。 如果左列是短名称
对于属性,右列将给出更长、更具描述性的名称; 如果
左列是最长的名称,右列将显示任何等效的最短名称,
如果适用,可以采用单一和复合形式。
如果不需要大括号来指定属性(例如,“\pL”),则左列包含
两种形式,带和不带括号。
如果某个属性的含义与实际含义不同,则右列也会提醒您
通常可以预期。
所有单一形式都是 Perl 扩展; 一些复合形式也是如此,并注明为
这样。
(括号)中的数字表示匹配的 Unicode 代码点总数
财产。 为了强调,那些根本不匹配代码点的属性被列为
在表格后面的单独部分中。
大多数属性都匹配相同的代码点,无论“/i”是否不区分大小写
是否指定匹配。 但是一些属性会受到影响。 这些显示为
符号 "(/i= 其他_财产)” 在第二列。 在不区分大小写的匹配下
它们匹配与属性相同的代码节点 其他_财产.
大多数非 Perl 定义的属性没有给出描述(参见
<http://www.unicode.org/reports/tr44/> 为此)。
为了紧凑,'*' 用作通配符,而不是显示所有可能的组合。
例如,条目如下:
\p{Gc: *} \p{General_Category: *}
表示 'Gc' 是 'General_Category' 的同义词,任何对
后者也适用于前者。 相似地,
\p{是_*} \p{*}
意味着当且仅当,例如,“\p{Foo}”存在,那么“\p{Is_Foo}”和
"\p{IsFoo}" 也是有效的,并且都意味着同样的事情。 同样,“\p{Foo=Bar}”
与“\p{Is_Foo=Bar}”和“\p{IsFoo=Bar}”的意思相同。 这里的“*”仅限于
不以下划线开头的东西。
此外,在二进制属性中,“Yes”、“T”和“True”都是“Y”的同义词。 和不',
'F' 和 'False' 都是 'N' 的同义词。 表格显示“Y*”和“N*”表示
这个,并且没有其他可能性的单独条目。 请注意,并非所有
具有值 'Yes' 和 'No' 的属性是二元的,并且它们具有它们的所有值
在不使用此通配符的情况下拼写出来,并且在其描述中使用“NOT”子句说明
突出显示它们不是二进制的。 这些也需要复合形式来匹配它们,
而真正的二元属性有单一和复合形式可用。
请注意,在短名称的显示中删除了所有非必要的下划线
联络一位教师
传说 摘要:
· * 是通配符
· (\d+) 在信息列中给出了与此匹配的 Unicode 代码点数
属性。
· D 意味着这已被弃用。
· O 意味着这是过时的。
· S 意味着这是稳定的。
· T 意味着更严格(更严格)的名称匹配适用。
· X 意味着不鼓励使用这种形式,并且可能不稳定。
姓名信息
X \p{Aegean_Numbers} \p{块=Aegean_Numbers} (64)
T \p{年龄:1.1} \p{年龄=V1_1} (33_979)
T \p{年龄:2.0} \p{年龄=V2_0} (144_521)
T \p{年龄:2.1} \p{年龄=V2_1} (2)
T \p{年龄:3.0} \p{年龄=V3_0} (10_307)
T \p{年龄:3.1} \p{年龄=V3_1} (44_978)
T \p{年龄:3.2} \p{年龄=V3_2} (1016)
T \p{年龄:4.0} \p{年龄=V4_0} (1226)
T \p{年龄:4.1} \p{年龄=V4_1} (1273)
T \p{年龄:5.0} \p{年龄=V5_0} (1369)
T \p{年龄:5.1} \p{年龄=V5_1} (1624)
T \p{年龄:5.2} \p{年龄=V5_2} (6648)
T \p{年龄:6.0} \p{年龄=V6_0} (2088)
T \p{年龄:6.1} \p{年龄=V6_1} (732)
T \p{年龄:6.2} \p{年龄=V6_2} (1)
T \p{年龄:6.3} \p{年龄=V6_3} (5)
T \p{年龄:7.0} \p{年龄=V7_0} (2834)
\p{Age: NA} \p{Age=Unassigned}(861_509 加上所有
Unicode 代码点以上)
\p{Age: Unassigned} 代码点的使用尚未分配
在迄今为止的任何 Unicode 版本中。 (短的:
\p{Age=NA}) (861_509 加上以上所有-
Unicode 代码点)
\p{Age: V1_1} 版本中引入的代码点用法
1.1(33_979)
\p{Age: V2_0} Code point 的用法在
2.0 版; 另见属性
'Present_In' (144_521)
\p{Age: V2_1} Code point 的用法在
2.1 版; 另见属性
'Present_In' (2)
\p{Age: V3_0} Code point 的用法在
3.0 版; 另见属性
'Present_In' (10_307)
\p{Age: V3_1} Code point 的用法在
3.1 版; 另见属性
'Present_In' (44_978)
\p{Age: V3_2} Code point 的用法在
3.2 版; 另见属性
'Present_In' (1016)
\p{Age: V4_0} Code point 的用法在
4.0 版; 另见属性
'Present_In' (1226)
\p{Age: V4_1} Code point 的用法在
4.1 版; 另见属性
'Present_In' (1273)
\p{Age: V5_0} Code point 的用法在
5.0 版; 另见属性
'Present_In' (1369)
\p{Age: V5_1} Code point 的用法在
5.1 版; 另见属性
'Present_In' (1624)
\p{Age: V5_2} Code point 的用法在
5.2 版; 另见属性
'Present_In' (6648)
\p{Age: V6_0} Code point 的用法在
6.0 版; 另见属性
'Present_In' (2088)
\p{Age: V6_1} Code point 的用法在
6.1 版; 另见属性
'Present_In' (732)
\p{Age: V6_2} Code point 的用法在
6.2 版; 另见属性
'Present_In' (1)
\p{Age: V6_3} Code point 的用法在
6.3 版; 另见属性
'Present_In' (5)
\p{Age: V7_0} Code point 的用法在
7.0 版; 另见属性
'Present_In' (2834)
\p{Aghb} \p{高加索人_阿尔巴尼亚人} (= \p{Script=
Caucasian_Albanian})(不是 \p{Block=
高加索人_阿尔巴尼亚人}) (53)
\p{AHex} \p{PosixXDigit} (= \p{ASCII_Hex_Digit=Y})
(22)
\p{AHex: *} \p{ASCII_Hex_Digit: *}
X \p{炼金术} \p{炼金术符号} (= \p{方块=
炼金术符号}) (128)
X \p{Alchemical_Symbols} \p{Block=Alchemical_Symbols} (简称:
\p{炼金术}) (128)
\p{All} 所有代码点,包括上面的那些
统一码。 与 qr/./s 相同(1_114_112 加上
以上所有 - Unicode 代码点)
\p{Alnum} \p{XPosixAlnum} (104_617)
\p{Alpha} \p{XPosixAlpha} (= \p{字母=Y})
(104_077)
\p{字母:*} \p{字母:*}
\p{字母} \p{XPosixAlpha} (= \p{字母=Y})
(104_077)
\p{字母:N*}(简称:\p{Alpha=N},\P{Alpha})(1_010_035
加上以上所有的 Unicode 代码点)
\p{字母:Y*}(简称:\p{Alpha=Y},\p{Alpha})(104_077)
X \p{Alphabetic_PF} \p{Alphabetic_Presentation_Forms} (=
\p{块=Alphabetic_Presentation_Forms})
(80)
X \p{Alphabetic_Presentation_Forms} \p{块=
Alphabetic_Presentation_Forms}(简称:
\p{InAlphabeticPF}) (80)
X \p{Ancient_Greek_Music} \p{Ancient_Greek_Musical_Notation} (=
\p{块=
古希腊乐谱}) (80)
X \p{Ancient_Greek_Musical_Notation} \p{块=
Ancient_Greek_Musical_Notation}(简称:
\p{古希腊音乐}) (80)
X \p{Ancient_Greek_Numbers} \p{块=Ancient_Greek_Numbers} (80)
X \p{Ancient_Symbols} \p{块=Ancient_Symbols} (64)
\p{Any} 所有 Unicode 代码点:[\x{0000}-
\x{10FFFF}] (1_114_112)
\p{Arab} \p{Arabic} (= \p{Script=Arabic}) (不是
\p{块=阿拉伯语}) (1244)
\p{Arabic} \p{Script=Arabic}(简写:\p{Arab};不是
\p{块=阿拉伯语}) (1244)
X \p{Arabic_Ext_A} \p{Arabic_Extended_A} (= \p{块=
阿拉伯语_扩展_A}) (96)
X \p{Arabic_Extended_A} \p{Block=Arabic_Extended_A} (简称:
\p{InArabicExtA}) (96)
X \p{阿拉伯语数学} \p{阿拉伯语数学字母符号}
(= \p{块=
Arab_Mathematical_Alphabetic_Symbols})
(256)
X \p{Arabic_Mathematical_Alphabetic_Symbols} \p{块=
Arab_Mathematical_Alphabetic_Symbols}
(简称:\p{InArabicMath})(256)
X \p{Arabic_PF_A} \p{Arabic_Presentation_Forms_A} (=
\p{块=阿拉伯语_Presentation_Forms_A})
(688)
X \p{Arabic_PF_B} \p{Arabic_Presentation_Forms_B} (=
\p{块=阿拉伯语_Presentation_Forms_B})
(144)
X \p{阿拉伯语_Presentation_Forms_A} \p{块=
Arab_Presentation_Forms_A}(短:
\p{阿拉伯语PFA}) (688)
X \p{Arabic_Presentation_Forms_B} \p{块=
Arab_Presentation_Forms_B}(短:
\p{阿拉伯语PFB}) (144)
X \p{Arabic_Sup} \p{Arabic_Supplement} (= \p{块=
阿拉伯语_补充}) (48)
X \p{Arabic_Supplement} \p{Block=Arabic_Supplement}(简称:
\p{InArabicSup}) (48)
\p{Armenian} \p{Script=Armenian} (简称:\p{Armn};不是
\p{块=亚美尼亚语}) (93)
\p{Armi} \p{Imperial_Aramaic} (= \p{脚本=
Imperial_Aramaic})(不是 \p{Block=
帝国_阿拉姆语}) (31)
\p{Armn} \p{Armenian} (= \p{Script=Armenian}) (不是
\p{块=亚美尼亚语}) (93)
X \p{箭头} \p{块=箭头} (112)
\p{ASCII} \p{块=Basic_Latin} [[:ASCII:]] (128)
\p{ASCII_Hex_Digit} \p{PosixXDigit} (= \p{ASCII_Hex_Digit=Y})
(22)
\p{ASCII_Hex_Digit: N*} (短: \p{AHex=N}, \P{AHex}) (1_114_090
加上以上所有的 Unicode 代码点)
\p{ASCII_Hex_Digit: Y*} (简称: \p{AHex=Y}, \p{AHex}) (22)
\p{Assigned} 所有分配的代码点 (252_537)
\p{Avestan} \p{Script=Avestan} (简称:\p{Avst};不是
\p{块=阿维斯坦}) (61)
\p{Avst} \p{Avestan} (= \p{Script=Avestan}) (不是
\p{块=阿维斯坦}) (61)
\p{巴厘岛} \p{巴厘岛} (= \p{Script=巴厘岛}) (不是
\p{块=巴厘岛语}) (121)
\p{Balinese} \p{Script=Balinese}(简称:\p{Bali};不是
\p{块=巴厘岛语}) (121)
\p{Bamu} \p{Bamum} (= \p{Script=Bamum}) (不是
\p{块=Bamum}) (657)
\p{Bamum} \p{Script=Bamum} (简称:\p{Bamu};不是
\p{块=Bamum}) (657)
X \p{Bamum_Sup} \p{Bamum_Supplement} (= \p{块=
Bamum_补充}) (576)
X \p{Bamum_Supplement} \p{Block=Bamum_Supplement} (简称:
\p{InBamumSup}) (576)
X \p{Basic_Latin} \p{ASCII} (= \p{块=Basic_Latin}) (128)
\p{低音} \p{Bassa_Vah} (= \p{脚本=Bassa_Vah})
(不是 \p{Block=Bassa_Vah}) (36)
\p{Bassa_Vah} \p{Script=Bassa_Vah}(简称:\p{Bass};不是
\p{块=Bassa_Vah}) (36)
\p{Batak} \p{Script=Batak}(简称:\p{Batk};不是
\p{块=巴塔克}) (56)
\p{Batk} \p{Batak} (= \p{Script=Batak}) (不是
\p{块=巴塔克}) (56)
\p{Bc: *} \p{Bidi_Class: *}
\p{Beng} \p{孟加拉语} (= \p{Script=孟加拉语}) (不是
\p{块=孟加拉语}) (93)
\p{Bengali} \p{Script=Bengali} (简称:\p{Beng};不是
\p{块=孟加拉语}) (93)
\p{Bidi_C} \p{Bidi_Control} (= \p{Bidi_Control=Y})
(12)
\p{Bidi_C: *} \p{Bidi_Control: *}
\p{Bidi_Class: AL} \p{Bidi_Class=Arabic_Letter} (1436)
\p{Bidi_Class: AN} \p{Bidi_Class=Arabic_Number} (50)
\p{Bidi_Class:Arabic_Letter}(简称:\p{Bc=AL})(1436)
\p{Bidi_Class:Arabic_Number}(简称:\p{Bc=AN})(50)
\p{Bidi_Class: B} \p{Bidi_Class=Paragraph_Separator} (7)
\p{Bidi_Class:BN} \p{Bidi_Class=Boundary_Neutral} (4016)
\p{Bidi_Class: Boundary_Neutral}(简称:\p{Bc=BN})(4016)
\p{Bidi_Class:Common_Separator}(简称:\p{Bc=CS})(15)
\p{Bidi_Class: CS} \p{Bidi_Class=Common_Separator} (15)
\p{Bidi_Class:EN} \p{Bidi_Class=European_Number} (158)
\p{Bidi_Class: ES} \p{Bidi_Class=European_Separator} (12)
\p{Bidi_Class: ET} \p{Bidi_Class=European_Terminator} (87)
\p{Bidi_Class: European_Number}(简称:\p{Bc=EN})(158)
\p{Bidi_Class:European_Separator}(简称:\p{Bc=ES})(12)
\p{Bidi_Class: European_Terminator}(简称:\p{Bc=ET})(87)
\p{Bidi_Class: First_Strong_Isolate}(简称:\p{Bc=FSI})(1)
\p{Bidi_Class:FSI} \p{Bidi_Class=First_Strong_Isolate} (1)
\p{Bidi_Class: L} \p{Bidi_Class=Left_To_Right} (1_097_670
加上以上所有的 Unicode 代码点)
\p{Bidi_Class:Left_To_Right}(简称:\p{Bc=L})(1_097_670 加
以上所有 - Unicode 代码点)
\p{Bidi_Class:Left_To_Right_Embedding}(简称:\p{Bc=LRE})(1)
\p{Bidi_Class:Left_To_Right_Isolate}(简称:\p{Bc=LRI})(1)
\p{Bidi_Class:Left_To_Right_Override}(简称:\p{Bc=LRO})(1)
\p{Bidi_Class: LRE} \p{Bidi_Class=Left_To_Right_Embedding} (1)
\p{Bidi_Class: LRI} \p{Bidi_Class=Left_To_Right_Isolate} (1)
\p{Bidi_Class: LRO} \p{Bidi_Class=Left_To_Right_Override} (1)
\p{Bidi_Class: Nonspacing_Mark}(简称:\p{Bc=NSM})(1429)
\p{Bidi_Class:NSM} \p{Bidi_Class=Nonspacing_Mark} (1429)
\p{Bidi_Class:开} \p{Bidi_Class=Other_Neutral} (5126)
\p{Bidi_Class:Other_Neutral}(简称:\p{Bc=ON})(5126)
\p{Bidi_Class: Paragraph_Separator}(简称:\p{Bc=B})(7)
\p{Bidi_Class: PDF} \p{Bidi_Class=Pop_Directional_Format} (1)
\p{Bidi_Class: PDI} \p{Bidi_Class=Pop_Directional_Isolate} (1)
\p{Bidi_Class: Pop_Directional_Format}(简称:\p{Bc=PDF})(1)
\p{Bidi_Class: Pop_Directional_Isolate}(简称:\p{Bc=PDI})(1)
\p{Bidi_Class:R} \p{Bidi_Class=Right_To_Left} (4077)
\p{Bidi_Class:Right_To_Left}(简称:\p{Bc=R})(4077)
\p{Bidi_Class:Right_To_Left_Embedding}(简称:\p{Bc=RLE})(1)
\p{Bidi_Class:Right_To_Left_Isolate}(简称:\p{Bc=RLI})(1)
\p{Bidi_Class:Right_To_Left_Override}(简称:\p{Bc=RLO})(1)
\p{Bidi_Class: RLE} \p{Bidi_Class=Right_To_Left_Embedding} (1)
\p{Bidi_Class: RLI} \p{Bidi_Class=Right_To_Left_Isolate} (1)
\p{Bidi_Class: RLO} \p{Bidi_Class=Right_To_Left_Override} (1)
\p{Bidi_Class: S} \p{Bidi_Class=Segment_Separator} (3)
\p{Bidi_Class:Segment_Separator}(简称:\p{Bc=S})(3)
\p{Bidi_Class: White_Space}(简称:\p{Bc=WS})(17)
\p{Bidi_Class: WS} \p{Bidi_Class=White_Space} (17)
\p{Bidi_Control} \p{Bidi_Control=Y} (简称:\p{BidiC}) (12)
\p{Bidi_Control: N*} (简称:\p{BidiC=N}, \P{BidiC}) (1_114_100
加上以上所有的 Unicode 代码点)
\p{Bidi_Control: Y*} (简称:\p{BidiC=Y}, \p{BidiC}) (12)
\p{Bidi_M} \p{Bidi_Mirrored} (= \p{Bidi_Mirrored=Y})
(545)
\p{Bidi_M: *} \p{Bidi_Mirrored: *}
\p{Bidi_Mirrored} \p{Bidi_Mirrored=Y} (简称:\p{BidiM})
(545)
\p{Bidi_Mirrored: N*} (简称:\p{BidiM=N}, \P{BidiM}) (1_113_567
加上以上所有的 Unicode 代码点)
\p{Bidi_Mirrored: Y*}(简称:\p{BidiM=Y}, \p{BidiM})(545)
\p{Bidi_Paired_Bracket_Type: C} \p{Bidi_Paired_Bracket_Type=关闭}
(60)
\p{Bidi_Paired_Bracket_Type: Close} (短: \p{Bpt=C}) (60)
\p{Bidi_Paired_Bracket_Type: N} \p{Bidi_Paired_Bracket_Type=None}
(1_113_992 加上以上所有的 Unicode 代码
点)
\p{Bidi_Paired_Bracket_Type:无}(简称:\p{Bpt=N})(1_113_992
加上以上所有的 Unicode 代码点)
\p{Bidi_Paired_Bracket_Type: O} \p{Bidi_Paired_Bracket_Type=打开}
(60)
\p{Bidi_Paired_Bracket_Type: Open} (短: \p{Bpt=O}) (60)
\p{空白} \p{XPosixBlank} (18)
\p{块:*} \p{块:*}
\p{Block: Aegean_Numbers} (单曲: \p{InAegeanNumbers}) (64)
\p{方块:炼金术} \p{方块=炼金术符号} (128)
\p{方块:炼金术符号}(简称:\p{Blk=Alchemy},
\p{炼金术}) (128)
\p{块:Alphabetic_PF} \p{块=Alphabetic_Presentation_Forms}
(80)
\p{块:Alphabetic_Presentation_Forms}(简称:\p{Blk=
字母PF}, \p{InAlphabeticPF}) (80)
\p{块:Ancient_Greek_Music} \p{块=
古希腊乐谱} (80)
\p{块:Ancient_Greek_Musical_Notation}(简称:\p{Blk=
古希腊音乐},
\p{古希腊音乐}) (80)
\p{块:Ancient_Greek_Numbers}(单曲:
\p{古希腊数字}) (80)
\p{块:Ancient_Symbols}(单曲:\p{InAncientSymbols})(64)
\p{块:阿拉伯语}(单曲:\p{InArabic};非 \p{Arabic} NOR
\p{Is_阿拉伯语}) (256)
\p{块:Arabic_Ext_A} \p{块=Arabic_Extended_A} (96)
\p{块:Arabic_Extended_A}(简称:\p{Blk=ArabicExtA},
\p{InArabicExtA}) (96)
\p{块:Arabic_Math} \p{块=
Arab_Mathematical_Alphabetic_Symbols}
(256)
\p{块:Arabic_Mathematical_Alphabetic_Symbols}(简称:\p{Blk=
阿拉伯数学}, \p{InArabicMath}) (256)
\p{块:Arabic_PF_A} \p{块=Arabic_Presentation_Forms_A} (688)
\p{块:Arabic_PF_B} \p{块=Arabic_Presentation_Forms_B} (144)
\p{块:Arabic_Presentation_Forms_A}(简称:\p{Blk=ArabicPFA},
\p{阿拉伯语PFA}) (688)
\p{块:Arabic_Presentation_Forms_B}(简称:\p{Blk=ArabicPFB},
\p{阿拉伯语PFB}) (144)
\p{块:Arabic_Sup} \p{块=Arabic_Supplement} (48)
\p{块:Arabic_Supplement}(简称:\p{Blk=ArabicSup},
\p{InArabicSup}) (48)
\p{块:亚美尼亚语}(单曲:\p{InArmenian};非 \p{Armenian}
也不是 \p{Is_Armenian}) (96)
\p{Block: Arrows} (单曲: \p{InArrows}) (112)
\p{块:ASCII} \p{块=Basic_Latin} (128)
\p{块:Avestan}(单曲:\p{InAvestan};不是 \p{Avestan}
或 \p{Is_Avestan}) (64)
\p{Block: Balinese} (单曲: \p{InBalinese}; NOT \p{Balinese}
也不是 \p{Is_Balinese}) (128)
\p{Block: Bamum} (单曲: \p{InBamum}; NOT \p{Bamum} NOR
\p{Is_Bamum}) (96)
\p{块:Bamum_Sup} \p{块=Bamum_Supplement} (576)
\p{块:Bamum_Supplement}(简称:\p{Blk=BamumSup},
\p{InBamumSup}) (576)
\p{块:Basic_Latin}(简称:\p{Blk=ASCII}, \p{ASCII})(128)
\p{块:Bassa_Vah}(单曲:\p{InBassaVah};不是 \p{Bassa_Vah}
或 \p{Is_Bassa_Vah}) (48)
\p{Block: Batak} (单曲: \p{InBatak}; NOT \p{Batak} NOR
\p{Is_巴塔克}) (64)
\p{块:孟加拉语}(单曲:\p{InBengali};非 \p{Bengali}
也不是 \p{Is_孟加拉语}) (128)
\p{Block: Block_Elements} (单曲: \p{InBlockElements}) (32)
\p{块:Bopomofo}(单曲:\p{InBopomofo};不是 \p{Bopomofo}
或 \p{Is_Bopomofo}) (48)
\p{块:Bopomofo_Ext} \p{块=Bopomofo_Extended} (32)
\p{块:Bopomofo_Extended}(简称:\p{Blk=BopomofoExt},
\p{InBopomofoExt}) (32)
\p{块:Box_Drawing}(单曲:\p{InBoxDrawing})(128)
\p{Block: Brahmi} (单曲: \p{InBrahmi}; NOT \p{Brahmi} NOR
\p{Is_Brahmi}) (128)
\p{Block:盲文} \p{Block=Braille_Patterns} (256)
\p{块:Braille_Patterns}(简称:\p{Blk=Braille},
\p{盲文}) (256)
\p{块:Buginese}(单曲:\p{InBuginese};不是 \p{Buginese}
或 \p{Is_Buginese}) (32)
\p{Block: Buhid} (单曲: \p{InBuhid}; NOT \p{Buhid} NOR
\p{Is_Buhid}) (32)
\p{区块:拜占庭音乐} \p{区块=拜占庭音乐符号}
(256)
\p{块:Byzantine_Musical_Symbols}(简称:\p{Blk=
拜占庭音乐}, \p{InByzantineMusic})
(256)
\p{块:Canadian_Syllabics} \p{块=
统一加拿大原住民音节}
(640)
\p{Block: Carian} (单曲: \p{InCarian}; NOT \p{Carian} NOR
\p{Is_Carian}) (64)
\p{块:Caucasian_Albanian}(单曲:\p{InCaucasianAlbanian};
不是 \p{Caucasian_Albanian} 也不是
\p{Is_Caucasian_Albanian}) (64)
\p{Block: Chakma} (单曲: \p{InChakma}; NOT \p{Chakma} NOR
\p{Is_Chakma}) (80)
\p{Block: Cham} (单曲: \p{InCham}; NOT \p{Cham} NOR
\p{Is_Cham}) (96)
\p{块:切诺基}(单曲:\p{InCherokee};不是 \p{Cherokee}
或 \p{Is_Cherokee}) (96)
\p{块:CJK} \p{块=CJK_Unified_Ideographs} (20_992)
\p{块:CJK_Compat} \p{块=CJK_Compatibility} (256)
\p{块:CJK_Compat_Forms} \p{块=CJK_Compatibility_Forms} (32)
\p{块:CJK_Compat_Ideographs} \p{块=
CJK_Compatibility_Ideographs} (512)
\p{块:CJK_Compat_Ideographs_Sup} \p{块=
CJK_Compatibility_Ideographs_Suplement}
(544)
\p{块:CJK_Compatibility}(简称:\p{Blk=CJKCompat},
\p{中日韩兼容}) (256)
\p{块:CJK_Compatibility_Forms}(简称:\p{Blk=CJKCompatForms},
\p{InCJKCompatForms}) (32)
\p{块:CJK_Compatibility_Ideographs}(简称:\p{Blk=
中日韩兼容表意文字},
\p{InCJKCompatIdeographs}) (512)
\p{块:CJK_Compatibility_Ideographs_Supplement}(简称:\p{Blk=
CJKCompatIdeographsSup},
\p{InCJKCompatIdeographsSup}) (544)
\p{块:CJK_Ext_A} \p{块=
CJK_Unified_Ideographs_Extension_A}
(6592)
\p{块:CJK_Ext_B} \p{块=
CJK_Unified_Ideographs_Extension_B}
(42_720)
\p{块:CJK_Ext_C} \p{块=
CJK_Unified_Ideographs_Extension_C}
(4160)
\p{块:CJK_Ext_D} \p{块=
CJK_Unified_Ideographs_Extension_D} (224)
\p{块:CJK_Radicals_Sup} \p{块=CJK_Radicals_Supplement} (128)
\p{块:CJK_Radicals_Supplement}(简称:\p{Blk=CJKRadicalsSup},
\p{InCJKRadicalsSup}) (128)
\p{块:CJK_Strokes}(单曲:\p{InCJKStrokes})(48)
\p{块:CJK_Symbols} \p{块=CJK_Symbols_And_Punctuation} (64)
\p{块:CJK_Symbols_And_Punctuation}(简称:\p{Blk=CJKSymbols},
\p{中日韩符号}) (64)
\p{块:CJK_Unified_Ideographs}(简称:\p{Blk=CJK},\p{InCJK})
(20_992)
\p{块:CJK_Unified_Ideographs_Extension_A}(简称:\p{Blk=
CJKExtA}, \p{InCJKExtA}) (6592)
\p{块:CJK_Unified_Ideographs_Extension_B}(简称:\p{Blk=
CJKExtB}, \p{InCJKExtB}) (42_720)
\p{块:CJK_Unified_Ideographs_Extension_C}(简称:\p{Blk=
CJKExtC}, \p{InCJKExtC}) (4160)
\p{块:CJK_Unified_Ideographs_Extension_D}(简称:\p{Blk=
CJKExtD}, \p{InCJKExtD}) (224)
\p{块:Combining_Diacritical_Marks}(简称:\p{Blk=
变音符}, \p{InDiacriticals}) (112)
\p{块:Combining_Diacritical_Marks_Extended}(简称:\p{Blk=
变音符号Ext}, \p{InDiariticsExt})
(80)
\p{块:Combining_Diacritical_Marks_For_Symbols}(简称:\p{Blk=
符号的变音符号},
\p{InDiariticsForSymbols}) (48)
\p{块:Combining_Diacritical_Marks_Supplement}(简称:\p{Blk=
变音符号Sup}, \p{InDiariticsSup})
(64)
\p{块:Combining_Half_Marks}(简称:\p{Blk=HalfMarks},
\p{InHalfMarks}) (16)
\p{块:Combining_Marks_For_Symbols} \p{块=
Combining_Diaritic_Marks_For_Symbols}
(48)
\p{块:Common_Indic_Number_Forms}(简称:\p{Blk=
印度数字表格},
\p{InIndicNumberForms}) (16)
\p{块:Compat_Jamo} \p{块=Hangul_Compatibility_Jamo} (96)
\p{块:Control_Pictures}(单曲:\p{InControlPictures})(64)
\p{Block: Coptic} (单曲: \p{InCoptic}; NOT \p{Coptic} NOR
\p{Is_科普特}) (128)
\p{块:Coptic_Epact_Numbers}(单曲:\p{InCopticEpactNumbers})
(32)
\p{方块:Counting_Rod} \p{方块=Counting_Rod_Numerals} (32)
\p{块:Counting_Rod_Numerals}(简称:\p{Blk=CountingRod},
\p{InCountingRod}) (32)
\p{块:楔形文字}(单曲:\p{InCuneiform};非
\p{楔形文字} NOR \p{Is_楔形文字})
(1024)
\p{块:楔形文字数字} \p{块=
楔形文字_数字_和_标点符号} (128)
\p{块:Cuneiform_Numbers_And_Punctuation}(简称:\p{Blk=
楔形数字},
\p{楔形文字}) (128)
\p{块:Currency_Symbols}(单曲:\p{InCurrencySymbols})(48)
\p{Block: Cypriot_Syllabary} (单曲: \p{InCypriotSyllabary}) (64)
\p{块:西里尔文}(单曲:\p{InCyrillic};非 \p{Cyrillic}
也非 \p{Is_西里尔文}) (256)
\p{块:Cyrillic_Ext_A} \p{Block=Cyrillic_Extended_A} (32)
\p{块:Cyrillic_Ext_B} \p{块=Cyrillic_Extended_B} (96)
\p{块:Cyrillic_Extended_A}(简称:\p{Blk=CyrillicExtA},
\p{InCyrillicExtA}) (32)
\p{块:Cyrillic_Extended_B}(简称:\p{Blk=CyrillicExtB},
\p{InCyrillicExtB}) (96)
\p{块:Cyrillic_Sup} \p{块=Cyrillic_Supplement} (48)
\p{块:Cyrillic_Supplement}(简称:\p{Blk=CyrillicSup},
\p{InCyrillicSup}) (48)
\p{块:Cyrillic_Supplementary} \p{Block=Cyrillic_Supplement}
(48)
\p{Block: Deseret} (单曲: \p{InDeseret}) (80)
\p{Block: Devanagari} (单曲: \p{InDevanagari}; NOT
\p{梵文} NOR \p{Is_梵文})
(128)
\p{块:天城文_Ext} \p{块=天城文_扩展} (32)
\p{块:Devanagari_Extended}(简称:\p{Blk=DevanagariExt},
\p{InDevanagariExt}) (32)
\p{块:变音符号} \p{块=Combining_Diacritical_Marks} (112)
\p{块:Diacriticals_Ext} \p{块=
组合变音标记扩展}
(80)
\p{块:Diacriticals_For_Symbols} \p{块=
Combining_Diaritic_Marks_For_Symbols}
(48)
\p{块:Diacriticals_Sup} \p{块=
组合变音标记补充}
(64)
\p{Block: Dingbats} (单曲: \p{InDingbats}) (192)
\p{块:多米诺骨牌} \p{块=Domino_Tiles} (112)
\p{块:Domino_Tiles}(简称:\p{Blk=Domino},\p{InDomino})(112)
\p{块:Duployan}(单曲:\p{InDuployan};不是 \p{Duployan}
或 \p{Is_Duployan}) (160)
\p{块:Egyptian_Hieroglyphs}(单曲:
\p{埃及象形文字}; 不是
\p{埃及象形文字} NOR
\p{Is_Egyptian_象形文字}) (1072)
\p{块:Elbasan}(单曲:\p{InElbasan};非 \p{Elbasan}
或 \p{Is_Elbasan}) (48)
\p{块:表情符号}(单曲:\p{InEmoticons})(80)
\p{块:Enclosed_Alphanum} \p{Block=Enclosed_Alphanumerics} (160)
\p{块:Enclosed_Alphanum_Sup} \p{块=
封闭字母数字补充} (256)
\p{块:Enclosed_Alphanumeric_Supplement}(简称:\p{Blk=
封闭的AlphanumSup},
\p{InEnclosureAlphanumSup}) (256)
\p{块:Enclosed_Alphanumerics}(简称:\p{Blk=
封闭字母},
\p{InEnclosureAlphanum}) (160)
\p{块:Enclosed_CJK} \p{块=Enclosed_CJK_Letters_And_Months}
(256)
\p{块:Enclosed_CJK_Letters_And_Months}(简称:\p{Blk=
封闭的中日韩}, \p{In封闭的中日韩}) (256)
\p{块:Enclosed_Ideographic_Sup} \p{块=
附上表意文字补充} (256)
\p{块:Enclosed_Ideographic_Supplement}(简称:\p{Blk=
封闭表意Sup},
\p{InEnclosureIdegraphicSup}) (256)
\p{块:埃塞俄比亚}(单曲:\p{InEthiopic};非 \p{Ethiopic}
或 \p{Is_Ethiopic}) (384)
\p{块:Ethiopic_Ext} \p{Block=Ethiopic_Extended} (96)
\p{块:Ethiopic_Ext_A} \p{Block=Ethiopic_Extended_A} (48)
\p{块:Ethiopic_Extended}(简称:\p{Blk=EthiopicExt},
\p{InEthiopicExt}) (96)
\p{块:Ethiopic_Extended_A}(简称:\p{Blk=EthiopicExtA},
\p{InEthiopicExtA}) (48)
\p{块:Ethiopic_Sup} \p{块=Ethiopic_Supplement} (32)
\p{块:Ethiopic_Supplement}(简称:\p{Blk=EthiopicSup},
\p{在埃塞俄比亚}) (32)
\p{块:General_Punctuation}(简称:\p{Blk=Punctuation},
\p{标点符号}; 不是 \p{Punct} 也不是
\p{Is_标点符号}) (112)
\p{块:Geometric_Shapes}(单曲:\p{InGeometricShapes})(96)
\p{块:Geometric_Shapes_Ext} \p{块=
几何图形扩展} (128)
\p{块:Geometric_Shapes_Extended}(简称:\p{Blk=
几何形状Ext},
\p{InGeometricShapesExt}) (128)
\p{块:Georgian}(单曲:\p{InGeorgian};不是 \p{Georgian}
或 \p{Is_Georgian}) (96)
\p{块:Georgian_Sup} \p{块=Georgian_Supplement} (48)
\p{块:Georgian_Supplement}(简称:\p{Blk=GeorgianSup},
\p{InGeorgianSup}) (48)
\p{Block: Glagolitic} (单曲: \p{InGlagolitic}; NOT
\p{格拉哥里} 或 \p{Is_Glagolit})
(96)
\p{Block: Gothic} (单曲: \p{InGothic}; NOT \p{Gothic} NOR
\p{Is_Gothic}) (32)
\p{块:Grantha}(单曲:\p{InGrantha};不是 \p{Grantha}
或 \p{Is_Grantha}) (128)
\p{块:希腊语} \p{Block=Greek_And_Coptic} (不是 \p{希腊语}
或 \p{Is_Greek}) (144)
\p{块:Greek_And_Coptic}(简称:\p{Blk=Greek},\p{InGreek};
不是 \p{希腊语} 也不是 \p{Is_Greek}) (144)
\p{块:Greek_Ext} \p{块=Greek_Extended} (256)
\p{块:Greek_Extended}(简称:\p{Blk=GreekExt},
\p{InGreekExt}) (256)
\p{Block: Gujarati} (单曲: \p{InGujarati}; NOT \p{Gujarati}
或 \p{Is_Gujarati}) (128)
\p{块:Gurmukhi}(单曲:\p{InGurmukhi};不是 \p{Gurmukhi}
或 \p{Is_Gurmukhi}) (128)
\p{块:Half_And_Full_Forms} \p{块=
半角和全角表格} (240)
\p{块:Half_Marks} \p{块=Combining_Half_Marks} (16)
\p{块:Halfwidth_And_Fullwidth_Forms}(简称:\p{Blk=
半和全形式},
\p{InHalfAndFullForms}) (240)
\p{Block: Hangul} \p{Block=Hangul_Syllables} (不是 \p{Hangul}
或 \p{Is_Hangul}) (11_184)
\p{块:Hangul_Compatibility_Jamo}(简称:\p{Blk=CompatJamo},
\p{InCompatJamo}) (96)
\p{块:Hangul_Jamo}(简称:\p{Blk=Jamo},\p{InJamo})(256)
\p{块:Hangul_Jamo_Extended_A}(简称:\p{Blk=JamoExtA},
\p{InJamoExtA}) (32)
\p{块:Hangul_Jamo_Extended_B}(简称:\p{Blk=JamoExtB},
\p{InJamoExtB}) (80)
\p{块:Hangul_Syllables}(简称:\p{Blk=Hangul},\p{InHangul};
不是 \p{Hangul} 也不是 \p{Is_Hangul})
(11_184)
\p{块:Hanunoo}(单曲:\p{InHanunoo};不是 \p{Hanunoo}
也非 \p{Is_Hanunoo}) (32)
\p{Block: Hebrew} (单曲: \p{InHebrew}; NOT \p{Hebrew} NOR
\p{Is_希伯来语}) (112)
\p{块:High_Private_Use_Surrogates}(短:\p{Blk=
高PU代理},
\p{InHighPUSurrogates}) (128)
\p{块:High_PU_Surrogates} \p{块=
High_Private_Use_Surrogates} (128)
\p{块:High_Surrogates}(单曲:\p{InHighSurrogates})(896)
\p{块:平假名}(单曲:\p{InHiragana}; NOT \p{Hiragana}
或 \p{Is_Hiragana}) (96)
\p{块:IDC} \p{块=
Ideographic_Description_Characters}(不是
\p{ID_Continue} 或 \p{Is_IDC}) (16)
\p{块:Ideographic_Description_Characters}(简称:\p{Blk=IDC},
\p{InIDC}; 不是 \p{ID_Continue} 也不是
\p{Is_IDC}) (16)
\p{块:Imperial_Aramaic}(单曲:\p{InImperialAramaic};不是
\p{Imperial_Aramaic} 或
\p{Is_Imperial_Aramaic}) (32)
\p{块:Indic_Number_Forms} \p{块=Common_Indic_Number_Forms}
(16)
\p{块:Inscriptional_Pahlavi}(单曲:
\p{InscriptionalPahlavi}; 不是
\p{Inscriptional_Pahlavi} 或
\p{Is_Inscriptional_Pahlavi}) (32)
\p{块:Inscriptional_Parthian}(单曲:
\p{InscriptionalParthian}; 不是
\p{Inscriptional_Parthian} 或
\p{Is_Inscriptional_Parthian}) (32)
\p{块:IPA_Ext} \p{块=IPA_Extensions} (96)
\p{块:IPA_Extensions}(简称:\p{Blk=IPAExt},\p{InIPAExt})
(96)
\p{方块:Jamo} \p{方块=Hangul_Jamo} (256)
\p{块:Jamo_Ext_A} \p{块=Hangul_Jamo_Extended_A} (32)
\p{块:Jamo_Ext_B} \p{块=Hangul_Jamo_Extended_B} (80)
\p{块:Javanese}(单曲:\p{InJavanese};不是 \p{Javanese}
或 \p{Is_Javanese}) (96)
\p{块:Kaithi}(单曲:\p{InKaithi};非 \p{Kaithi} NOR
\p{Is_Kaithi}) (80)
\p{块:Kana_Sup} \p{块=Kana_Supplement} (256)
\p{块:Kana_Supplement}(简称:\p{Blk=KanaSup},\p{InKanaSup})
(256)
\p{Block: Kanbun} (单曲: \p{InKanbun}) (16)
\p{Block: 康熙} \p{Block=Kangxi_Radicals} (224)
\p{块:Kangxi_Radicals}(简称:\p{Blk=Kangxi},\p{InKangxi})
(224)
\p{块:卡纳达语}(单曲:\p{InKannada};不是 \p{Kannada}
也不是 \p{Is_Kannada}) (128)
\p{块:片假名}(单曲:\p{InKatakana};非 \p{片假名}
NOR \p{Is_片假名}) (96)
\p{块:Katakana_Ext} \p{块=Katakana_Phonetic_Extensions} (16)
\p{块:片假名_Phonetic_Extensions}(简称:\p{Blk=
片假名Ext}, \p{InKatakanaExt}) (16)
\p{块:Kayah_Li}(单曲:\p{InKayahLi};不是 \p{Kayah_Li}
或 \p{Is_Kayah_Li}) (48)
\p{块:Kharoshthi}(单曲:\p{InKharoshthi};不是
\p{Kharoshthi} 或 \p{Is_Kharoshthi})
(96)
\p{Block: Khmer} (单曲: \p{InKhmer}; NOT \p{Khmer} NOR
\p{Is_Khmer}) (128)
\p{块:Khmer_Symbols}(单曲:\p{InKhmerSymbols})(32)
\p{块:Khojki}(单曲:\p{InKhojki};非 \p{Khojki} NOR
\p{Is_Khojki}) (80)
\p{块:Khudawadi}(单曲:\p{InKhudawadi};非
\p{Khudawadi} 或 \p{Is_Khudawadi}) (80)
\p{块:老挝}(单曲:\p{InLao};非 \p{Lao} NOR
\p{Is_Lao}) (128)
\p{块:Latin_1} \p{块=Latin_1_Supplement} (128)
\p{块:Latin_1_Sup} \p{块=Latin_1_Supplement} (128)
\p{块:Latin_1_Supplement}(简称:\p{Blk=Latin1},
\p{拉丁语1}) (128)
\p{块:Latin_Ext_A} \p{块=Latin_Extended_A} (128)
\p{块:Latin_Ext_Additional} \p{块=
拉丁语扩展附加} (256)
\p{块:Latin_Ext_B} \p{块=Latin_Extended_B} (208)
\p{块:Latin_Ext_C} \p{块=Latin_Extended_C} (32)
\p{块:Latin_Ext_D} \p{块=Latin_Extended_D} (224)
\p{块:Latin_Ext_E} \p{块=Latin_Extended_E} (64)
\p{块:Latin_Extended_A}(简称:\p{Blk=LatinExtA},
\p{InLatinExtA}) (128)
\p{块:Latin_Extended_Additional}(简称:\p{Blk=
拉丁文附加},
\p{InLatinExtAdditional}) (256)
\p{块:Latin_Extended_B}(简称:\p{Blk=LatinExtB},
\p{InLatinExtB}) (208)
\p{块:Latin_Extended_C}(简称:\p{Blk=LatinExtC},
\p{InLatinExtC}) (32)
\p{块:Latin_Extended_D}(简称:\p{Blk=LatinExtD},
\p{InLatinExtD}) (224)
\p{块:Latin_Extended_E}(简称:\p{Blk=LatinExtE},
\p{InLatinExtE}) (64)
\p{Block: Lepcha} (单曲: \p{InLepcha}; NOT \p{Lepcha} NOR
\p{Is_Lepcha}) (80)
\p{块:Letterlike_Symbols}(单个:\p{InLetterlikeSymbols})
(80)
\p{Block: Limbu} (单曲: \p{InLimbu}; NOT \p{Limbu} NOR
\p{Is_Limbu}) (80)
\p{块:Linear_A}(单个:\p{InLinearA};不是 \p{Linear_A}
或 \p{Is_Linear_A}) (384)
\p{块:Linear_B_Ideograms}(单个:\p{InLinearBIdeograms})
(128)
\p{块:Linear_B_Syllabary}(单曲:\p{InLinearBSyllabary})
(128)
\p{Block: Lisu} (单曲: \p{InLisu}) (48)
\p{块:Low_Surrogates}(单曲:\p{InLowSurrogates})(1024)
\p{Block: Lycian} (单曲: \p{InLycian}; NOT \p{Lycian} NOR
\p{Is_Lycian}) (32)
\p{Block: Lydian} (单曲: \p{InLydian}; NOT \p{Lydian} NOR
\p{Is_Lydian}) (32)
\p{块:Mahajani}(单曲:\p{InMahajani};不是 \p{Mahajani}
或 \p{Is_Mahajani}) (48)
\p{方块:麻将} \p{方块=Mahjong_Tiles} (48)
\p{Block: Mahjong_Tiles}(简称:\p{Blk=Mahjong}, \p{InMahjong})
(48)
\p{块:马拉雅拉姆语}(单曲:\p{InMalayalam};不是
\p{马拉雅拉姆语} NOR \p{Is_马拉雅拉姆语}) (128)
\p{块:Mandaic}(单曲:\p{InMandaic};非 \p{Mandaic}
或 \p{Is_Mandaic}) (32)
\p{Block: Manichaean} (单曲: \p{InManichaean}; NOT
\p{摩尼教} NOR \p{Is_Manichaean})
(64)
\p{块:Math_Alphanum} \p{块=
数学_字母数字_符号} (1024)
\p{块:Math_Operators} \p{Block=Mathematical_Operators} (256)
\p{块:Mathematical_Alphanumeric_Symbols}(简称:\p{Blk=
MathAlphanum}, \p{InMathAlphanum}) (1024)
\p{块:Mathematical_Operators}(简称:\p{Blk=MathOperators},
\p{InMathOperators}) (256)
\p{块:Meetei_Mayek}(单曲:\p{InMeeteiMayek};不是
\p{Meetei_Mayek} 或
\p{Is_Meetei_Mayek}) (64)
\p{块:Meetei_Mayek_Ext} \p{块=Meetei_Mayek_Extensions} (32)
\p{块:Meetei_Mayek_Extensions}(简称:\p{Blk=MeeteiMayekExt},
\p{InMeeteiMayekExt}) (32)
\p{块:Mende_Kikakui}(单曲:\p{InMendeKikakui};不是
\p{Mende_Kikakui} 或非
\p{Is_Mende_Kikakui}) (224)
\p{块:Meroitic_Cursive}(单曲:\p{InMeroiticCursive};不是
\p{Meroitic_Cursive} 或
\p{Is_Meritic_Cursive}) (96)
\p{块:Meroitic_Hieroglyphs}(单曲:
\p{InMeroitic象形文字}) (32)
\p{Block: Miao} (单曲: \p{InMiao}; NOT \p{Miao} NOR
\p{Is_Miao}) (160)
\p{方块:Misc_Arrows} \p{方块=Miscellaneous_Symbols_And_Arrows}
(256)
\p{块:Misc_Math_Symbols_A} \p{块=
杂项_数学_符号_A}
(48)
\p{块:Misc_Math_Symbols_B} \p{块=
杂项_数学_符号_B}
(128)
\p{方块:Misc_Pictographs} \p{方块=
杂项_Symbols_And_Pictographs}
(768)
\p{块:Misc_Symbols} \p{块=Miscellaneous_Symbols} (256)
\p{块:Misc_Technical} \p{块=Miscellaneous_Technical} (256)
\p{块:Miscellaneous_Mathematical_Symbols_A}(简称:\p{Blk=
MiscMathSymbolsA},
\p{InMiscMathSymbolsA}) (48)
\p{块:Miscellaneous_Mathematical_Symbols_B}(简称:\p{Blk=
MiscMathSymbolsB},
\p{InMiscMathSymbolsB}) (128)
\p{块:Miscellaneous_Symbols}(简称:\p{Blk=MiscSymbols},
\p{InMiscSymbols}) (256)
\p{块:Miscellaneous_Symbols_And_Arrows}(简称:\p{Blk=
杂项}, \p{InMiscArrows}) (256)
\p{块:Miscellaneous_Symbols_And_Pictographs}(简称:\p{Blk=
MiscPictographs}, \p{InMiscPictographs})
(768)
\p{块:Miscellaneous_Technical}(简称:\p{Blk=MiscTechnical},
\p{杂项技术}) (256)
\p{Block: Modi} (单曲: \p{InModi}; NOT \p{Modi} NOR
\p{Is_Modi}) (96)
\p{块:Modifier_Letters} \p{块=Spacing_Modifier_Letters} (80)
\p{块:Modifier_Tone_Letters}(单曲:
\p{InModifierToneLetters}) (32)
\p{块:蒙古语}(单曲:\p{InMongolian};非
\p{蒙古语} NOR \p{Is_Mongolian}) (176)
\p{Block: Mro} (单曲: \p{InMro}; NOT \p{Mro} NOR
\p{Is_Mro}) (48)
\p{块:音乐} \p{块=Musical_Symbols} (256)
\p{块:Musical_Symbols}(简称:\p{Blk=Music},\p{InMusic})
(256)
\p{块:缅甸}(单曲:\p{InMyanmar};不是 \p{Myanmar}
也不是 \p{Is_Myanmar}) (160)
\p{块:Myanmar_Ext_A} \p{块=Myanmar_Extended_A} (32)
\p{块:Myanmar_Ext_B} \p{块=Myanmar_Extended_B} (32)
\p{块:Myanmar_Extended_A}(简称:\p{Blk=MyanmarExtA},
\p{InMyanmarExtA}) (32)
\p{块:Myanmar_Extended_B}(简称:\p{Blk=MyanmarExtB},
\p{InMyanmarExtB}) (32)
\p{Block: Nabataean} (单曲: \p{InNabataean}; NOT
\p{Nabataean} 或 \p{Is_Nabataean}) (48)
\p{块:NB} \p{块=No_Block}(857_776 加上所有
Unicode 代码点以上)
\p{Block: New_Tai_Lue} (单曲: \p{InNewTaiLue}; NOT
\p{New_Tai_Lue} 或 \p{Is_New_Tai_Lue})
(96)
\p{块:NKo}(单曲:\p{InNKo};非 \p{Nko} NOR
\p{Is_NKo}) (64)
\p{块:No_Block}(简称:\p{Blk=NB},\p{InNB})(857_776
加上以上所有的 Unicode 代码点)
\p{块:Number_Forms}(单曲:\p{InNumberForms})(64)
\p{块:OCR} \p{块=Optical_Character_Recognition}
(32)
\p{Block: Ogham} (单曲: \p{InOgham}; NOT \p{Ogham} NOR
\p{Is_Ogham}) (32)
\p{块:Ol_Chiki}(单曲:\p{InOlChiki})(48)
\p{块:Old_Italic}(单曲:\p{InOldItalic};不是
\p{Old_Italic} 或 \p{Is_Old_Italic})
(48)
\p{块:Old_North_Arabian}(单曲:\p{InOldNorthArabian})(32)
\p{Block: Old_Permic} (单曲: \p{InOldPermic}; NOT
\p{Old_Permic} 或 \p{Is_Old_Permic})
(48)
\p{块:Old_Persian}(单曲:\p{InOldPersian};不是
\p{Old_Persian} 或 \p{Is_Old_Persian})
(64)
\p{块:Old_South_Arabian}(单曲:\p{InOldSouthArabian})(32)
\p{块:Old_Turkic}(单曲:\p{InOldTurkic};不是
\p{Old_Turkic} 或 \p{Is_Old_Turkic})
(80)
\p{块:Optical_Character_Recognition}(简称:\p{Blk=OCR},
\p{OCR}) (32)
\p{Block: Oriya} (单曲: \p{InOriya}; NOT \p{Oriya} NOR
\p{奥里亚语}) (128)
\p{块:Ornamental_Dingbats}(单曲:\p{InOrnamentalDingbats})
(48)
\p{块:Osmanya}(单曲:\p{InOsmanya};不是 \p{Osmanya}
或 \p{Is_Osmanya}) (48)
\p{块:Pahawh_Hmong}(单曲:\p{InPahawhHmong};不是
\p{Pahawh_Hmong} 也不是
\p{Is_Pahawh_Hmong}) (144)
\p{Block: Palmyrene} (单曲: \p{InPalmyrene}) (32)
\p{块:Pau_Cin_Hau}(单曲:\p{InPauCinHau};不是
\p{Pau_Cin_Hau} 或 \p{Is_Pau_Cin_Hau})
(64)
\p{块:Phags_Pa}(单曲:\p{InPhagsPa};不是 \p{Phags_Pa}
或 \p{Is_Phags_Pa}) (64)
\p{块:Phaistos} \p{块=Phaistos_Disc} (48)
\p{块:Phaistos_Disc}(简称:\p{Blk=Phaistos},\p{InPhaistos})
(48)
\p{块:腓尼基人}(单曲:\p{InPhoenician};不是
\p{腓尼基人} NOR \p{Is_Phoenician})
(32)
\p{块:Phonetic_Ext} \p{块=Phonetic_Extensions} (128)
\p{块:Phonetic_Ext_Sup} \p{块=
Phonetic_Extensions_Suplement} (64)
\p{块:Phonetic_Extensions}(简称:\p{Blk=PhoneticExt},
\p{InPhoneticExt}) (128)
\p{块:Phonetic_Extensions_Supplement}(简称:\p{Blk=
PhoneticExtSup}, \p{InPhoneticExtSup})
(64)
\p{Block: Playing_Cards} (单曲: \p{InPlayingCards}) (96)
\p{块:Private_Use} \p{Block=Private_Use_Area}(不是
\p{Private_Use} 或 \p{Is_Private_Use})
(6400)
\p{块:Private_Use_Area}(简称:\p{Blk=PUA},\p{InPUA};不是
\p{Private_Use} 或 \p{Is_Private_Use})
(6400)
\p{块:Psalter_Pahlavi}(单曲:\p{InPsalterPahlavi};不是
\p{诗篇_巴列维} NOR
\p{Is_Psalter_Pahlavi}) (48)
\p{块:PUA} \p{块=Private_Use_Area}(不是
\p{Private_Use} 或 \p{Is_Private_Use})
(6400)
\p{块:标点符号} \p{块=General_Punctuation}(不是
\p{Punct} 或 \p{Is_Punctuation}) (112)
\p{Block: Rejang} (单曲: \p{InRejang}; NOT \p{Rejang} NOR
\p{Is_Rejang}) (48)
\p{块:鲁米} \p{块=Rumi_Numeral_Symbols} (32)
\p{块:Rumi_Numeral_Symbols}(简称:\p{Blk=Rumi},\p{InRumi})
(32)
\p{Block: Runic} (单曲: \p{InRunic}; NOT \p{Runic} NOR
\p{Is_Runic}) (96)
\p{Block: Samaritan} (单曲: \p{InSamaritan}; NOT
\p{撒玛利亚人} 或 \p{Is_Samaritan}) (64)
\p{块:Saurashtra}(单曲:\p{InSaurashtra};非
\p{Saurashtra} 或 \p{Is_Saurashtra})
(96)
\p{Block: Sharada}(单曲:\p{InSharada};不是 \p{Sharada}
或 \p{Is_Sharada}) (96)
\p{Block: Shavian} (单曲: \p{InShavian}) (48)
\p{块:Shorthand_Format_Controls}(单曲:
\p{InShorthandFormatControls}) (16)
\p{块:Siddham}(单曲:\p{InSiddham};不是 \p{Siddham}
或 \p{Is_Siddham}) (128)
\p{块:僧伽罗语}(单曲:\p{InSinhala};不是 \p{Sinhala}
或 \p{Is_Sinhala}) (128)
\p{块:Sinhala_Archaic_Numbers}(单曲:
\p{InSinhalaArchaicNumbers}) (32)
\p{块:Small_Form_Variants}(简称:\p{Blk=SmallForms},
\p{小形式}) (32)
\p{块:Small_Forms} \p{块=Small_Form_Variants} (32)
\p{块:Sora_Sompeng}(单曲:\p{InSoraSompeng};不是
\p{Sora_Sompeng} 或
\p{Is_Sora_Sompeng}) (48)
\p{块:Spacing_Modifier_Letters}(简称:\p{Blk=
修饰符字母}, \p{InModifierLetters})
(80)
\p{Block: Specials} (单曲: \p{InSpecials}) (16)
\p{块:巽他语}(单曲:\p{InSundanese};不是
\p{巽他语} NOR \p{Is_巽他语}) (64)
\p{块:Sundanese_Sup} \p{块=Sundanese_Supplement} (16)
\p{块:Sundanese_Supplement}(简称:\p{Blk=SundaneseSup},
\p{InSundaneseSup}) (16)
\p{方块:Sup_Arrows_A} \p{方块=Supplemental_Arrows_A} (16)
\p{方块:Sup_Arrows_B} \p{方块=Supplemental_Arrows_B} (128)
\p{方块:Sup_Arrows_C} \p{方块=Supplemental_Arrows_C} (256)
\p{块:Sup_Math_Operators} \p{块=
补充数学运算符}
(256)
\p{块:Sup_PUA_A} \p{块=Supplementary_Private_Use_Area_A}
(65_536)
\p{块:Sup_PUA_B} \p{块=Supplementary_Private_Use_Area_B}
(65_536)
\p{块:Sup_Punctuation} \p{Block=Supplemental_Punctuation} (128)
\p{块:Super_And_Sub} \p{块=Superscripts_And_Subscripts} (48)
\p{块:Superscripts_And_Subscripts}(简称:\p{Blk=
SuperAndSub}, \p{InSuperAndSub}) (48)
\p{块:Supplemental_Arrows_A}(简称:\p{Blk=SupArrowsA},
\p{InSupArrowsA}) (16)
\p{块:Supplemental_Arrows_B}(简称:\p{Blk=SupArrowsB},
\p{InSupArrowsB}) (128)
\p{块:Supplemental_Arrows_C}(简称:\p{Blk=SupArrowsC},
\p{InSupArrowsC}) (256)
\p{块:Supplemental_Mathematical_Operators}(简称:\p{Blk=
超级数学运算符},
\p{InSupMathOperators}) (256)
\p{块:Supplemental_Punctuation}(简称:\p{Blk=
SupPunctuation}, \p{InSupPunctuation})
(128)
\p{块:Supplementary_Private_Use_Area_A}(简称:\p{Blk=
SupPUAA}, \p{InSupPUAA}) (65_536)
\p{块:Supplementary_Private_Use_Area_B}(简称:\p{Blk=
SupPUAB}, \p{InSupPUAB}) (65_536)
\p{块:Syloti_Nagri}(单曲:\p{InSylotiNagri};不是
\p{Syloti_Nagri} 或
\p{Is_Syloti_Nagri}) (48)
\p{块:Syriac}(单曲:\p{InSyriac}; NOT \p{Syriac} NOR
\p{Is_Syriac}) (80)
\p{Block: Tagalog} (单曲: \p{InTagalog}; NOT \p{Tagalog}
NOR \p{Is_他加禄语}) (32)
\p{块:Tagbanwa}(单曲:\p{InTagbanwa};不是 \p{Tagbanwa}
或 \p{Is_Tagbanwa}) (32)
\p{块:标签}(单曲:\p{InTags})(128)
\p{Block: Tai_Le} (单曲: \p{InTaiLe}; NOT \p{Tai_Le} NOR
\p{Is_Tai_Le}) (48)
\p{块:Tai_Tham}(单曲:\p{InTaiTham};不是 \p{Tai_Tham}
或 \p{Is_Tai_Tham}) (144)
\p{块:Tai_Viet}(单曲:\p{InTaiViet};不是 \p{Tai_Viet}
或 \p{Is_Tai_Viet}) (96)
\p{方块:Tai_Xuan_Jing} \p{方块=Tai_Xuan_Jing_Symbols} (96)
\p{块:Tai_Xuan_Jing_Symbols}(简称:\p{Blk=TaiXuanJing},
\p{In太玄境}) (96)
\p{Block: Takri} (单曲: \p{InTakri}; NOT \p{Takri} NOR
\p{Is_Takri}) (80)
\p{Block: Tamil} (单曲: \p{InTamil}; NOT \p{Tamil} NOR
\p{Is_泰米尔语}) (128)
\p{Block: Telugu} (单曲: \p{InTelugu}; NOT \p{Telugu} NOR
\p{Is_泰卢固语}) (128)
\p{Block: Thaana} (单曲: \p{InThaana}; NOT \p{Thaana} NOR
\p{Is_Thaana}) (64)
\p{Block: Thai} (单曲: \p{InThai}; NOT \p{Thai} NOR
\p{Is_Thai}) (128)
\p{块:藏语}(单曲:\p{InTibetan};非 \p{Tibetan}
也不是 \p{Is_Tibetan}) (256)
\p{块:Tifinagh}(单曲:\p{InTifinagh};不是 \p{Tifinagh}
或 \p{Is_Tifinagh}) (80)
\p{Block: Tirhuta} (单曲: \p{InTirhuta}; NOT \p{Tirhuta}
或 \p{Is_Tirhuta}) (96)
\p{块:Transport_And_Map} \p{块=Transport_And_Map_Symbols}
(128)
\p{块:Transport_And_Map_Symbols}(简称:\p{Blk=
运输与地图},\p{在运输与地图})
(128)
\p{块:UCAS} \p{块=
统一加拿大原住民音节}
(640)
\p{块:UCAS_Ext} \p{块=
统一_加拿大_原住民_音节_-
扩展} (80)
\p{块:Ugaritic}(单曲:\p{InUgaritic};不是 \p{Ugaritic}
或 \p{Is_Ugaritic}) (32)
\p{块:Unified_Canadian_Aboriginal_Syllabics}(简称:\p{Blk=
UCAS},\p{InUCAS}) (640)
\p{块:Unified_Canadian_Aboriginal_Syllabics_Extended}(简称:
\p{Blk=UCASExt}, \p{InUCASExt}) (80)
\p{Block: Vai} (单曲: \p{InVai}; NOT \p{Vai} NOR
\p{Is_Vai}) (320)
\p{块:Variation_Selectors}(简称:\p{Blk=VS},\p{InVS};不是
\p{Variation_Selector} 或 \p{Is_VS})
(16)
\p{块:Variation_Selectors_Supplement}(简称:\p{Blk=VSSup},
\p{InVSSup}) (240)
\p{块:Vedic_Ext} \p{块=Vedic_Extensions} (48)
\p{块:Vedic_Extensions}(简称:\p{Blk=VedicExt},
\p{InVedicExt}) (48)
\p{块:Vertical_Forms}(单曲:\p{InVerticalForms})(16)
\p{块:VS} \p{块=Variation_Selectors}(不是
\p{Variation_Selector} 或 \p{Is_VS})
(16)
\p{块:VS_Sup} \p{块=Variation_Selectors_Supplement}
(240)
\p{块:Warang_Citi}(单曲:\p{InWarangCiti};不是
\p{Warang_Citi} 或 \p{Is_Warang_Citi})
(96)
\p{块:Yi_Radicals}(单曲:\p{InYiRadicals})(64)
\p{块:Yi_Syllables}(单曲:\p{InYiSyllables})(1168)
\p{方块:易经} \p{方块=易经_Hexagram_Symbols} (64)
\p{块:Yijing_Hexagram_Symbols}(简称:\p{Blk=Yijing},
\p{In Yijing}) (64)
X \p{块元素} \p{块=块元素} (32)
\p{Bopo} \p{Bopomofo} (= \p{Script=Bopomofo}) (不是
\p{块=Bopomofo}) (70)
\p{Bopomofo} \p{Script=Bopomofo} (简称:\p{Bopo};不是
\p{块=Bopomofo}) (70)
X \p{Bopomofo_Ext} \p{Bopomofo_Extended} (= \p{块=
Bopomofo_扩展}) (32)
X \p{Bopomofo_Extended} \p{Block=Bopomofo_Extended}(简称:
\p{InBopomofoExt}) (32)
X \p{Box_Drawing} \p{块=Box_Drawing} (128)
\p{Bpt: *} \p{Bidi_Paired_Bracket_Type: *}
\p{Brah} \p{Brahmi} (= \p{Script=Brahmi}) (不是
\p{方块=婆罗米}) (109)
\p{Brahmi} \p{Script=Brahmi}(简称:\p{Brah};不是
\p{方块=婆罗米}) (109)
\p{Brai} \p{盲文} (= \p{Script=盲文}) (256)
\p{Braille} \p{Script=Braille}(简称:\p{Brai})(256)
X \p{Braille_Patterns} \p{Block=Braille_Patterns}(简称:
\p{盲文}) (256)
\p{Bugi} \p{Buginese} (= \p{Script=Buginese}) (不是
\p{块=Buginese}) (30)
\p{Buginese} \p{Script=Buginese}(简称:\p{Bugi};不是
\p{块=Buginese}) (30)
\p{Buhd} \p{Buhid} (= \p{Script=Buhid}) (不是
\p{块=Buhid}) (20)
\p{Buhid} \p{Script=Buhid} (简称:\p{Buhd};不是
\p{块=Buhid}) (20)
X \p{拜占庭音乐} \p{拜占庭音乐符号} (= \p{区块=
拜占庭音乐符号}) (256)
X \p{拜占庭音乐符号} \p{块=拜占庭音乐符号}
(简称:\p{InByzantineMusic})(256)
\p{C} \pC \p{其他} (= \p{General_Category=Other})
(1_001_306 加上以上所有的 Unicode 代码
点)
\p{Cakm} \p{Chakma}(= \p{Script=Chakma})(不是
\p{方块=Chakma}) (67)
\p{Canadian_Aboriginal} \p{Script=Canadian_Aboriginal}(简称:
\p{罐}) (710)
X \p{加拿大音节} \p{统一加拿大原住民音节}
(= \p{块=
统一加拿大原住民音节})
(640)
T \p{Canonical_Combining_Class: 0} \p{Canonical_Combining_Class=
Not_Reordered}(1_113_367 加上所有
Unicode 代码点以上)
T \p{Canonical_Combining_Class: 1} \p{Canonical_Combining_Class=
叠加} (32)
T \p{Canonical_Combining_Class: 7} \p{Canonical_Combining_Class=
努克塔} (19)
T \p{Canonical_Combining_Class: 8} \p{Canonical_Combining_Class=
假名_配音} (2)
T \p{Canonical_Combining_Class: 9} \p{Canonical_Combining_Class=
维拉玛} (44)
T \p{Canonical_Combining_Class: 10} \p{Canonical_Combining_Class=
CCC10} (1)
T \p{Canonical_Combining_Class: 11} \p{Canonical_Combining_Class=
CCC11} (1)
T \p{Canonical_Combining_Class: 12} \p{Canonical_Combining_Class=
CCC12} (1)
T \p{Canonical_Combining_Class: 13} \p{Canonical_Combining_Class=
CCC13} (1)
T \p{Canonical_Combining_Class: 14} \p{Canonical_Combining_Class=
CCC14} (1)
T \p{Canonical_Combining_Class: 15} \p{Canonical_Combining_Class=
CCC15} (1)
T \p{Canonical_Combining_Class: 16} \p{Canonical_Combining_Class=
CCC16} (1)
T \p{Canonical_Combining_Class: 17} \p{Canonical_Combining_Class=
CCC17} (1)
T \p{Canonical_Combining_Class: 18} \p{Canonical_Combining_Class=
CCC18} (2)
T \p{Canonical_Combining_Class: 19} \p{Canonical_Combining_Class=
CCC19} (2)
T \p{Canonical_Combining_Class: 20} \p{Canonical_Combining_Class=
CCC20} (1)
T \p{Canonical_Combining_Class: 21} \p{Canonical_Combining_Class=
CCC21} (1)
T \p{Canonical_Combining_Class: 22} \p{Canonical_Combining_Class=
CCC22} (1)
T \p{Canonical_Combining_Class: 23} \p{Canonical_Combining_Class=
CCC23} (1)
T \p{Canonical_Combining_Class: 24} \p{Canonical_Combining_Class=
CCC24} (1)
T \p{Canonical_Combining_Class: 25} \p{Canonical_Combining_Class=
CCC25} (1)
T \p{Canonical_Combining_Class: 26} \p{Canonical_Combining_Class=
CCC26} (1)
T \p{Canonical_Combining_Class: 27} \p{Canonical_Combining_Class=
CCC27} (2)
T \p{Canonical_Combining_Class: 28} \p{Canonical_Combining_Class=
CCC28} (2)
T \p{Canonical_Combining_Class: 29} \p{Canonical_Combining_Class=
CCC29} (2)
T \p{Canonical_Combining_Class: 30} \p{Canonical_Combining_Class=
CCC30} (2)
T \p{Canonical_Combining_Class: 31} \p{Canonical_Combining_Class=
CCC31} (2)
T \p{Canonical_Combining_Class: 32} \p{Canonical_Combining_Class=
CCC32} (2)
T \p{Canonical_Combining_Class: 33} \p{Canonical_Combining_Class=
CCC33} (1)
T \p{Canonical_Combining_Class: 34} \p{Canonical_Combining_Class=
CCC34} (1)
T \p{Canonical_Combining_Class: 35} \p{Canonical_Combining_Class=
CCC35} (1)
T \p{Canonical_Combining_Class: 36} \p{Canonical_Combining_Class=
CCC36} (1)
T \p{Canonical_Combining_Class: 84} \p{Canonical_Combining_Class=
CCC84} (1)
T \p{Canonical_Combining_Class: 91} \p{Canonical_Combining_Class=
CCC91} (1)
T \p{Canonical_Combining_Class: 103} \p{Canonical_Combining_Class=
CCC103} (2)
T \p{Canonical_Combining_Class: 107} \p{Canonical_Combining_Class=
CCC107} (4)
T \p{Canonical_Combining_Class: 118} \p{Canonical_Combining_Class=
CCC118} (2)
T \p{Canonical_Combining_Class: 122} \p{Canonical_Combining_Class=
CCC122} (4)
T \p{Canonical_Combining_Class: 129} \p{Canonical_Combining_Class=
CCC129} (1)
T \p{Canonical_Combining_Class: 130} \p{Canonical_Combining_Class=
CCC130} (6)
T \p{Canonical_Combining_Class: 132} \p{Canonical_Combining_Class=
CCC132} (1)
T \p{Canonical_Combining_Class: 133} \p{Canonical_Combining_Class=
CCC133} (0)
T \p{Canonical_Combining_Class: 200} \p{Canonical_Combining_Class=
左下方附件} (0)
T \p{Canonical_Combining_Class: 202} \p{Canonical_Combining_Class=
附_下面} (5)
T \p{Canonical_Combining_Class: 214} \p{Canonical_Combining_Class=
附在上面} (1)
T \p{Canonical_Combining_Class: 216} \p{Canonical_Combining_Class=
右上方附件} (9)
T \p{Canonical_Combining_Class: 218} \p{Canonical_Combining_Class=
下面_左} (1)
T \p{Canonical_Combining_Class: 220} \p{Canonical_Combining_Class=
下面} (152)
T \p{Canonical_Combining_Class: 222} \p{Canonical_Combining_Class=
下面_右} (4)
T \p{Canonical_Combining_Class: 224} \p{Canonical_Combining_Class=
左} (2)
T \p{Canonical_Combining_Class: 226} \p{Canonical_Combining_Class=
右} (1)
T \p{Canonical_Combining_Class: 228} \p{Canonical_Combining_Class=
左上角} (3)
T \p{Canonical_Combining_Class: 230} \p{Canonical_Combining_Class=
以上} (399)
T \p{Canonical_Combining_Class: 232} \p{Canonical_Combining_Class=
右上方} (4)
T \p{Canonical_Combining_Class: 233} \p{Canonical_Combining_Class=
双_下方} (4)
T \p{Canonical_Combining_Class: 234} \p{Canonical_Combining_Class=
双上} (5)
T \p{Canonical_Combining_Class: 240} \p{Canonical_Combining_Class=
Iota_下标} (1)
\p{Canonical_Combining_Class: A} \p{Canonical_Combining_Class=
以上} (399)
\p{Canonical_Combining_Class: 以上}(简称:\p{Ccc=A})(399)
\p{Canonical_Combining_Class:Above_Left}(简称:\p{Ccc=AL})(3)
\p{Canonical_Combining_Class:Above_Right}(简称:\p{Ccc=AR})(4)
\p{Canonical_Combining_Class: AL} \p{Canonical_Combining_Class=
左上角} (3)
\p{Canonical_Combining_Class:AR} \p{Canonical_Combining_Class=
右上方} (4)
\p{Canonical_Combining_Class: ATA}\p{Canonical_Combining_Class=
附在上面} (1)
\p{Canonical_Combining_Class:ATAR} \p{Canonical_Combining_Class=
右上方附件} (9)
\p{Canonical_Combining_Class: ATB}\p{Canonical_Combining_Class=
附_下面} (5)
\p{Canonical_Combining_Class: ATBL} \p{Canonical_Combining_Class=
左下方附件} (0)
\p{Canonical_Combining_Class: Attached_Above}(简称:\p{Ccc=ATA})
(1)
\p{Canonical_Combining_Class: Attached_Above_Right}(短:
\p{Ccc=ATAR}) (9)
\p{Canonical_Combining_Class: Attached_Below}(简称:\p{Ccc=ATB})
(5)
\p{Canonical_Combining_Class: Attached_Below_Left}(简称:\p{Ccc=
ATBL}) (0)
\p{Canonical_Combining_Class: B} \p{Canonical_Combining_Class=
下面} (152)
\p{Canonical_Combining_Class: 下面}(简称:\p{Ccc=B})(152)
\p{Canonical_Combining_Class:Below_Left}(简称:\p{Ccc=BL})(1)
\p{Canonical_Combining_Class:Below_Right}(简称:\p{Ccc=BR})(4)
\p{Canonical_Combining_Class:BL} \p{Canonical_Combining_Class=
下面_左} (1)
\p{Canonical_Combining_Class: BR} \p{Canonical_Combining_Class=
下面_右} (4)
\p{Canonical_Combining_Class: CCC10}(简称:\p{Ccc=CCC10})(1)
\p{Canonical_Combining_Class: CCC103}(简称:\p{Ccc=CCC103})(2)
\p{Canonical_Combining_Class: CCC107}(简称:\p{Ccc=CCC107})(4)
\p{Canonical_Combining_Class: CCC11}(简称:\p{Ccc=CCC11})(1)
\p{Canonical_Combining_Class: CCC118}(简称:\p{Ccc=CCC118})(2)
\p{Canonical_Combining_Class: CCC12}(简称:\p{Ccc=CCC12})(1)
\p{Canonical_Combining_Class: CCC122}(简称:\p{Ccc=CCC122})(4)
\p{Canonical_Combining_Class: CCC129}(简称:\p{Ccc=CCC129})(1)
\p{Canonical_Combining_Class: CCC13}(简称:\p{Ccc=CCC13})(1)
\p{Canonical_Combining_Class: CCC130}(简称:\p{Ccc=CCC130})(6)
\p{Canonical_Combining_Class: CCC132}(简称:\p{Ccc=CCC132})(1)
\p{Canonical_Combining_Class: CCC133}(简称:\p{Ccc=CCC133})(0)
\p{Canonical_Combining_Class: CCC14}(简称:\p{Ccc=CCC14})(1)
\p{Canonical_Combining_Class: CCC15}(简称:\p{Ccc=CCC15})(1)
\p{Canonical_Combining_Class: CCC16}(简称:\p{Ccc=CCC16})(1)
\p{Canonical_Combining_Class: CCC17}(简称:\p{Ccc=CCC17})(1)
\p{Canonical_Combining_Class: CCC18}(简称:\p{Ccc=CCC18})(2)
\p{Canonical_Combining_Class: CCC19}(简称:\p{Ccc=CCC19})(2)
\p{Canonical_Combining_Class: CCC20}(简称:\p{Ccc=CCC20})(1)
\p{Canonical_Combining_Class: CCC21}(简称:\p{Ccc=CCC21})(1)
\p{Canonical_Combining_Class: CCC22}(简称:\p{Ccc=CCC22})(1)
\p{Canonical_Combining_Class: CCC23}(简称:\p{Ccc=CCC23})(1)
\p{Canonical_Combining_Class: CCC24}(简称:\p{Ccc=CCC24})(1)
\p{Canonical_Combining_Class: CCC25}(简称:\p{Ccc=CCC25})(1)
\p{Canonical_Combining_Class: CCC26}(简称:\p{Ccc=CCC26})(1)
\p{Canonical_Combining_Class: CCC27}(简称:\p{Ccc=CCC27})(2)
\p{Canonical_Combining_Class: CCC28}(简称:\p{Ccc=CCC28})(2)
\p{Canonical_Combining_Class: CCC29}(简称:\p{Ccc=CCC29})(2)
\p{Canonical_Combining_Class: CCC30}(简称:\p{Ccc=CCC30})(2)
\p{Canonical_Combining_Class: CCC31}(简称:\p{Ccc=CCC31})(2)
\p{Canonical_Combining_Class: CCC32}(简称:\p{Ccc=CCC32})(2)
\p{Canonical_Combining_Class: CCC33}(简称:\p{Ccc=CCC33})(1)
\p{Canonical_Combining_Class: CCC34}(简称:\p{Ccc=CCC34})(1)
\p{Canonical_Combining_Class: CCC35}(简称:\p{Ccc=CCC35})(1)
\p{Canonical_Combining_Class: CCC36}(简称:\p{Ccc=CCC36})(1)
\p{Canonical_Combining_Class: CCC84}(简称:\p{Ccc=CCC84})(1)
\p{Canonical_Combining_Class: CCC91}(简称:\p{Ccc=CCC91})(1)
\p{Canonical_Combining_Class:DA} \p{Canonical_Combining_Class=
双上} (5)
\p{Canonical_Combining_Class:数据库} \p{Canonical_Combining_Class=
双_下方} (4)
\p{Canonical_Combining_Class:Double_Above}(简称:\p{Ccc=DA})(5)
\p{Canonical_Combining_Class:Double_Below}(简称:\p{Ccc=DB})(4)
\p{Canonical_Combining_Class: Iota_Subscript}(简称:\p{Ccc=IS})
(1)
\p{Canonical_Combining_Class: IS} \p{Canonical_Combining_Class=
Iota_下标} (1)
\p{Canonical_Combining_Class: Kana_Voicing}(简称:\p{Ccc=KV})(2)
\p{Canonical_Combining_Class: KV} \p{Canonical_Combining_Class=
假名_配音} (2)
\p{Canonical_Combining_Class: L} \p{Canonical_Combining_Class=
左} (2)
\p{Canonical_Combining_Class:左}(简称:\p{Ccc=L})(2)
\p{Canonical_Combining_Class: NK} \p{Canonical_Combining_Class=
努克塔} (19)
\p{Canonical_Combining_Class: Not_Reordered}(简称:\p{Ccc=NR})
(1_113_367 加上以上所有的 Unicode 代码
点)
\p{Canonical_Combining_Class:NR} \p{Canonical_Combining_Class=
Not_Reordered}(1_113_367 加上所有
Unicode 代码点以上)
\p{Canonical_Combining_Class: Nukta}(简称:\p{Ccc=NK})(19)
\p{Canonical_Combining_Class:OV} \p{Canonical_Combining_Class=
叠加} (32)
\p{Canonical_Combining_Class: Overlay}(简称:\p{Ccc=OV})(32)
\p{Canonical_Combining_Class: R} \p{Canonical_Combining_Class=
右} (1)
\p{Canonical_Combining_Class:右}(简称:\p{Ccc=R})(1)
\p{Canonical_Combining_Class: Virama}(简称:\p{Ccc=VR})(44)
\p{Canonical_Combining_Class: VR} \p{Canonical_Combining_Class=
维拉玛} (44)
\p{罐头} \p{Canadian_Aboriginal} (= \p{Script=
加拿大原住民}) (710)
\p{Cari} \p{Carian} (= \p{Script=Carian}) (不是
\p{块=卡里安}) (49)
\p{Carian} \p{Script=Carian}(简称:\p{Cari};不是
\p{块=卡里安}) (49)
\p{Case_Ignorable} \p{Case_Ignorable=Y}(简称:\p{CI})(1961)
\p{Case_Ignorable: N*}(简称:\p{CI=N}, \P{CI})(1_112_151 加
以上所有 - Unicode 代码点)
\p{Case_Ignorable: Y*}(简称:\p{CI=Y}, \p{CI})(1961)
\p{大小写} \p{大小写=Y} (3671)
\p{Cased: N*} (Single: \P{Cased}) (1_110_441 加上所有
Unicode 代码点以上)
\p{Cased: Y*} (单曲: \p{Cased}) (3671)
\p{Cased_Letter} \p{General_Category=Cased_Letter}(简称:
\p{LC}) (3362)
\p{类别:*} \p{一般_类别:*}
\p{Caucasian_Albanian} \p{Script=Caucasian_Albanian} (简称:
\p{Aghb}; 不是 \p{块=
高加索人_阿尔巴尼亚人}) (53)
\p{抄送} \p{XPosixCntrl} (= \p{General_Category=
控制}) (65)
\p{抄送:*} \p{Canonical_Combining_Class:*}
\p{CE} \p{Composition_Exclusion} (=
\p{Composition_Exclusion=Y}) (81)
\p{CE: *} \p{Composition_Exclusion: *}
\p{Cf} \p{格式} (= \p{General_Category=Format})
(150)
\p{Chakma} \p{Script=Chakma}(简称:\p{Cakm};不是
\p{方块=Chakma}) (67)
\p{Cham} \p{Script=Cham}(不是 \p{Block=Cham})(83)
\p{Changes_When_Casefolded} \p{Changes_When_Casefolded=Y}(简称:
\p{CWCF}) (1156)
\p{Changes_When_Casefolded: N*}(简称:\p{CWCF=N}, \P{CWCF})
(1_112_956 加上以上所有的 Unicode 代码
点)
\p{Changes_When_Casefolded: Y*}(简称:\p{CWCF=Y}, \p{CWCF})
(1156)
\p{Changes_When_Casemapped} \p{Changes_When_Casemapped=Y}(简称:
\p{CWCM}) (2236)
\p{Changes_When_Casemapped: N*}(简称:\p{CWCM=N}, \P{CWCM})
(1_111_876 加上以上所有的 Unicode 代码
点)
\p{Changes_When_Casemapped: Y*}(简称:\p{CWCM=Y}, \p{CWCM})
(2236)
\p{Changes_When_Lowercased} \p{Changes_When_Lowercased=Y}(简称:
\p{CWL}) (1092)
\p{Changes_When_Lowercased: N*}(简称:\p{CWL=N}, \P{CWL})
(1_113_020 加上以上所有的 Unicode 代码
点)
\p{Changes_When_Lowercased: Y*}(简称:\p{CWL=Y}, \p{CWL})(1092)
\p{Changes_When_NFKC_Casefolded}\p{Changes_When_NFKC_Casefolded=
Y}(简称:\p{CWKCF})(10_005)
\p{Changes_When_NFKC_Casefolded:N*}(简称:\p{CWKCF=N},
\P{CWKCF}) (1_104_107 加上以上所有-
Unicode 代码点)
\p{Changes_When_NFKC_Casefolded: Y*}(简称:\p{CWKCF=Y},
\p{CWKCF}) (10_005)
\p{Changes_When_Titlecased} \p{Changes_When_Titlecased=Y}(简称:
\p{CWT}) (1148)
\p{Changes_When_Titlecased: N*}(简称:\p{CWT=N}, \P{CWT})
(1_112_964 加上以上所有的 Unicode 代码
点)
\p{Changes_When_Titlecased: Y*} (简称: \p{CWT=Y}, \p{CWT}) (1148)
\p{Changes_When_Uppercased} \p{Changes_When_Uppercased=Y}(简称:
\p{CWU}) (1175)
\p{Changes_When_Uppercased: N*}(简称:\p{CWU=N}, \P{CWU})
(1_112_937 加上以上所有的 Unicode 代码
点)
\p{Changes_When_Uppercased: Y*}(简称:\p{CWU=Y}, \p{CWU})(1175)
\p{Cher} \p{Cherokee} (= \p{Script=Cherokee}) (不是
\p{块=切诺基}) (85)
\p{Cherokee} \p{Script=Cherokee}(简称:\p{Cher};不是
\p{块=切诺基}) (85)
\p{CI} \p{Case_Ignorable} (= \p{Case_Ignorable=
是}) (1961)
\p{CI: *} \p{Case_Ignorable: *}
X \p{CJK} \p{CJK_Unified_Ideographs} (= \p{块=
CJK_Unified_Ideographs}) (20_992)
X \p{CJK_Compat} \p{CJK_Compatibility} (= \p{块=
CJK_兼容性}) (256)
X \p{CJK_Compat_Forms} \p{CJK_Compatibility_Forms} (= \p{块=
CJK_Compatibility_Forms}) (32)
X \p{CJK_Compat_Ideographs} \p{CJK_Compatibility_Ideographs} (=
\p{块=CJK_Compatibility_Ideographs})
(512)
X \p{CJK_Compat_Ideographs_Sup}
\p{CJK_Compatibility_Ideographs_-
补充}(= \p{块=
CJK_兼容性_表意文字_-
补充}) (544)
X \p{CJK_Compatibility} \p{Block=CJK_Compatibility}(简称:
\p{中日韩兼容}) (256)
X \p{CJK_Compatibility_Forms} \p{块=CJK_Compatibility_Forms}
(简称:\p{InCJKCompatForms})(32)
X \p{CJK_Compatibility_Ideographs} \p{块=
CJK_Compatibility_Ideographs}(简称:
\p{InCJKCompatIdeographs}) (512)
X \p{CJK_Compatibility_Ideographs_Supplement} \p{块=
CJK_Compatibility_Ideographs_Suplement}
(简称:\p{InCJKCompatIdeographsSup})
(544)
X \p{CJK_Ext_A} \p{CJK_Unified_Ideographs_Extension_A} (=
\p{块=
CJK_Unified_Ideographs_Extension_A})
(6592)
X \p{CJK_Ext_B} \p{CJK_Unified_Ideographs_Extension_B} (=
\p{块=
CJK_Unified_Ideographs_Extension_B})
(42_720)
X \p{CJK_Ext_C} \p{CJK_Unified_Ideographs_Extension_C} (=
\p{块=
CJK_Unified_Ideographs_Extension_C})
(4160)
X \p{CJK_Ext_D} \p{CJK_Unified_Ideographs_Extension_D} (=
\p{块=
CJK_Unified_Ideographs_Extension_D})
(224)
X \p{CJK_Radicals_Sup} \p{CJK_Radicals_Supplement} (= \p{块=
中日韩偏旁部首补充}) (128)
X \p{CJK_Radicals_Supplement} \p{块=CJK_Radicals_Supplement}
(简称:\p{InCJKRadicalsSup})(128)
X \p{CJK_Strokes} \p{块=CJK_Strokes} (48)
X \p{CJK_Symbols} \p{CJK_Symbols_And_Punctuation} (=
\p{块=CJK_Symbols_And_Punctuation})
(64)
X \p{CJK_Symbols_And_Punctuation} \p{块=
CJK_Symbols_And_Punctuation}(简称:
\p{中日韩符号}) (64)
X \p{CJK_Unified_Ideographs} \p{块=CJK_Unified_Ideographs}
(简称:\p{InCJK})(20_992)
X \p{CJK_Unified_Ideographs_Extension_A} \p{块=
CJK_Unified_Ideographs_Extension_A}
(简称:\p{InCJKExtA})(6592)
X \p{CJK_Unified_Ideographs_Extension_B} \p{块=
CJK_Unified_Ideographs_Extension_B}
(简称:\p{InCJKExtB})(42_720)
X \p{CJK_Unified_Ideographs_Extension_C} \p{块=
CJK_Unified_Ideographs_Extension_C}
(简称:\p{InCJKExtC})(4160)
X \p{CJK_Unified_Ideographs_Extension_D} \p{块=
CJK_Unified_Ideographs_Extension_D}
(简称:\p{InCJKExtD})(224)
\p{Close_Punctuation} \p{General_Category=Close_Punctuation}
(简称:\p{Pe})(73)
\p{Cn} \p{未分配} (= \p{General_Category=
未分配}) (861_575 加上以上所有-
Unicode 代码点)
\p{Cntrl} \p{XPosixCntrl} (= \p{General_Category=
控制}) (65)
\p{Co} \p{私人_使用} (= \p{General_Category=
Private_Use})(不是 \p{Private_Use_Area})
(137_468)
X \p{Combining_Diacritical_Marks} \p{块=
Combining_Diacritical_Marks}(简称:
\p{变音符号}) (112)
X \p{Combining_Diacritical_Marks_Extended} \p{块=
组合变音标记扩展}
(简称:\p{InDiacriticalsExt})(80)
X \p{Combining_Diacritical_Marks_For_Symbols} \p{块=
Combining_Diaritic_Marks_For_Symbols}
(简称:\p{InDiacriticalsForSymbols})
(48)
X \p{Combining_Diacritical_Marks_Supplement} \p{块=
组合变音标记补充}
(简称:\p{InDiacriticalsSup})(64)
X \p{Combining_Half_Marks} \p{Block=Combining_Half_Marks}(简称:
\p{InHalfMarks}) (16)
\p{Combining_Mark} \p{Mark} (= \p{General_Category=Mark})
(1830)
X \p{Combining_Marks_For_Symbols}
\p{Combining_Diaritic_Marks_For_-
符号}(= \p{块=
组合_变音标记_For_-
符号}) (48)
\p{Common} \p{Script=Common}(简称:\p{Zyyy})(7129)
X \p{Common_Indic_Number_Forms} \p{块=Common_Indic_Number_Forms}
(简称:\p{InIndicNumberForms})(16)
\p{Comp_Ex} \p{Full_Composition_Exclusion} (=
\p{Full_Composition_Exclusion=Y}) (1120)
\p{Comp_Ex:*} \p{Full_Composition_Exclusion:*}
X \p{Compat_Jamo} \p{Hangul_Compatibility_Jamo} (= \p{块=
Hangul_Compatibility_Jamo}) (96)
\p{Composition_Exclusion} \p{Composition_Exclusion=Y}(简称:
\p{CE}) (81)
\p{Composition_Exclusion: N*}(简称:\p{CE=N}, \P{CE})(1_114_031
加上以上所有的 Unicode 代码点)
\p{Composition_Exclusion: Y*} (简称:\p{CE=Y}, \p{CE}) (81)
\p{连接器标点} \p{General_Category=
Connector_Punctuation}(简称:\p{Pc})
(10)
\p{控制} \p{XPosixCntrl} (= \p{General_Category=
控制}) (65)
X \p{Control_Pictures} \p{块=Control_Pictures} (64)
\p{Copt} \p{Coptic} (= \p{Script=Coptic}) (不是
\p{块=科普特}) (137)
\p{Coptic} \p{Script=Coptic}(简称:\p{Copt};不是
\p{块=科普特}) (137)
X \p{Coptic_Epact_Numbers} \p{块=Coptic_Epact_Numbers} (32)
X \p{计数棒} \p{计数棒数字} (= \p{块=
计数杆数字}) (32)
X \p{Counting_Rod_Numerals} \p{Block=Counting_Rod_Numerals}(简称:
\p{InCountingRod}) (32)
\p{Cprt} \p{塞浦路斯} (= \p{Script=塞浦路斯}) (55)
\p{Cs} \p{代理} (= \p{General_Category=
代理人})(2048)
\p{楔形文字} \p{Script=楔形文字}(简称:\p{Xsux};不是
\p{块=楔形文字}) (1037)
X \p{楔形文字数} \p{楔形文字数_And_Punctuation}(=
\p{块=
楔形文字_数字_和_标点符号}) (128)
X \p{Cuneiform_Numbers_And_Punctuation} \p{块=
楔形文字_数字_和_标点符号}
(简称:\p{InCuneiformNumbers})(128)
\p{货币符号} \p{General_Category=货币符号}
(简称:\p{Sc})(52)
X \p{货币符号} \p{区块=货币符号} (48)
\p{CWCF} \p{Changes_When_Casefolded} (=
\p{Changes_When_Casefolded=Y}) (1156)
\p{CWCF:*} \p{Changes_When_Casefolded:*}
\p{CWCM} \p{Changes_When_Casemapped} (=
\p{Changes_When_Casemapped=Y}) (2236)
\p{CWCM:*}\p{Changes_When_Casemapped:*}
\p{CWKCF} \p{Changes_When_NFKC_Casefolded} (=
\p{Changes_When_NFKC_Casefolded=Y})
(10_005)
\p{CWKCF:*} \p{Changes_When_NFKC_Casefolded:*}
\p{CWL} \p{Changes_When_Lowercased} (=
\p{Changes_When_Lowercased=Y}) (1092)
\p{CWL: *} \p{Changes_When_Lowercased: *}
\p{CWT} \p{Changes_When_Titlecased} (=
\p{Changes_When_Titlecased=Y}) (1148)
\p{CWT: *} \p{Changes_When_Titlecased: *}
\p{CWU} \p{Changes_When_Uppercased} (=
\p{Changes_When_Uppercased=Y}) (1175)
\p{CWU: *} \p{Changes_When_Uppercased: *}
\p{Cypriot} \p{Script=Cypriot}(简称:\p{Cprt})(55)
X \p{塞浦路斯音节} \p{块=塞浦路斯音节} (64)
\p{Cyrillic} \p{Script=Cyrillic}(简写:\p{Cyrl};不是
\p{块=西里尔字母}) (431)
X \p{Cyrillic_Ext_A} \p{Cyrillic_Extended_A} (= \p{块=
西里尔文_扩展_A}) (32)
X \p{Cyrillic_Ext_B} \p{Cyrillic_Extended_B} (= \p{块=
西里尔文_扩展_B}) (96)
X \p{Cyrillic_Extended_A} \p{Block=Cyrillic_Extended_A} (简称:
\p{InCyrillicExtA}) (32)
X \p{Cyrillic_Extended_B} \p{Block=Cyrillic_Extended_B} (简称:
\p{InCyrillicExtB}) (96)
X \p{Cyrillic_Sup} \p{Cyrillic_Supplement} (= \p{块=
西里尔文_补充}) (48)
X \p{Cyrillic_Supplement} \p{Block=Cyrillic_Supplement}(简称:
\p{InCyrillicSup}) (48)
X \p{Cyrillic_Supplementary} \p{Cyrillic_Supplementary} (= \p{Block=
西里尔文_补充}) (48)
\p{Cyrl} \p{Cyrillic} (= \p{Script=Cyrillic}) (不是
\p{块=西里尔字母}) (431)
\p{冲刺} \p{冲刺=Y} (28)
\p{Dash: N*} (单曲: \P{Dash}) (1_114_084 加上所有
Unicode 代码点以上)
\p{Dash: Y*} (单曲: \p{Dash}) (28)
\p{Dash_Punctuation} \p{General_Category=Dash_Punctuation}
(简称:\p{Pd})(24)
\p{Decimal_Number} \p{XPosixDigit} (= \p{General_Category=
十进制数}) (540)
\p{Decomposition_Type: 可以} \p{Decomposition_Type=Canonical}
(13_232)
\p{Decomposition_Type: Canonical}(简称:\p{Dt=Can})(13_232)
\p{Decomposition_Type: Circle}(简称:\p{Dt=Enc})(240)
\p{Decomposition_Type: Com} \p{Decomposition_Type=Compat} (720)
\p{Decomposition_Type: Compat}(简称:\p{Dt=Com})(720)
\p{分解类型:Enc} \p{分解类型=圆形} (240)
\p{Decomposition_Type: Fin} \p{Decomposition_Type=Final} (240)
\p{Decomposition_Type: Final}(简称:\p{Dt=Fin})(240)
\p{Decomposition_Type: 字体}(简称:\p{Dt=Font})(1184)
\p{分解类型:Fra} \p{分解类型=分数} (20)
\p{Decomposition_Type: Fraction}(简称:\p{Dt=Fra})(20)
\p{分解类型:初始} \p{分解类型=初始} (171)
\p{Decomposition_Type: Initial}(简称:\p{Dt=Init})(171)
\p{分解类型:Iso} \p{分解类型=隔离} (238)
\p{Decomposition_Type:Isolated}(简称:\p{Dt=Iso})(238)
\p{分解类型:中} \p{分解类型=中} (82)
\p{Decomposition_Type: Medial}(简称:\p{Dt=Med})(82)
\p{分解类型:纳尔} \p{分解类型=窄} (122)
\p{Decomposition_Type: Narrow}(简称:\p{Dt=Nar})(122)
\p{Decomposition_Type: Nb} \p{Decomposition_Type=Nobreak} (5)
\p{Decomposition_Type: Nobreak}(简称:\p{Dt=Nb})(5)
\p{分解类型:非佳能} \p{分解类型=
Non_Canonical}(Perl 扩展)(3661)
\p{Decomposition_Type: Non_Canonical} 所有非规范的联合
分解(简称:\p{Dt=NonCanon})
(Perl 扩展) (3661)
\p{Decomposition_Type: None}(简称:\p{Dt=None})(1_097_219 加
以上所有 - Unicode 代码点)
\p{Decomposition_Type: Small} (短: \p{Dt=Sml}) (26)
\p{分解类型:Sml} \p{分解类型=小} (26)
\p{分解类型:正方形} \p{分解类型=正方形} (284)
\p{Decomposition_Type: Square}(简称:\p{Dt=Sqr})(284)
\p{Decomposition_Type: Sub}(简称:\p{Dt=Sub})(38)
\p{分解类型:超级} \p{分解类型=超级} (152)
\p{Decomposition_Type: Super}(简称:\p{Dt=Sup})(152)
\p{分解类型:垂直} \p{分解类型=垂直} (35)
\p{Decomposition_Type: Vertical}(简称:\p{Dt=Vert})(35)
\p{Decomposition_Type: Wide}(短:\p{Dt=Wide})(104)
\p{Default_Ignorable_Code_Point} \p{Default_Ignorable_Code_Point=
Y}(简称:\p{DI})(4173)
\p{Default_Ignorable_Code_Point: N*} (简称:\p{DI=N}, \P{DI})
(1_109_939 加上以上所有的 Unicode 代码
点)
\p{Default_Ignorable_Code_Point: Y*} (简称:\p{DI=Y}, \p{DI})
(4173)
\p{Dep} \p{弃用} (= \p{弃用=Y}) (111)
\p{Dep: *} \p{弃用: *}
\p{Deprecated} \p{Deprecated=Y}(简称:\p{Dep})(111)
\p{已弃用:N*}(简称:\p{Dep=N}, \P{Dep})(1_114_001
加上以上所有的 Unicode 代码点)
\p{已弃用:Y*}(简称:\p{Dep=Y}, \p{Dep})(111)
\p{Deseret} \p{Script=Deseret}(简称:\p{Dsrt})(80)
\p{天城文} \p{天城文} (= \p{Script=天城文})
(不是 \p{Block=Devanagari}) (152)
\p{天城文} \p{Script=天城文}(简称:\p{天城文};
不是 \p{Block=Devanagari}) (152)
X \p{梵文_Ext} \p{梵文_扩展} (= \p{块=
梵文_扩展}) (32)
X \p{Devanagari_Extended} \p{Block=Devanagari_Extended}(简称:
\p{InDevanagariExt}) (32)
\p{DI} \p{Default_Ignorable_Code_Point} (=
\p{Default_Ignorable_Code_Point=Y})
(4173)
\p{DI: *} \p{Default_Ignorable_Code_Point: *}
\p{Dia} \p{变音符号} (= \p{变音符号=Y}) (766)
\p{音标:*} \p{变音符号:*}
\p{Diacritic} \p{Diacritic=Y}(简称:\p{Dia})(766)
\p{变音符号:N*}(简称:\p{Dia=N}, \P{Dia})(1_113_346
加上以上所有的 Unicode 代码点)
\p{变音符号:Y*}(简称:\p{Dia=Y}, \p{Dia})(766)
X \p{变音符号} \p{Combining_Diacritical_Marks} (=
\p{块=Combining_Diaritic_Marks})
(112)
X \p{变音符号_Ext} \p{组合变音标记_扩展}
(= \p{块=
组合变音标记扩展})
(80)
X \p{变音符号_For_符号}
\p{Combining_Diaritic_Marks_For_-
符号}(= \p{块=
组合_变音标记_For_-
符号}) (48)
X \p{变音符号_Sup} \p{Combining_Diaritic_Marks_Suplement}
(= \p{块=
Combining_Diacritical_Marks_Supplement})
(64)
\p{数字} \p{XPosixDigit} (= \p{General_Category=
十进制数}) (540)
X \p{装饰符号} \p{块=装饰符号} (192)
X \p{Domino} \p{Domino_Tiles} (= \p{块=
多米诺瓷砖}) (112)
X \p{Domino_Tiles} \p{Block=Domino_Tiles}(简称:
\p{InDomino}) (112)
\p{Dsrt} \p{德塞雷特} (= \p{脚本=德塞雷特}) (80)
\p{Dt:*} \p{分解类型:*}
\p{Dupl} \p{Duployan} (= \p{Script=Duployan}) (不是
\p{块=Duployan}) (143)
\p{Duployan} \p{Script=Duployan}(简称:\p{Duploan};不是
\p{块=Duployan}) (143)
\p{Ea: *} \p{东亚宽度: *}
\p{East_Asian_Width: A} \p{East_Asian_Width=不明确} (138_746)
\p{East_Asian_Width: Ambiguous}(简称:\p{Ea=A})(138_746)
\p{East_Asian_Width: F} \p{East_Asian_Width=全宽} (104)
\p{East_Asian_Width: 全角}(简称:\p{Ea=F})(104)
\p{East_Asian_Width: H} \p{East_Asian_Width=半宽} (123)
\p{East_Asian_Width: 半角}(简称:\p{Ea=H})(123)
\p{East_Asian_Width: N} \p{East_Asian_Width=中性} (801_894 加
以上所有 - Unicode 代码点)
\p{East_Asian_Width: Na} \p{East_Asian_Width=窄} (111)
\p{East_Asian_Width: Narrow}(简称:\p{Ea=Na})(111)
\p{East_Asian_Width: Neutral} (Short: \p{Ea=N}) (801_894 加上所有
Unicode 代码点以上)
\p{East_Asian_Width: W} \p{East_Asian_Width=Wide} (173_134)
\p{East_Asian_Width: Wide} (短: \p{Ea=W}) (173_134)
\p{埃及} \p{埃及象形文字} (= \p{脚本=
埃及象形文字})(不是 \p{Block=
埃及象形文字})(1071)
\p{Egyptian_Hieroglyphs} \p{Script=Egyptian_Hieroglyphs}(简称:
\p{埃及}; 不是 \p{块=
埃及象形文字})(1071)
\p{Elba} \p{Elbasan} (= \p{Script=Elbasan}) (不是
\p{块=爱尔巴桑}) (40)
\p{Elbasan} \p{Script=Elbasan}(简称:\p{Elba};不是
\p{块=爱尔巴桑}) (40)
X \p{表情符号} \p{块=表情符号} (80)
X \p{封闭字母数字} \p{封闭字母数字} (= \p{块=
封闭字母数字}) (160)
X \p{Enclosure_Alphanum_Sup} \p{Enheld_Alphanumeric_Supplement} (=
\p{块=
封闭字母数字补充}) (256)
X \p{Enclosed_Alphanumeric_Supplement} \p{块=
封闭_字母数字_补充}
(简称:\p{InEnclosedAlphanumSup})(256)
X \p{封闭的字母数字} \p{块=封闭的字母数字}
(简称:\p{InEnclosedAlphanum})(160)
X \p{Enclosure_CJK} \p{Enheld_CJK_Letters_And_Months} (=
\p{块=
附上_CJK_Letters_And_Months}) (256)
X \p{Enclosed_CJK_Letters_And_Months} \p{块=
Enclosed_CJK_Letters_And_Months}(简称:
\p{InEnclosureCJK}) (256)
X \p{Enclosure_Idegraphic_Sup} \p{Enheld_Idegraphic_Supplement}
(= \p{块=
附上表意文字补充}) (256)
X \p{Enclosed_Ideographic_Supplement} \p{块=
Enclosed_Ideographic_Supplement}(简称:
\p{InEnclosureIdegraphicSup}) (256)
\p{Enclosure_Mark} \p{General_Category=Enclosure_Mark}
(简称:\p{Me})(13)
\p{Ethi} \p{Ethiopic} (= \p{Script=Ethiopic}) (不是
\p{块=埃塞俄比亚}) (495)
\p{Ethiopic} \p{Script=Ethiopic} (简称:\p{Ethi};不是
\p{块=埃塞俄比亚}) (495)
X \p{埃塞俄比亚_Ext} \p{埃塞俄比亚_扩展} (= \p{块=
埃塞俄比亚_扩展}) (96)
X \p{埃塞俄比亚_Ext_A} \p{埃塞俄比亚_扩展_A} (= \p{块=
埃塞俄比亚_扩展_A}) (48)
X \p{Ethiopic_Extended} \p{Block=Ethiopic_Extended}(简称:
\p{InEthiopicExt}) (96)
X \p{Ethiopic_Extended_A} \p{Block=Ethiopic_Extended_A} (简称:
\p{InEthiopicExtA}) (48)
X \p{Ethiopic_Sup} \p{Ethiopic_Supplement} (= \p{块=
Ethipic_Supplement}) (32)
X \p{Ethiopic_Supplement} \p{Block=Ethiopic_Supplement} (简称:
\p{在埃塞俄比亚}) (32)
\p{Ext} \p{扩展器} (= \p{扩展器=Y}) (38)
\p{扩展:*} \p{扩展:*}
\p{Extender} \p{Extender=Y}(简称:\p{Ext})(38)
\p{Extender: N*} (短: \p{Ext=N}, \P{Ext}) (1_114_074
加上以上所有的 Unicode 代码点)
\p{Extender: Y*} (简称: \p{Ext=Y}, \p{Ext}) (38)
\p{Final_Punctuation} \p{General_Category=Final_Punctuation}
(简称:\p{Pf})(10)
\p{格式} \p{General_Category=格式}(简称:
\p{CF}) (150)
\p{Full_Composition_Exclusion} \p{Full_Composition_Exclusion=Y}
(简称:\p{CompEx})(1120)
\p{Full_Composition_Exclusion: N*}(简称:\p{CompEx=N},
\P{CompEx}) (1_112_992 加上以上所有-
Unicode 代码点)
\p{Full_Composition_Exclusion: Y*}(简称:\p{CompEx=Y},
\p{CompEx}) (1120)
\p{Gc: *} \p{General_Category: *}
\p{GCB: *} \p{Grapheme_Cluster_Break: *}
\p{General_Category: C} \p{General_Category=Other}(1_001_306 加上
以上所有 - Unicode 代码点)
\p{General_Category: Cased_Letter} [\p{Ll}\p{Lu}\p{Lt}](简称:
\p{Gc=LC}, \p{LC}) (3362)
\p{General_Category: 抄送} \p{General_Category=Control} (65)
\p{General_Category: Cf} \p{General_Category=格式} (150)
\p{General_Category: Close_Punctuation}(简称:\p{Gc=Pe}, \p{Pe})
(73)
\p{General_Category: Cn} \p{General_Category=未分配} (861_575
加上以上所有的 Unicode 代码点)
\p{General_Category: 控制} \p{General_Category=Control} (65)
\p{General_Category: Co} \p{General_Category=Private_Use} (137_468)
\p{General_Category: 组合_标记} \p{General_Category=标记}
(1830)
\p{General_Category: Connector_Punctuation}(简称:\p{Gc=Pc},
\p{PC}) (10)
\p{General_Category: Control}(简称:\p{Gc=Cc}, \p{Cc})(65)
\p{General_Category:Cs} \p{General_Category=代理} (2048)
\p{General_Category: Currency_Symbol} (简称:\p{Gc=Sc}, \p{Sc})
(52)
\p{General_Category: Dash_Punctuation}(简称:\p{Gc=Pd}, \p{Pd})
(24)
\p{General_Category: Decimal_Number}(简称:\p{Gc=Nd}, \p{Nd})
(540)
\p{General_Category: 数字} \p{General_Category=Decimal_Number}
(540)
\p{General_Category: Enclosure_Mark}(简称:\p{Gc=Me}, \p{Me})
(13)
\p{General_Category: Final_Punctuation} (简称:\p{Gc=Pf}, \p{Pf})
(10)
\p{General_Category: 格式}(简称:\p{Gc=Cf}, \p{Cf})(150)
\p{General_Category: Initial_Punctuation}(简称:\p{Gc=Pi},
\p{Pi}) (12)
\p{General_Category: L} \p{General_Category=字母} (102_725)
X \p{General_Category: L&} \p{General_Category=Cased_Letter} (3362)
X \p{General_Category: L_} \p{General_Category=Cased_Letter} 注意
尾随的“_”很重要,尽管
松散的匹配规则。 (3362)
\p{General_Category: LC} \p{General_Category=Cased_Letter} (3362)
\p{General_Category: Letter}(简称:\p{Gc=L}, \p{L})(102_725)
\p{General_Category: Letter_Number}(简称:\p{Gc=Nl}, \p{Nl})
(236)
\p{General_Category: Line_Separator} (简称: \p{Gc=Zl}, \p{Zl}) (1)
\p{General_Category: Ll} \p{General_Category=Lowercase_Letter}
(/i=General_Category=Cased_Letter)
(1841)
\p{General_Category: Lm} \p{General_Category=Modifier_Letter} (248)
\p{General_Category: Lo} \p{General_Category=Other_Letter} (99_115)
\p{General_Category:Lowercase_Letter}(简称:\p{Gc=Ll},\p{Ll};
/i=General_Category=Cased_Letter) (1841)
\p{General_Category: Lt} \p{General_Category=Titlecase_Letter}
(/i=General_Category=Cased_Letter) (31)
\p{General_Category: 卢} \p{General_Category=Uppercase_Letter}
(/i=General_Category=Cased_Letter)
(1490)
\p{General_Category: M} \p{General_Category=Mark} (1830)
\p{General_Category: Mark}(简称:\p{Gc=M}, \p{M})(1830 年)
\p{General_Category: Math_Symbol}(简称:\p{Gc=Sm}, \p{Sm})(948)
\p{General_Category:Mc} \p{General_Category=Spacing_Mark} (399)
\p{General_Category: 我} \p{General_Category=Enclosure_Mark} (13)
\p{General_Category: Mn} \p{General_Category=Nonspacing_Mark}
(1418)
\p{General_Category: Modifier_Letter}(简称:\p{Gc=Lm}, \p{Lm})
(248)
\p{General_Category: Modifier_Symbol}(简称:\p{Gc=Sk}, \p{Sk})
(116)
\p{General_Category: N} \p{General_Category=编号} (1346)
\p{General_Category: Nd} \p{General_Category=Decimal_Number} (540)
\p{General_Category: Nl} \p{General_Category=Letter_Number} (236)
\p{General_Category: 否} \p{General_Category=Other_Number} (570)
\p{General_Category: Nonspacing_Mark}(简称:\p{Gc=Mn}, \p{Mn})
(1418)
\p{General_Category: Number}(简称:\p{Gc=N}, \p{N})(1346)
\p{General_Category: Open_Punctuation}(简称:\p{Gc=Ps}, \p{Ps})
(75)
\p{General_Category: 其他}(简称:\p{Gc=C}, \p{C})(1_001_306
加上以上所有的 Unicode 代码点)
\p{General_Category: Other_Letter}(简称:\p{Gc=Lo}, \p{Lo})
(99_115)
\p{General_Category: Other_Number}(简称:\p{Gc=No}, \p{No})(570)
\p{General_Category: Other_Punctuation}(简称:\p{Gc=Po}, \p{Po})
(484)
\p{General_Category: Other_Symbol}(简称:\p{Gc=So}, \p{So})
(5082)
\p{General_Category: P} \p{General_Category=标点符号} (688)
\p{General_Category: Paragraph_Separator}(简称:\p{Gc=Zp},
\p{Zp}) (1)
\p{General_Category: PC} \p{General_Category=
连接器_标点符号} (10)
\p{General_Category: Pd} \p{General_Category=Dash_Punctuation} (24)
\p{General_Category: Pe} \p{General_Category=Close_Punctuation}
(73)
\p{General_Category: Pf} \p{General_Category=Final_Punctuation}
(10)
\p{General_Category: Pi} \p{General_Category=Initial_Punctuation}
(12)
\p{General_Category: Po} \p{General_Category=Other_Punctuation}
(484)
\p{General_Category: Private_Use}(简称:\p{Gc=Co}, \p{Co})
(137_468)
\p{General_Category: Ps} \p{General_Category=Open_Punctuation} (75)
\p{General_Category:标点符号} \p{General_Category=标点符号} (688)
\p{General_Category: 标点符号}(简称:\p{Gc=P}, \p{P})(688)
\p{General_Category: S} \p{General_Category=符号} (6198)
\p{General_Category: Sc} \p{General_Category=Currency_Symbol} (52)
\p{General_Category: 分隔符}(简称:\p{Gc=Z}, \p{Z})(19)
\p{General_Category: Sk} \p{General_Category=Modifier_Symbol} (116)
\p{General_Category: Sm} \p{General_Category=Math_Symbol} (948)
\p{General_Category: 所以} \p{General_Category=Other_Symbol} (5082)
\p{General_Category: Space_Separator}(简称:\p{Gc=Zs}, \p{Zs})
(17)
\p{General_Category: Spacing_Mark}(简称:\p{Gc=Mc}, \p{Mc})(399)
\p{General_Category: Surrogate}(简称:\p{Gc=Cs}, \p{Cs})(2048)
\p{General_Category: 符号}(简称:\p{Gc=S}, \p{S})(6198)
\p{General_Category: Titlecase_Letter} (简称:\p{Gc=Lt}, \p{Lt};
/i=General_Category=Cased_Letter) (31)
\p{General_Category: 未分配}(简称:\p{Gc=Cn}, \p{Cn})
(861_575 加上以上所有的 Unicode 代码
点)
\p{General_Category: Uppercase_Letter} (简写: \p{Gc=Lu}, \p{Lu};
/i=General_Category=Cased_Letter) (1490)
\p{General_Category: Z} \p{General_Category=分隔符} (19)
\p{General_Category: Zl} \p{General_Category=Line_Separator} (1)
\p{General_Category: Zp} \p{General_Category=Paragraph_Separator}
(1)
\p{General_Category: Zs} \p{General_Category=Space_Separator} (17)
X \p{General_Punctuation} \p{Block=General_Punctuation} (简称:
\p{标点符号}) (112)
X \p{几何形状} \p{块=几何形状} (96)
X \p{几何形状扩展} \p{几何形状扩展} (=
\p{块=Geometric_Shapes_Extended})
(128)
X \p{Geometric_Shapes_Extended} \p{块=Geometric_Shapes_Extended}
(简称:\p{InGeometricShapesExt})(128)
\p{Geor} \p{Georgian}(= \p{Script=Georgian})(不是
\p{块=格鲁吉亚}) (127)
\p{Georgian} \p{Script=Georgian}(简称:\p{Geor};不是
\p{块=格鲁吉亚}) (127)
X \p{Georgian_Sup} \p{Georgian_Supplement} (= \p{块=
格鲁吉亚_补充}) (48)
X \p{Georgian_Supplement} \p{Block=Georgian_Supplement}(简称:
\p{InGeorgianSup}) (48)
\p{Glag} \p{格拉哥里文} (= \p{脚本=格拉哥里文})
(不是 \p{Block=Glagolitic}) (94)
\p{Glagolitic} \p{Script=Glagolitic} (简称:\p{Glag};
不是 \p{Block=Glagolitic}) (94)
\p{Goth} \p{Gothic} (= \p{Script=Gothic}) (不是
\p{方块=哥特式}) (27)
\p{Gothic} \p{Script=Gothic}(简称:\p{Goth};不是
\p{方块=哥特式}) (27)
\p{Gr_Base} \p{Grapheme_Base} (= \p{Grapheme_Base=Y})
(111_345)
\p{Gr_Base: *} \p{Grapheme_Base: *}
\p{Gr_Ext} \p{Grapheme_Extend} (= \p{Grapheme_Extend=
是}) (1461)
\p{Gr_Ext: *} \p{Grapheme_Extend: *}
\p{Gran} \p{Grantha} (= \p{Script=Grantha}) (不是
\p{块=Grantha}) (83)
\p{Grantha} \p{Script=Grantha}(简称:\p{Gran};不是
\p{块=Grantha}) (83)
\p{图形} \p{XPosixGraph} (250_405)
\p{Grapheme_Base} \p{Grapheme_Base=Y} (简称:\p{GrBase})
(111_345)
\p{Grapheme_Base: N*} (简称:\p{GrBase=N}, \P{GrBase})
(1_002_767 加上以上所有的 Unicode 代码
点)
\p{Grapheme_Base: Y*} (简称: \p{GrBase=Y}, \p{GrBase}) (111_345)
\p{Grapheme_Cluster_Break: CN} \p{Grapheme_Cluster_Break=控制}
(6030)
\p{Grapheme_Cluster_Break:控制}(简称:\p{GCB=CN})(6030)
\p{Grapheme_Cluster_Break:CR}(简称:\p{GCB=CR})(1)
\p{Grapheme_Cluster_Break: EX} \p{Grapheme_Cluster_Break=扩展}
(1461)
\p{Grapheme_Cluster_Break:扩展}(简称:\p{GCB=EX})(1461)
\p{Grapheme_Cluster_Break: L}(简称:\p{GCB=L})(125)
\p{Grapheme_Cluster_Break:LF}(简称:\p{GCB=LF})(1)
\p{Grapheme_Cluster_Break: LV}(简称:\p{GCB=LV})(399)
\p{Grapheme_Cluster_Break:LVT}(简称:\p{GCB=LVT})(10_773)
\p{Grapheme_Cluster_Break:其他}(简称:\p{GCB=XX})(1_094_733
加上以上所有的 Unicode 代码点)
\p{Grapheme_Cluster_Break: PP} \p{Grapheme_Cluster_Break=前置}
(0)
\p{Grapheme_Cluster_Break:前置}(简称:\p{GCB=PP})(0)
\p{Grapheme_Cluster_Break:Regional_Indicator}(简称:\p{GCB=RI})
(26)
\p{Grapheme_Cluster_Break: RI} \p{Grapheme_Cluster_Break=
区域指标} (26)
\p{Grapheme_Cluster_Break: SM}\p{Grapheme_Cluster_Break=
间距标记} (331)
\p{Grapheme_Cluster_Break: SpacingMark}(简称:\p{GCB=SM})(331)
\p{Grapheme_Cluster_Break:T}(简称:\p{GCB=T})(137)
\p{Grapheme_Cluster_Break:V}(简称:\p{GCB=V})(95)
\p{Grapheme_Cluster_Break: XX} \p{Grapheme_Cluster_Break=其他}
(1_094_733 加上以上所有的 Unicode 代码
点)
\p{Grapheme_Extend} \p{Grapheme_Extend=Y}(简称:\p{GrExt})
(1461)
\p{Grapheme_Extend:N*}(简称:\p{GrExt=N},\P{GrExt})(1_112_651
加上以上所有的 Unicode 代码点)
\p{Grapheme_Extend:Y*}(简称:\p{GrExt=Y},\p{GrExt})(1461)
\p{Greek} \p{Script=Greek} (简称:\p{Grek};不是
\p{希腊语和科普特语}) (516)
X \p{Greek_And_Coptic} \p{Block=Greek_And_Coptic}(简称:
\p{希腊语}) (144)
X \p{希腊语扩展} \p{希腊语扩展} (= \p{块=
希腊语_扩展}) (256)
X \p{Greek_Extended} \p{Block=Greek_Extended}(简称:
\p{InGreekExt}) (256)
\p{Grek} \p{Greek} (= \p{Script=Greek}) (不是
\p{希腊语和科普特语}) (516)
\p{Gujarati} \p{Script=Gujarati}(简称:\p{Gujarati};不是
\p{块=古吉拉特语}) (84)
\p{Gujr} \p{Gujarati} (= \p{Script=Gujarati}) (不是
\p{块=古吉拉特语}) (84)
\p{Gurmukhi} \p{Script=Gurmukhi} (简称:\p{Guru};不是
\p{方块=Gurmukhi}) (79)
\p{Guru} \p{Gurmukhi} (= \p{Script=Gurmukhi}) (不是
\p{方块=Gurmukhi}) (79)
X \p{Half_And_Full_Forms} \p{Halfwidth_And_Fullwidth_Forms} (=
\p{块=Halfwidth_And_Fullwidth_Forms})
(240)
X \p{Half_Marks} \p{Combining_Half_Marks} (= \p{块=
组合_半_标记}) (16)
X \p{Halfwidth_And_Fullwidth_Forms} \p{块=
Halfwidth_And_Fullwidth_Forms}(简称:
\p{InHalfAndFullForms}) (240)
\p{韩} \p{脚本=韩} (75_963)
\p{Hang} \p{Hangul} (= \p{Script=Hangul}) (不是
\p{Hangul_Syllabes}) (11_739)
\p{Hangul} \p{Script=Hangul}(简称:\p{Hang};不是
\p{Hangul_Syllabes}) (11_739)
X \p{Hangul_Compatibility_Jamo} \p{块=Hangul_Compatibility_Jamo}
(简称:\p{InCompatJamo})(96)
X \p{Hangul_Jamo} \p{Block=Hangul_Jamo}(简称:\p{InJamo})
(256)
X \p{Hangul_Jamo_Extended_A} \p{块=Hangul_Jamo_Extended_A}
(简称:\p{InJamoExtA})(32)
X \p{Hangul_Jamo_Extended_B} \p{块=Hangul_Jamo_Extended_B}
(简称:\p{InJamoExtB})(80)
\p{Hangul_Syllable_Type: L} \p{Hangul_Syllable_Type=Leading_Jamo}
(125)
\p{Hangul_Syllable_Type:Leading_Jamo}(简称:\p{Hst=L})(125)
\p{Hangul_Syllable_Type: LV} \p{Hangul_Syllable_Type=LV_Syllable}
(399)
\p{Hangul_Syllable_Type: LV_Syllable}(简称:\p{Hst=LV})(399)
\p{Hangul_Syllable_Type: LVT} \p{Hangul_Syllable_Type=
LVT_音节} (10_773)
\p{Hangul_Syllable_Type: LVT_Syllable}(简称:\p{Hst=LVT})
(10_773)
\p{Hangul_Syllable_Type:不适用} \p{Hangul_Syllable_Type=
Not_Applicable}(1_102_583 加上所有
Unicode 代码点以上)
\p{Hangul_Syllable_Type: Not_Applicable}(简称:\p{Hst=NA})
(1_102_583 加上以上所有的 Unicode 代码
点)
\p{Hangul_Syllable_Type: T} \p{Hangul_Syllable_Type=Trailing_Jamo}
(137)
\p{Hangul_Syllable_Type: Trailing_Jamo}(简称:\p{Hst=T})(137)
\p{Hangul_Syllable_Type: V} \p{Hangul_Syllable_Type=Vowel_Jamo}
(95)
\p{Hangul_Syllable_Type: Vowel_Jamo}(简称:\p{Hst=V})(95)
X \p{Hangul_Syllables} \p{Block=Hangul_Syllables} (短:
\p{韩文}) (11_184)
\p{Hani} \p{Han} (= \p{Script=Han}) (75_963)
\p{Hano} \p{Hanunoo} (= \p{Script=Hanunoo}) (不是
\p{块=哈努努}) (21)
\p{Hanunoo} \p{Script=Hanunoo} (简称:\p{Hano};不是
\p{块=哈努努}) (21)
\p{Hebr} \p{Hebrew} (= \p{Script=Hebrew}) (不是
\p{块=希伯来文}) (133)
\p{Hebrew} \p{Script=Hebrew} (简称:\p{Hebr};不是
\p{块=希伯来文}) (133)
\p{Hex} \p{XPosixXDigit} (= \p{Hex_Digit=Y}) (44)
\p{十六进制:*} \p{Hex_Digit:*}
\p{Hex_Digit} \p{XPosixXDigit} (= \p{Hex_Digit=Y}) (44)
\p{Hex_Digit: N*} (短: \p{Hex=N}, \P{Hex}) (1_114_068
加上以上所有的 Unicode 代码点)
\p{Hex_Digit: Y*} (简写: \p{Hex=Y}, \p{Hex}) (44)
X \p{High_Private_Use_Surrogates} \p{块=
High_Private_Use_Surrogates}(短:
\p{InHighPUSurrogates}) (128)
X \p{High_PU_Surrogates} \p{High_Private_Use_Surrogates} (=
\p{块=High_Private_Use_Surrogates})
(128)
X \p{High_Surrogates} \p{块=High_Surrogates} (896)
\p{Hira} \p{Hiragana} (= \p{Script=Hiragana}) (不是
\p{块=平假名}) (91)
\p{平假名} \p{脚本=平假名}(简称:\p{Hira};不是
\p{块=平假名}) (91)
\p{Hmng} \p{Pahawh_Hmong} (= \p{脚本=
Pahawh_Hmong}) (不是 \p{Block=
Pahawh_苗}) (127)
\p{水平空间} \p{XPosixBlank} (18)
\p{Hst: *} \p{Hangul_Syllable_Type: *}
D \p{连字符} \p{连字符=Y} (11)
D \p{Hyphen: N*} 由 Line_Break 属性值补充;
见 www.unicode.org/reports/tr14
(单曲:\P{Hyphen})(1_114_101 加上所有
Unicode 代码点以上)
D \p{Hyphen: Y*} 由 Line_Break 属性值补充;
见 www.unicode.org/reports/tr14
(单曲:\p{连字符}) (11)
\p{ID_Continue} \p{ID_Continue=Y}(简写:\p{IDC};非
\p{表意描述_字符})
(105_343)
\p{ID_Continue: N*}(简称:\p{IDC=N}, \P{IDC})(1_008_769
加上以上所有的 Unicode 代码点)
\p{ID_Continue: Y*}(简称:\p{IDC=Y}, \p{IDC})(105_343)
\p{ID_Start} \p{ID_Start=Y}(简称:\p{IDS})(102_964)
\p{ID_Start: N*}(简称:\p{IDS=N}, \P{IDS})(1_011_148
加上以上所有的 Unicode 代码点)
\p{ID_Start: Y*} (简称:\p{IDS=Y}, \p{IDS}) (102_964)
\p{IDC} \p{ID_Continue} (= \p{ID_Continue=Y}) (不是
\p{表意描述_字符})
(105_343)
\p{IDC:*} \p{ID_Continue:*}
\p{表意} \p{表意} (= \p{表意=Y})
(75_633)
\p{象形文字:*} \p{象形文字:*}
\p{Ideographic} \p{Ideographic=Y}(简称:\p{Ideo})
(75_633)
\p{表意文字:N*}(简称:\p{Ideo=N}, \P{Ideo})(1_038_479
加上以上所有的 Unicode 代码点)
\p{表意文字:Y*}(简称:\p{Ideo=Y}, \p{Ideo})(75_633)
X \p{Ideographic_Description_Characters} \p{块=
表意_描述_字符}
(简称:\p{InIDC})(16)
\p{IDS} \p{ID_Start} (= \p{ID_Start=Y}) (102_964)
\p{IDS: *} \p{ID_Start: *}
\p{IDS_Binary_Operator} \p{IDS_Binary_Operator=Y} (简称:
\p{IDSB}) (10)
\p{IDS_Binary_Operator: N*} (简称:\p{IDSB=N}, \P{IDSB})
(1_114_102 加上以上所有的 Unicode 代码
点)
\p{IDS_Binary_Operator: Y*} (简称: \p{IDSB=Y}, \p{IDSB}) (10)
\p{IDS_Trinary_Operator} \p{IDS_Trinary_Operator=Y} (简称:
\p{IDST}) (2)
\p{IDS_Trinary_Operator: N*} (简称:\p{IDST=N}, \P{IDST})
(1_114_110 加上以上所有的 Unicode 代码
点)
\p{IDS_Trinary_Operator: Y*} (简称: \p{IDST=Y}, \p{IDST}) (2)
\p{IDSB} \p{IDS_Binary_Operator} (=
\p{IDS_Binary_Operator=Y}) (10)
\p{IDSB: *} \p{IDS_Binary_Operator: *}
\p{IDST} \p{IDS_Trinary_Operator} (=
\p{IDS_Trinary_Operator=Y}) (2)
\p{IDST: *} \p{IDS_Trinary_Operator: *}
\p{Imperial_Aramaic} \p{Script=Imperial_Aramaic}(短:
\p{阿米}; 不是 \p{块=
帝国_阿拉姆语}) (31)
\p{In: *} \p{Present_In: *} (Perl 扩展)
\p{In_*} \p{块:*}
X \p{Indic_Number_Forms} \p{Common_Indic_Number_Forms} (= \p{块=
通用印度数字表格}) (16)
\p{Inherited} \p{Script=Inherited}(简称:\p{Zinh})
(563)
\p{Initial_Punctuation} \p{General_Category=Initial_Punctuation}
(简称:\p{Pi})(12)
\p{Inscriptional_Pahlavi} \p{Script=Inscriptional_Pahlavi}(短:
\p{菲利}; 不是 \p{块=
铭文_巴列维}) (27)
\p{Inscriptional_Parthian} \p{脚本=Inscriptional_Parthian}
(简称:\p{Prti};不是 \p{Block=
铭文_帕提亚}) (30)
X \p{IPA_Ext} \p{IPA_Extensions} (= \p{块=
IPA_扩展}) (96)
X \p{IPA_Extensions} \p{Block=IPA_Extensions}(短:
\p{InIPAExt}) (96)
\p{Is_*} \p{*} (任何例外都是单独
注意以单词 NOT 开头。)如果
条目在其开头有标志,
与 "D" 一样,"Is_" 形式具有相同的
旗帜
\p{Ital} \p{Old_Italic} (= \p{Script=Old_Italic})
(不是 \p{块=Old_Italic})(36)
X \p{Jamo} \p{Hangul_Jamo} (= \p{块=Hangul_Jamo})
(256)
X \p{Jamo_Ext_A} \p{Hangul_Jamo_Extended_A} (= \p{块=
Hangul_Jamo_Extended_A}) (32)
X \p{Jamo_Ext_B} \p{Hangul_Jamo_Extended_B} (= \p{块=
韩文_Jamo_扩展_B}) (80)
\p{Java} \p{Javanese} (= \p{Script=Javanese}) (不是
\p{块=爪哇语}) (90)
\p{Javanese} \p{Script=Javanese}(简称:\p{Java};不是
\p{块=爪哇语}) (90)
\p{Jg: *} \p{加入组: *}
\p{Join_C} \p{Join_Control} (= \p{Join_Control=Y}) (2)
\p{Join_C: *} \p{Join_Control: *}
\p{Join_Control} \p{Join_Control=Y}(简称:\p{JoinC})(2)
\p{Join_Control: N*} (短: \p{JoinC=N}, \P{JoinC}) (1_114_110
加上以上所有的 Unicode 代码点)
\p{Join_Control: Y*} (短: \p{JoinC=Y}, \p{JoinC}) (2)
\p{Joining_Group: Ain} (简称: \p{Jg=Ain}) (7)
\p{Joining_Group: Alaph} (简称: \p{Jg=Alaph}) (1)
\p{Joining_Group:Alef}(简称:\p{Jg=Alef})(10)
\p{Joining_Group: Beh} (简称: \p{Jg=Beh}) (21)
\p{Joining_Group: Beth} (简称: \p{Jg=Beth}) (2)
\p{Joining_Group:Burushaski_Yeh_Barree}(简称:\p{Jg=
布鲁沙斯基耶巴里}) (2)
\p{Joining_Group:Dal}(简称:\p{Jg=Dal})(15)
\p{Joining_Group: Dalath_Rish} (简称: \p{Jg=DalathRish}) (4)
\p{Joining_Group:E}(简称:\p{Jg=E})(1)
\p{Joining_Group: Farsi_Yeh} (简称: \p{Jg=FarsiYeh}) (7)
\p{Joining_Group: Fe} (简称: \p{Jg=Fe}) (1)
\p{Joining_Group: Feh} (短: \p{Jg=Feh}) (10)
\p{Joining_Group: Final_Semkath} (简称: \p{Jg=FinalSemkath}) (1)
\p{Joining_Group: Gaf} (简称: \p{Jg=Gaf}) (14)
\p{Joining_Group: Gamal} (简称: \p{Jg=Gamal}) (3)
\p{Joining_Group: 哈} (短: \p{Jg=哈}) (18)
\p{Joining_Group:Hamza_On_Heh_Goal}(简称:\p{Jg=
哈姆扎OnHeh目标}) (1)
\p{Joining_Group: He} (短: \p{Jg=He}) (1)
\p{Joining_Group: Heh} (短: \p{Jg=Heh}) (1)
\p{Joining_Group: Heh_Goal} (简称: \p{Jg=HehGoal}) (2)
\p{Joining_Group: Heth}(简称:\p{Jg=Heth})(1)
\p{Joining_Group: Kaf} (简称: \p{Jg=Kaf}) (5)
\p{Joining_Group: Kaph} (简称: \p{Jg=Kaph}) (1)
\p{Joining_Group:Khaph}(简称:\p{Jg=Khaph})(1)
\p{Joining_Group: Knotted_Heh} (简称: \p{Jg=KnottedHeh}) (2)
\p{Joining_Group: Lam} (简称: \p{Jg=Lam}) (7)
\p{Joining_Group: Lamadh} (简称: \p{Jg=Lamadh}) (1)
\p{Joining_Group:Manichaean_Aleph}(简称:\p{Jg=
摩尼教阿莱夫}) (1)
\p{Joining_Group:Manichaean_Ayin}(简称:\p{Jg=ManichaeanAyin})
(2)
\p{Joining_Group:Manichaean_Beth}(简称:\p{Jg=ManichaeanBeth})
(2)
\p{Joining_Group:Manichaean_Daleth}(简称:\p{Jg=
摩尼教达莱斯}) (1)
\p{Joining_Group:Manichaean_Dhamedh}(简称:\p{Jg=
摩尼教Dhamedh})(1)
\p{Joining_Group:Manichaean_Five}(简称:\p{Jg=ManichaeanFive})
(1)
\p{Joining_Group:Manichaean_Gimel}(简称:\p{Jg=
摩尼教吉梅尔}) (2)
\p{Joining_Group:Manichaean_Heth}(简称:\p{Jg=ManichaeanHeth})
(1)
\p{Joining_Group:Manichaean_Hundred}(简称:\p{Jg=
摩尼教百}) (1)
\p{Joining_Group:Manichaean_Kaph}(简称:\p{Jg=ManichaeanKaph})
(3)
\p{Joining_Group:Manichaean_Lamedh}(简称:\p{Jg=
摩尼教拉梅德}) (1)
\p{Joining_Group:Manichaean_Mem}(简称:\p{Jg=ManichaeanMem})(1)
\p{Joining_Group:Manichaean_Nun}(简称:\p{Jg=ManichaeanNun})(1)
\p{Joining_Group:Manichaean_One}(简称:\p{Jg=ManichaeanOne})(1)
\p{Joining_Group:Manichaean_Pe}(简称:\p{Jg=ManichaeanPe})(2)
\p{Joining_Group:Manichaean_Qoph}(简称:\p{Jg=ManichaeanQoph})
(3)
\p{Joining_Group:Manichaean_Resh}(简称:\p{Jg=ManichaeanResh})
(1)
\p{Joining_Group:Manichaean_Sadhe}(简称:\p{Jg=
摩尼教萨德}) (1)
\p{Joining_Group:Manichaean_Samekh}(简称:\p{Jg=
摩尼教人Samekh}) (1)
\p{Joining_Group:Manichaean_Taw}(简称:\p{Jg=ManichaeanTaw})(1)
\p{Joining_Group:Manichaean_Ten}(简称:\p{Jg=ManichaeanTen})(1)
\p{Joining_Group:Manichaean_Teth}(简称:\p{Jg=ManichaeanTeth})
(1)
\p{Joining_Group:Manichaean_Thamedh}(简称:\p{Jg=
摩尼教泰梅德}) (1)
\p{Joining_Group:Manichaean_Twenty}(简称:\p{Jg=
摩尼教二十}) (1)
\p{Joining_Group:Manichaean_Waw}(简称:\p{Jg=ManichaeanWaw})(1)
\p{Joining_Group:Manichaean_Yodh}(简称:\p{Jg=ManichaeanYodh})
(1)
\p{Joining_Group:Manichaean_Zayin}(简称:\p{Jg=
摩尼教再因}) (2)
\p{Joining_Group: Meem} (简称: \p{Jg=Meem}) (4)
\p{Joining_Group: Mim} (简称: \p{Jg=Mim}) (1)
\p{Joining_Group:No_Joining_Group}(简称:\p{Jg=NoJoiningGroup})
(1_113_828 加上以上所有的 Unicode 代码
点)
\p{Joining_Group:中午}(简称:\p{Jg=Noon})(8)
\p{Joining_Group: Nun} (简称: \p{Jg=Nun}) (1)
\p{Joining_Group:Nya}(简称:\p{Jg=Nya})(1)
\p{Joining_Group: Pe} (简称: \p{Jg=Pe}) (1)
\p{Joining_Group: Qaf} (简称: \p{Jg=Qaf}) (5)
\p{Joining_Group:Qaph}(简称:\p{Jg=Qaph})(1)
\p{Joining_Group:Reh}(简称:\p{Jg=Reh})(18)
\p{Joining_Group: Reversed_Pe} (简称: \p{Jg=ReversedPe}) (1)
\p{Joining_Group:Rohingya_Yeh}(简称:\p{Jg=RohingyaYeh})(1)
\p{Joining_Group:Sad}(简称:\p{Jg=Sad})(6)
\p{Joining_Group:Sadhe}(简称:\p{Jg=Sadhe})(1)
\p{Joining_Group:Seen}(简称:\p{Jg=Seen})(11)
\p{Joining_Group:Semkath}(简称:\p{Jg=Semkath})(1)
\p{Joining_Group:Shin}(简称:\p{Jg=Shin})(1)
\p{Joining_Group:Straight_Waw}(简称:\p{Jg=StraightWaw})(1)
\p{Joining_Group: Swash_Kaf} (简称: \p{Jg=SwashKaf}) (1)
\p{Joining_Group:Syriac_Waw}(简称:\p{Jg=SyriacWaw})(1)
\p{Joining_Group: Tah} (简称: \p{Jg=Tah}) (4)
\p{Joining_Group:Taw}(简称:\p{Jg=Taw})(1)
\p{Joining_Group: Teh_Marbuta} (简称: \p{Jg=TehMarbuta}) (3)
\p{Joining_Group:Teh_Marbuta_Goal} \p{Joining_Group=
Hamza_On_Heh_Goal} (1)
\p{Joining_Group:Teth}(简称:\p{Jg=Teth})(2)
\p{Joining_Group: Waw} (简称: \p{Jg=Waw}) (16)
\p{Joining_Group: Yeh} (短: \p{Jg=Yeh}) (10)
\p{Joining_Group: Yeh_Barree} (简称: \p{Jg=YehBarree}) (2)
\p{Joining_Group: Yeh_With_Tail} (短: \p{Jg=YehWithTail}) (1)
\p{Joining_Group:Yudh}(简称:\p{Jg=Yudh})(1)
\p{Joining_Group: Yudh_He} (简称: \p{Jg=YudhHe}) (1)
\p{Joining_Group: Zain} (简称: \p{Jg=Zain}) (1)
\p{Joining_Group: Zhain} (简称: \p{Jg=Zhain}) (1)
\p{Joining_Type: C} \p{Joining_Type=Join_Causing} (4)
\p{Joining_Type: D}\p{Joining_Type=Dual_Joining} (424)
\p{Joining_Type: Dual_Joining} (短: \p{Jt=D}) (424)
\p{Joining_Type: Join_Causing} (短: \p{Jt=C}) (4)
\p{Joining_Type: L} \p{Joining_Type=Left_Joining} (3)
\p{Joining_Type: Left_Joining} (短: \p{Jt=L}) (3)
\p{Joining_Type: Non_Joining} (短: \p{Jt=U}) (1_112_003 plus
以上所有 - Unicode 代码点)
\p{Joining_Type: R} \p{Joining_Type=Right_Joining} (111)
\p{Joining_Type: Right_Joining} (短: \p{Jt=R}) (111)
\p{Joining_Type: T} \p{Joining_Type=透明} (1567)
\p{Joining_Type:透明}(短:\p{Jt=T})(1567)
\p{Joining_Type: U} \p{Joining_Type=Non_Joining} (1_112_003
加上以上所有的 Unicode 代码点)
\p{Jt: *} \p{Joining_Type: *}
\p{Kaithi} \p{Script=Kaithi}(简称:\p{Kthi};不是
\p{块=凯蒂}) (66)
\p{Kali} \p{Kayah_Li} (= \p{Script=Kayah_Li}) (不是
\p{块=Kayah_Li}) (47)
\p{假名} \p{片假名} (= \p{脚本=片假名}) (NOT
\p{方块=片假名}) (300)
X \p{Kana_Sup} \p{Kana_Supplement} (= \p{块=
假名补充}) (256)
X \p{Kana_Supplement} \p{Block=Kana_Supplement}(短:
\p{InKanaSup}) (256)
X \p{看文} \p{块=看文} (16)
X \p{康熙} \p{康熙_自由基} (= \p{块=
康熙_部首}) (224)
X \p{Kangxi_Radicals} \p{Block=Kangxi_Radicals}(短:
\p{在康熙}) (224)
\p{卡纳达语} \p{Script=卡纳达语}(简称:\p{Knda};不是
\p{块=卡纳达语}) (87)
\p{片假名} \p{脚本=片假名}(简称:\p{假名};不是
\p{方块=片假名}) (300)
X \p{Katakana_Ext} \p{Katakana_Phonetic_Extensions} (=
\p{块=Katakana_Phonetic_Extensions})
(16)
X \p{Katakana_Phonetic_Extensions} \p{块=
Katakana_Phonetic_Extensions}(短:
\p{InKatakanaExt}) (16)
\p{Kayah_Li} \p{Script=Kayah_Li}(简称:\p{Kali};不是
\p{块=Kayah_Li}) (47)
\p{Khar} \p{Kharoshthi} (= \p{Script=Kharoshthi})
(不是 \p{Block=Kharoshthi})(65)
\p{Kharoshthi} \p{Script=Kharoshthi}(简称:\p{Khar};
不是 \p{Block=Kharoshthi}) (65)
\p{Khmer} \p{Script=Khmer}(简称:\p{Khmr};不是
\p{块=高棉}) (146)
X \p{高棉符号} \p{块=高棉符号} (32)
\p{Khmr} \p{Khmer} (= \p{Script=Khmer}) (不是
\p{块=高棉}) (146)
\p{Khoj} \p{Khojki} (= \p{Script=Khojki}) (不是
\p{块=Khojki}) (61)
\p{Khojki} \p{Script=Khojki}(简称:\p{Khoj};不是
\p{块=Khojki}) (61)
\p{Khudawadi} \p{Script=Khudawadi}(简称:\p{Sind};不是
\p{块=Khudawadi}) (69)
\p{Knda} \p{卡纳达语} (= \p{Script=卡纳达语}) (不是
\p{块=卡纳达语}) (87)
\p{Kthi} \p{Kaithi} (= \p{Script=Kaithi}) (不是
\p{块=凯蒂}) (66)
\p{L} \pL \p{字母} (= \p{General_Category=字母})
(102_725)
X \p{L&} \p{Cased_Letter} (= \p{General_Category=
大小写字母}) (3362)
X \p{L_} \p{Cased_Letter} (= \p{General_Category=
Cased_Letter}) 注意尾随的 '_'
尽管匹配松散,但很重要
规则。 (3362)
\p{Lana} \p{Tai_Tham} (= \p{Script=Tai_Tham}) (不是
\p{块=Tai_Tham}) (127)
\p{Lao} \p{Script=Lao}(不是 \p{Block=Lao})(67)
\p{Laoo} \p{Lao} (= \p{Script=Lao}) (不是 \p{Block=
老}) (67)
\p{拉丁语} \p{Script=拉丁语}(简称:\p{Latn})(1338)
X \p{Latin_1} \p{Latin_1_Supplement} (= \p{块=
拉丁语_1_补充}) (128)
X \p{Latin_1_Sup} \p{Latin_1_Suplement} (= \p{块=
拉丁语_1_补充}) (128)
X \p{Latin_1_Supplement} \p{Block=Latin_1_Supplement}(短:
\p{拉丁语1}) (128)
X \p{Latin_Ext_A} \p{Latin_Extended_A} (= \p{块=
拉丁语扩展_A}) (128)
X \p{Latin_Ext_Additional} \p{Latin_Extended_Additional} (=
\p{块=Latin_Extended_Additional})
(256)
X \p{Latin_Ext_B} \p{Latin_Extended_B} (= \p{块=
拉丁语扩展_B}) (208)
X \p{Latin_Ext_C} \p{Latin_Extended_C} (= \p{块=
拉丁语扩展_C}) (32)
X \p{Latin_Ext_D} \p{Latin_Extended_D} (= \p{块=
拉丁语扩展_D}) (224)
X \p{Latin_Ext_E} \p{Latin_Extended_E} (= \p{块=
拉丁语扩展_E}) (64)
X \p{Latin_Extended_A} \p{Block=Latin_Extended_A}(短:
\p{InLatinExtA}) (128)
X \p{Latin_Extended_Additional} \p{块=Latin_Extended_Additional}
(简称:\p{InLatinExtAdditional})(256)
X \p{Latin_Extended_B} \p{Block=Latin_Extended_B}(短:
\p{InLatinExtB}) (208)
X \p{Latin_Extended_C} \p{Block=Latin_Extended_C}(短:
\p{InLatinExtC}) (32)
X \p{Latin_Extended_D} \p{Block=Latin_Extended_D}(短:
\p{InLatinExtD}) (224)
X \p{Latin_Extended_E} \p{Block=Latin_Extended_E}(短:
\p{InLatinExtE}) (64)
\p{拉丁语} \p{拉丁语} (= \p{脚本=拉丁语}) (1338)
\p{磅:*} \p{换行符:*}
\p{LC} \p{Cased_Letter} (= \p{General_Category=
大小写字母}) (3362)
\p{Lepc} \p{Lepcha} (= \p{Script=Lepcha}) (不是
\p{块=Lepcha}) (74)
\p{Lepcha} \p{Script=Lepcha} (简称:\p{Lepc};不是
\p{块=Lepcha}) (74)
\p{字母} \p{General_Category=字母}(简称:\p{L})
(102_725)
\p{Letter_Number} \p{General_Category=Letter_Number}(短:
\p{Nl}) (236)
X \p{Letterlike_Symbols} \p{块=Letterlike_Symbols} (80)
\p{Limb} \p{Limbu} (= \p{Script=Limbu}) (不是
\p{方块=林布}) (68)
\p{Limbu} \p{Script=Limbu}(简称:\p{Limb};不是
\p{方块=林布}) (68)
\p{Lina} \p{Linear_A} (= \p{Script=Linear_A}) (不是
\p{块=Linear_A}) (341)
\p{Linb} \p{Linear_B} (= \p{Script=Linear_B}) (211)
\p{Line_Break:AI} \p{Line_Break=不明确} (689)
\p{Line_Break: AL} \p{Line_Break=字母} (17_608)
\p{Line_Break: Alphabetic} (短: \p{Lb=AL}) (17_608)
\p{Line_Break: Ambiguous} (短: \p{Lb=AI}) (689)
\p{Line_Break: B2} \p{Line_Break=Break_Both} (3)
\p{Line_Break: BA} \p{Line_Break=Break_After} (181)
\p{Line_Break: BB} \p{Line_Break=Break_Before} (21)
\p{Line_Break: BK} \p{Line_Break=Mandatory_Break} (4)
\p{Line_Break: Break_After} (短: \p{Lb=BA}) (181)
\p{Line_Break: Break_Before} (短: \p{Lb=BB}) (21)
\p{Line_Break: Break_Both} (短: \p{Lb=B2}) (3)
\p{Line_Break: Break_Symbols} (短: \p{Lb=SY}) (1)
\p{Line_Break: Carriage_Return} (短: \p{Lb=CR}) (1)
\p{Line_Break: CB} \p{Line_Break=Contingent_Break} (1)
\p{换行符:CJ} \p{换行符=
有条件的_日语_入门} (51)
\p{Line_Break: CL} \p{Line_Break=Close_Punctuation} (89)
\p{Line_Break: Close_Parenthesis} (短: \p{Lb=CP}) (2)
\p{Line_Break: Close_Punctuation} (短: \p{Lb=CL}) (89)
\p{Line_Break: CM} \p{Line_Break=Combining_Mark} (1820)
\p{Line_Break: Combining_Mark} (短: \p{Lb=CM}) (1820)
\p{Line_Break: Complex_Context} (短: \p{Lb=SA}) (690)
\p{Line_Break: Conditional_Japanese_Starter}(简称:\p{Lb=CJ})
(51)
\p{Line_Break: Contingent_Break} (短: \p{Lb=CB}) (1)
\p{Line_Break: CP} \p{Line_Break=Close_Parenthesis} (2)
\p{Line_Break: CR} \p{Line_Break=Carriage_Return} (1)
\p{Line_Break: EX} \p{Line_Break=感叹号} (36)
\p{Line_Break: Exclamation} (短: \p{Lb=EX}) (36)
\p{Line_Break: GL} \p{Line_Break=胶水} (18)
\p{Line_Break: Glue} (短: \p{Lb=GL}) (18)
\p{Line_Break: H2} (短: \p{Lb=H2}) (399)
\p{Line_Break: H3} (短: \p{Lb=H3}) (10_773)
\p{换行符:Hebrew_Letter}(简称:\p{Lb=HL})(74)
\p{Line_Break: HL} \p{Line_Break=Hebrew_Letter} (74)
\p{Line_Break: HY} \p{Line_Break=连字符} (1)
\p{Line_Break: 连字符} (短: \p{Lb=HY}) (1)
\p{Line_Break: ID} \p{Line_Break=表意文字} (162_936)
\p{Line_Break: Ideographic} (短: \p{Lb=ID}) (162_936)
\p{Line_Break: IN} \p{Line_Break=不可分离} (5)
\p{Line_Break: Infix_Numeric} (短: \p{Lb=IS}) (13)
\p{Line_Break: 形影不离} (短: \p{Lb=IN}) (5)
\p{Line_Break: 不可分割} \p{Line_Break=不可分割} (5)
\p{Line_Break: IS} \p{Line_Break=Infix_Numeric} (13)
\p{Line_Break: JL} (短: \p{Lb=JL}) (125)
\p{Line_Break: JT} (短: \p{Lb=JT}) (137)
\p{Line_Break: JV}(简称:\p{Lb=JV})(95)
\p{Line_Break: LF} \p{Line_Break=Line_Feed} (1)
\p{Line_Break: Line_Feed} (短: \p{Lb=LF}) (1)
\p{Line_Break: Mandatory_Break} (短: \p{Lb=BK}) (4)
\p{Line_Break: Next_Line} (短: \p{Lb=NL}) (1)
\p{Line_Break: NL} \p{Line_Break=Next_Line} (1)
\p{Line_Break: Nonstarter}(短:\p{Lb=NS})(29)
\p{Line_Break: NS} \p{Line_Break=Nonstarter} (29)
\p{Line_Break: NU} \p{Line_Break=数字} (532)
\p{Line_Break:数字}(短:\p{Lb=NU})(532)
\p{Line_Break: OP} \p{Line_Break=Open_Punctuation} (84)
\p{Line_Break: Open_Punctuation} (短: \p{Lb=OP}) (84)
\p{Line_Break: PO} \p{Line_Break=Postfix_Numeric} (29)
\p{Line_Break: Postfix_Numeric} (短: \p{Lb=PO}) (29)
\p{Line_Break: PR} \p{Line_Break=Prefix_Numeric} (66)
\p{Line_Break: Prefix_Numeric} (短: \p{Lb=PR}) (66)
\p{Line_Break: QU} \p{Line_Break=报价} (39)
\p{Line_Break: Quotation} (短: \p{Lb=QU}) (39)
\p{Line_Break:Regional_Indicator}(短:\p{Lb=RI})(26)
\p{Line_Break: RI} \p{Line_Break=Regional_Indicator} (26)
\p{Line_Break: SA} \p{Line_Break=Complex_Context} (690)
D \p{Line_Break: SG} \p{Line_Break=代理} (2048)
\p{Line_Break: SP} \p{Line_Break=空格} (1)
\p{Line_Break: Space} (短: \p{Lb=SP}) (1)
D \p{Line_Break: Surrogate} 被 Unicode 弃用,因为代理
永远不应该出现在格式正确的文本中,
因此不应该作为基础
换行(简称:\p{Lb=SG})(2048)
\p{Line_Break: SY} \p{Line_Break=Break_Symbols} (1)
\p{Line_Break: Unknown} (短: \p{Lb=XX}) (915_480 plus all
Unicode 代码点以上)
\p{Line_Break: WJ} \p{Line_Break=Word_Joiner} (2)
\p{Line_Break: Word_Joiner} (短: \p{Lb=WJ}) (2)
\p{Line_Break: XX} \p{Line_Break=Unknown} (915_480 加上所有
Unicode 代码点以上)
\p{Line_Break: ZW} \p{Line_Break=ZWSpace} (1)
\p{Line_Break: ZWSpace} (短: \p{Lb=ZW}) (1)
\p{Line_Separator} \p{General_Category=Line_Separator}
(简称:\p{Zl})(1)
\p{Linear_A} \p{Script=Linear_A}(简称:\p{Lina};不是
\p{块=Linear_A}) (341)
\p{Linear_B} \p{Script=Linear_B}(简称:\p{Linb})(211)
X \p{Linear_B_Ideograms} \p{块=Linear_B_Ideograms} (128)
X \p{Linear_B_Syllabary} \p{块=Linear_B_Syllabary} (128)
\p{傈僳语} \p{脚本=傈僳语} (48)
\p{Ll} \p{小写字母} (=
\p{General_Category=小写字母})
(/i=General_Category=Cased_Letter)
(1841)
\p{Lm} \p{修饰符_字母} (=
\p{General_Category=Modifier_Letter})
(248)
\p{Lo} \p{Other_Letter} (= \p{General_Category=
其他_字母}) (99_115)
\p{LOE} \p{Logical_Order_Exception} (=
\p{Logical_Order_Exception=Y}) (15)
\p{LOE: *} \p{Logical_Order_Exception: *}
\p{Logical_Order_Exception} \p{Logical_Order_Exception=Y}(短:
\p{LOE}) (15)
\p{Logical_Order_Exception: N*}(简称:\p{LOE=N},\P{LOE})
(1_114_097 加上以上所有的 Unicode 代码
点)
\p{Logical_Order_Exception: Y*}(简称:\p{LOE=Y},\p{LOE})(15)
X \p{Low_Surrogates} \p{块=Low_Surrogates} (1024)
\p{小写} \p{XPosixLower} (= \p{小写=Y}) (/i=
装箱=是)(2030)
\p{小写:*} \p{小写:*}
\p{小写} \p{XPosixLower} (= \p{小写=Y}) (/i=
装箱=是)(2030)
\p{小写:N*}(短:\p{Lower=N},\P{Lower};/i= Cased=
否)(1_112_082 加上以上所有 - Unicode
码点)
\p{小写:Y*}(短:\p{Lower=Y},\p{Lower};/i= Cased=
是)(2030 年)
\p{小写字母} \p{General_Category=小写字母}
(简称:\p{Ll}; /i= General_Category=
Cased_Letter)(1841 年)
\p{Lt} \p{Titlecase_Letter} (=
\p{General_Category=Titlecase_Letter})
(/i=General_Category=Cased_Letter) (31)
\p{Lu} \p{大写字母} (=
\p{General_Category=大写字母})
(/i=General_Category=Cased_Letter)
(1490)
\p{Lyci} \p{Lycian} (= \p{Script=Lycian}) (不是
\p{方块=利西亚}) (29)
\p{Lycian} \p{Script=Lycian}(简称:\p{Lyci};不是
\p{方块=利西亚}) (29)
\p{Lydi} \p{Lydian} (= \p{Script=Lydian}) (不是
\p{方块=吕底亚}) (27)
\p{Lydian} \p{Script=Lydian}(简称:\p{Lydi};不是
\p{方块=吕底亚}) (27)
\p{M} \pM \p{标记} (= \p{General_Category=标记})
(1830)
\p{Mahajani} \p{Script=Mahajani}(简称:\p{Mahj};不是
\p{块=马哈贾尼}) (39)
\p{Mahj} \p{Mahajani}(= \p{Script=Mahajani})(不是
\p{块=马哈贾尼}) (39)
X \p{麻将} \p{Mahjong_Tiles} (= \p{方块=
麻将_瓷砖}) (48)
X \p{Mahjong_Tiles} \p{Block=Mahjong_Tiles}(短:
\p{打麻将}) (48)
\p{马拉雅拉姆语} \p{Script=马拉雅拉姆语}(简称:\p{Mlym};不是
\p{块=马拉雅拉姆语}) (99)
\p{Mand} \p{Mandaic} (= \p{Script=Mandaic}) (不是
\p{方块=曼达语}) (29)
\p{Mandaic} \p{Script=Mandaic}(简称:\p{Mand};不是
\p{方块=曼达语}) (29)
\p{摩尼} \p{摩尼教} (= \p{脚本=摩尼教})
(不是 \p{Block=Manichaean})(51)
\p{Manichaean} \p{Script=Manichaean}(简称:\p{Mani};
不是 \p{Block=Manichaean}) (51)
\p{标记} \p{General_Category=标记}(简称:\p{M})
(1830)
\p{数学} \p{数学=Y} (2310)
\p{数学:N*}(单:\P{数学})(1_111_802 加上所有
Unicode 代码点以上)
\p{数学:Y*}(单:\p{数学})(2310)
X \p{Math_Alphanum} \p{Mathematical_Alphanumeric_Symbols} (=
\p{块=
数学_字母数字_符号})
(1024)
X \p{数学运算符} \p{数学运算符} (= \p{块=
数学运算符}) (256)
\p{Math_Symbol} \p{General_Category=Math_Symbol}(短:
\p{Sm}) (948)
X \p{数学_字母数字_符号} \p{块=
数学_字母数字_符号}
(简称:\p{InMathAlphanum})(1024)
X \p{数学运算符} \p{块=数学运算符}
(简称:\p{InMathOperators})(256)
\p{Mc} \p{Spacing_Mark} (= \p{General_Category=
间距标记}) (399)
\p{我} \p{Enclosure_Mark} (= \p{General_Category=
Enclosure_Mark}) (13)
\p{Meetei_Mayek} \p{Script=Meetei_Mayek}(简称:\p{Mtei};
不是 \p{Block=Meetei_Mayek}) (79)
X \p{Meetei_Mayek_Ext} \p{Meetei_Mayek_Extensions} (= \p{块=
Meetei_Mayek_Extensions}) (32)
X \p{Meetei_Mayek_Extensions} \p{块=Meetei_Mayek_Extensions}
(简称:\p{InMeeteiMayekExt})(32)
\p{Mend} \p{Mende_Kikakui} (= \p{脚本=
Mende_Kikakui}) (不是 \p{Block=
Mende_Kikakui})(213)
\p{Mende_Kikakui} \p{Script=Mende_Kikakui}(简称:\p{Mend};
不是 \p{Block=Mende_Kikakui}) (213)
\p{Merc} \p{Meroitic_Cursive} (= \p{Script=
Meroitic_Cursive}) (不是 \p{Block=
Meroitic_草书}) (26)
\p{Mero} \p{Meroitic_象形文字} (= \p{Script=
Meroitic_象形文字}) (32)
\p{Meroitic_Cursive} \p{Script=Meroitic_Cursive}(短:
\p{默克}; 不是 \p{块=
Meroitic_草书}) (26)
\p{Meroitic_Hieroglyphs} \p{Script=Meroitic_Hieroglyphs}(短:
\p{梅罗}) (32)
\p{苗} \p{脚本=苗} (NOT \p{块=苗}) (133)
X \p{Misc_Arrows} \p{Miscellaneous_Symbols_And_Arrows} (=
\p{块=
杂项符号和箭头}) (256)
X \p{Misc_Math_Symbols_A} \p{Misc_Mathematical_Symbols_A}
(= \p{块=
杂项_数学_符号_A})
(48)
X \p{Misc_Math_Symbols_B} \p{Misc_Mathematical_Symbols_B}
(= \p{块=
杂项_数学_符号_B})
(128)
X \p{杂项象形文字} \p{杂项符号和象形文字}
(= \p{块=
其他_Symbols_And_Pictographs})
(768)
X \p{Misc_Symbols} \p{Misc_Symbols} (= \p{Block=
杂项_符号}) (256)
X \p{Misc_Technical} \p{Misc_Technical} (= \p{Block=
杂项_技术}) (256)
X \p{Miscellaneous_Mathematical_Symbols_A} \p{块=
杂项_数学_符号_A}
(简称:\p{InMiscMathSymbolsA})(48)
X \p{Miscellaneous_Mathematical_Symbols_B} \p{块=
杂项_数学_符号_B}
(简称:\p{InMiscMathSymbolsB})(128)
X \p{Miscellaneous_Symbols} \p{Block=Miscellaneous_Symbols}(短:
\p{InMiscSymbols}) (256)
X \p{杂项符号和箭头} \p{块=
杂项_Symbols_And_Arrows}
(简称:\p{InMiscArrows})(256)
X \p{杂项符号和象形文字} \p{块=
杂项_Symbols_And_Pictographs}
(短:\p{InMiscPictographs})(768)
X \p{Miscellaneous_Technical} \p{块=Miscellaneous_Technical}
(简称:\p{InMiscTechnical})(256)
\p{Mlym} \p{马拉雅拉姆语} (= \p{脚本=马拉雅拉姆语})
(不是 \p{块=马拉雅拉姆语})(99)
\p{Mn} \p{非间距标记} (=
\p{General_Category=Nonspacing_Mark})
(1418)
\p{Modi} \p{Script=Modi} (不是 \p{Block=Modi}) (79)
\p{修饰符_字母} \p{General_Category=修饰符_字母}
(简称:\p{Lm})(248)
X \p{修饰符字母} \p{间距修饰符字母} (= \p{块=
间距修饰符_字母}) (80)
\p{修饰符_符号} \p{General_Category=修饰符_符号}
(简称:\p{Sk})(116)
X \p{Modifier_Tone_Letters} \p{块=Modifier_Tone_Letters} (32)
\p{Mong} \p{蒙古语} (= \p{Script=蒙古语})
(不是 \p{Block=蒙古语})(153)
\p{蒙古语} \p{Script=蒙古语}(简称:\p{Mong};不是
\p{块=蒙古语}) (153)
\p{Mro} \p{Script=Mro}(不是 \p{Block=Mro})(43)
\p{Mroo} \p{Mro} (= \p{Script=Mro}) (不是 \p{Block=
先生}) (43)
\p{Mtei} \p{Meetei_Mayek} (= \p{脚本=
Meetei_Mayek}) (不是 \p{Block=
Meetei_Mayek}) (79)
X \p{音乐} \p{Musical_Symbols} (= \p{块=
音乐符号}) (256)
X \p{Musical_Symbols} \p{Block=Musical_Symbols}(短:
\p{音乐}) (256)
\p{Myanmar} \p{Script=Myanmar}(简称:\p{Mymr};不是
\p{块=缅甸}) (223)
X \p{Myanmar_Ext_A} \p{Myanmar_Extended_A} (= \p{块=
缅甸_扩展_A}) (32)
X \p{Myanmar_Ext_B} \p{Myanmar_Extended_B} (= \p{块=
缅甸_扩展_B}) (32)
X \p{Myanmar_Extended_A} \p{Block=Myanmar_Extended_A}(短:
\p{InMyanmarExtA}) (32)
X \p{Myanmar_Extended_B} \p{Block=Myanmar_Extended_B}(短:
\p{InMyanmarExtB}) (32)
\p{Mymr} \p{Myanmar} (= \p{Script=Myanmar}) (不是
\p{块=缅甸}) (223)
\p{N} \pN \p{数字} (= \p{General_Category=数字})
(1346)
\p{Nabataean} \p{Script=Nabataean}(简称:\p{Nbat};不是
\p{块=纳巴泰人}) (40)
\p{Narb} \p{Old_North_Arabian} (= \p{脚本=
老北阿拉伯}) (32)
X \p{NB} \p{No_Block} (= \p{Block=No_Block})
(857_776 加上以上所有的 Unicode 代码
点)
\p{Nbat} \p{纳巴泰人} (= \p{脚本=纳巴泰人})
(不是 \p{Block=Nabataean})(40)
\p{NChar} \p{非字符代码点} (=
\p{非字符代码点=Y}) (66)
\p{NChar: *} \p{非字符代码点: *}
\p{Nd} \p{XPosixDigit} (= \p{General_Category=
十进制数}) (540)
\p{New_Tai_Lue} \p{Script=New_Tai_Lue}(简称:\p{Talu};
不是 \p{Block=New_Tai_Lue}) (83)
\p{NFC_QC:*} \p{NFC_Quick_Check:*}
\p{NFC_Quick_Check: M} \p{NFC_Quick_Check=也许} (110)
\p{NFC_Quick_Check: 也许} (短: \p{NFCQC=M}) (110)
\p{NFC_Quick_Check: N} \p{NFC_Quick_Check=否}(不是
\P{NFC_Quick_Check} 或 \P{NFC_QC})
(1120)
\p{NFC_Quick_Check:否}(短:\p{NFCQC=N};不是
\P{NFC_Quick_Check} 或 \P{NFC_QC})
(1120)
\p{NFC_Quick_Check: 是} \p{NFC_Quick_Check=是} (不是
\p{NFC_Quick_Check} 或 \p{NFC_QC})
(1_112_882 加上以上所有的 Unicode 代码
点)
\p{NFC_Quick_Check:是}(短:\p{NFCQC=Y};不是
\p{NFC_Quick_Check} 或 \p{NFC_QC})
(1_112_882 加上以上所有的 Unicode 代码
点)
\p{NFD_QC:*} \p{NFD_Quick_Check:*}
\p{NFD_Quick_Check: N} \p{NFD_Quick_Check=No}(不
\P{NFD_Quick_Check} 或 \P{NFD_QC})
(13_232)
\p{NFD_Quick_Check:否}(短:\p{NFDQC=N};不是
\P{NFD_Quick_Check} 或 \P{NFD_QC})
(13_232)
\p{NFD_Quick_Check:是} \p{NFD_Quick_Check=是}(不是
\p{NFD_Quick_Check} 或 \p{NFD_QC})
(1_100_880 加上以上所有的 Unicode 代码
点)
\p{NFD_Quick_Check:是}(短:\p{NFDQC=Y};不是
\p{NFD_Quick_Check} 或 \p{NFD_QC})
(1_100_880 加上以上所有的 Unicode 代码
点)
\p{NFKC_QC: *} \p{NFKC_Quick_Check: *}
\p{NFKC_Quick_Check: M} \p{NFKC_Quick_Check=也许} (110)
\p{NFKC_Quick_Check: 也许} (短: \p{NFKCQC=M}) (110)
\p{NFKC_Quick_Check: N} \p{NFKC_Quick_Check=否}(不
\P{NFKC_Quick_Check} 或 \P{NFKC_QC})
(4793)
\p{NFKC_Quick_Check:否}(短:\p{NFKCQC=N};不是
\P{NFKC_Quick_Check} 或 \P{NFKC_QC})
(4793)
\p{NFKC_Quick_Check:是} \p{NFKC_Quick_Check=是}(不是
\p{NFKC_Quick_Check} 或 \p{NFKC_QC})
(1_109_209 加上以上所有的 Unicode 代码
点)
\p{NFKC_Quick_Check:是}(短:\p{NFKCQC=Y};不是
\p{NFKC_Quick_Check} 或 \p{NFKC_QC})
(1_109_209 加上以上所有的 Unicode 代码
点)
\p{NFKD_QC:*} \p{NFKD_Quick_Check:*}
\p{NFKD_Quick_Check: N} \p{NFKD_Quick_Check=No}(不
\P{NFKD_Quick_Check} 或 \P{NFKD_QC})
(16_893)
\p{NFKD_Quick_Check:否}(短:\p{NFKDQC=N};不是
\P{NFKD_Quick_Check} 或 \P{NFKD_QC})
(16_893)
\p{NFKD_Quick_Check:是} \p{NFKD_Quick_Check=是}(不是
\p{NFKD_Quick_Check} 或 \p{NFKD_QC})
(1_097_219 加上以上所有的 Unicode 代码
点)
\p{NFKD_Quick_Check:是}(短:\p{NFKDQC=Y};不是
\p{NFKD_Quick_Check} 或 \p{NFKD_QC})
(1_097_219 加上以上所有的 Unicode 代码
点)
\p{Nko} \p{Script=Nko} (不是 \p{NKo}) (59)
\p{Nkoo} \p{Nko} (= \p{Script=Nko}) (不是 \p{NKo})
(59)
\p{Nl} \p{字母编号} (= \p{General_Category=
字母_数字}) (236)
\p{否} \p{Other_Number} (= \p{General_Category=
其他_号码}) (570)
X \p{No_Block} \p{Block=No_Block}(简称:\p{InNB})
(857_776 加上以上所有的 Unicode 代码
点)
\p{Noncharacter_Code_Point} \p{Noncharacter_Code_Point=Y}(短:
\p{NChar}) (66)
\p{Noncharacter_Code_Point: N*}(简称:\p{NChar=N}, \P{NChar})
(1_114_046 加上以上所有的 Unicode 代码
点)
\p{Noncharacter_Code_Point: Y*}(简称:\p{NChar=Y}, \p{NChar})
(66)
\p{Nonspacing_Mark} \p{General_Category=Nonspacing_Mark}
(简称:\p{Mn})(1418)
\p{Nt: *} \p{数字类型: *}
\p{编号} \p{General_Category=编号}(简称:\p{N})
(1346)
X \p{Number_Forms} \p{块=Number_Forms} (64)
\p{Numeric_Type: De} \p{Numeric_Type=Decimal} (540)
\p{Numeric_Type:十进制}(短:\p{Nt=De})(540)
\p{数字类型:Di} \p{数字类型=数字} (128)
\p{Numeric_Type: Digit} (短: \p{Nt=Di}) (128)
\p{Numeric_Type: None} (短: \p{Nt=None}) (1_112_685 plus all
Unicode 代码点以上)
\p{数值类型:Nu} \p{数值类型=数值} (759)
\p{Numeric_Type: Numeric}(短:\p{Nt=Nu})(759)
T \p{Numeric_Value: -1/2} (短: \p{Nv=-1/2}) (1)
T \p{Numeric_Value: 0} (短: \p{Nv=0}) (70)
T \p{Numeric_Value: 1/16} (短: \p{Nv=1/16}) (3)
T \p{Numeric_Value: 1/10} (短: \p{Nv=1/10}) (1)
T \p{Numeric_Value: 1/9} (短: \p{Nv=1/9}) (1)
T \p{Numeric_Value: 1/8} (短: \p{Nv=1/8}) (5)
T \p{Numeric_Value: 1/7} (短: \p{Nv=1/7}) (1)
T \p{Numeric_Value: 1/6} (短: \p{Nv=1/6}) (2)
T \p{Numeric_Value: 3/16} (短: \p{Nv=3/16}) (3)
T \p{Numeric_Value: 1/5} (短: \p{Nv=1/5}) (1)
T \p{Numeric_Value: 1/4} (短: \p{Nv=1/4}) (11)
T \p{Numeric_Value: 1/3} (短: \p{Nv=1/3}) (5)
T \p{Numeric_Value: 3/8} (短: \p{Nv=3/8}) (1)
T \p{Numeric_Value: 2/5} (短: \p{Nv=2/5}) (1)
T \p{Numeric_Value: 1/2} (短: \p{Nv=1/2}) (11)
T \p{Numeric_Value: 3/5} (短: \p{Nv=3/5}) (1)
T \p{Numeric_Value: 5/8} (短: \p{Nv=5/8}) (1)
T \p{Numeric_Value: 2/3} (短: \p{Nv=2/3}) (6)
T \p{Numeric_Value: 3/4} (短: \p{Nv=3/4}) (6)
T \p{Numeric_Value: 4/5} (短: \p{Nv=4/5}) (1)
T \p{Numeric_Value: 5/6} (短: \p{Nv=5/6}) (2)
T \p{Numeric_Value: 7/8} (短: \p{Nv=7/8}) (1)
T \p{Numeric_Value: 1} (短: \p{Nv=1}) (113)
T \p{Numeric_Value: 3/2} (短: \p{Nv=3/2}) (1)
T \p{Numeric_Value: 2} (短: \p{Nv=2}) (115)
T \p{Numeric_Value: 5/2} (短: \p{Nv=5/2}) (1)
T \p{Numeric_Value: 3} (短: \p{Nv=3}) (117)
T \p{Numeric_Value: 7/2} (短: \p{Nv=7/2}) (1)
T \p{Numeric_Value: 4} (短: \p{Nv=4}) (109)
T \p{Numeric_Value: 9/2} (短: \p{Nv=9/2}) (1)
T \p{Numeric_Value: 5} (短: \p{Nv=5}) (105)
T \p{Numeric_Value: 11/2} (短: \p{Nv=11/2}) (1)
T \p{Numeric_Value: 6} (短: \p{Nv=6}) (94)
T \p{Numeric_Value: 13/2} (短: \p{Nv=13/2}) (1)
T \p{Numeric_Value: 7} (短: \p{Nv=7}) (93)
T \p{Numeric_Value: 15/2} (短: \p{Nv=15/2}) (1)
T \p{Numeric_Value: 8} (短: \p{Nv=8}) (89)
T \p{Numeric_Value: 17/2} (短: \p{Nv=17/2}) (1)
T \p{Numeric_Value: 9} (短: \p{Nv=9}) (93)
T \p{Numeric_Value: 10} (短: \p{Nv=10}) (49)
T \p{Numeric_Value: 11} (短: \p{Nv=11}) (6)
T \p{Numeric_Value: 12} (短: \p{Nv=12}) (6)
T \p{Numeric_Value: 13} (短: \p{Nv=13}) (4)
T \p{Numeric_Value: 14} (短: \p{Nv=14}) (4)
T \p{Numeric_Value: 15} (短: \p{Nv=15}) (4)
T \p{Numeric_Value: 16} (短: \p{Nv=16}) (5)
T \p{Numeric_Value: 17} (短: \p{Nv=17}) (5)
T \p{Numeric_Value: 18} (短: \p{Nv=18}) (5)
T \p{Numeric_Value: 19} (短: \p{Nv=19}) (5)
T \p{Numeric_Value: 20} (短: \p{Nv=20}) (27)
T \p{Numeric_Value: 21} (短: \p{Nv=21}) (1)
T \p{Numeric_Value: 22} (短: \p{Nv=22}) (1)
T \p{Numeric_Value: 23} (短: \p{Nv=23}) (1)
T \p{Numeric_Value: 24} (短: \p{Nv=24}) (1)
T \p{Numeric_Value: 25} (短: \p{Nv=25}) (1)
T \p{Numeric_Value: 26} (短: \p{Nv=26}) (1)
T \p{Numeric_Value: 27} (短: \p{Nv=27}) (1)
T \p{Numeric_Value: 28} (短: \p{Nv=28}) (1)
T \p{Numeric_Value: 29} (短: \p{Nv=29}) (1)
T \p{Numeric_Value: 30} (短: \p{Nv=30}) (14)
T \p{Numeric_Value: 31} (短: \p{Nv=31}) (1)
T \p{Numeric_Value: 32} (短: \p{Nv=32}) (1)
T \p{Numeric_Value: 33} (短: \p{Nv=33}) (1)
T \p{Numeric_Value: 34} (短: \p{Nv=34}) (1)
T \p{Numeric_Value: 35} (短: \p{Nv=35}) (1)
T \p{Numeric_Value: 36} (短: \p{Nv=36}) (1)
T \p{Numeric_Value: 37} (短: \p{Nv=37}) (1)
T \p{Numeric_Value: 38} (短: \p{Nv=38}) (1)
T \p{Numeric_Value: 39} (短: \p{Nv=39}) (1)
T \p{Numeric_Value: 40} (短: \p{Nv=40}) (14)
T \p{Numeric_Value: 41} (短: \p{Nv=41}) (1)
T \p{Numeric_Value: 42} (短: \p{Nv=42}) (1)
T \p{Numeric_Value: 43} (短: \p{Nv=43}) (1)
T \p{Numeric_Value: 44} (短: \p{Nv=44}) (1)
T \p{Numeric_Value: 45} (短: \p{Nv=45}) (1)
T \p{Numeric_Value: 46} (短: \p{Nv=46}) (1)
T \p{Numeric_Value: 47} (短: \p{Nv=47}) (1)
T \p{Numeric_Value: 48} (短: \p{Nv=48}) (1)
T \p{Numeric_Value: 49} (短: \p{Nv=49}) (1)
T \p{Numeric_Value: 50} (短: \p{Nv=50}) (24)
T \p{Numeric_Value: 60} (短: \p{Nv=60}) (9)
T \p{Numeric_Value: 70} (短: \p{Nv=70}) (9)
T \p{Numeric_Value: 80} (短: \p{Nv=80}) (9)
T \p{Numeric_Value: 90} (短: \p{Nv=90}) (9)
T \p{Numeric_Value: 100} (短: \p{Nv=100}) (26)
T \p{Numeric_Value: 200} (短: \p{Nv=200}) (3)
T \p{Numeric_Value: 300} (短: \p{Nv=300}) (4)
T \p{Numeric_Value: 400} (短: \p{Nv=400}) (3)
T \p{Numeric_Value: 500} (短: \p{Nv=500}) (13)
T \p{Numeric_Value: 600} (短: \p{Nv=600}) (3)
T \p{Numeric_Value: 700} (短: \p{Nv=700}) (3)
T \p{Numeric_Value: 800} (短: \p{Nv=800}) (3)
T \p{Numeric_Value: 900} (短: \p{Nv=900}) (4)
T \p{Numeric_Value: 1000} (短: \p{Nv=1000}) (18)
T \p{Numeric_Value: 2000} (短: \p{Nv=2000}) (1)
T \p{Numeric_Value: 3000} (短: \p{Nv=3000}) (1)
T \p{Numeric_Value: 4000} (短: \p{Nv=4000}) (1)
T \p{Numeric_Value: 5000} (短: \p{Nv=5000}) (5)
T \p{Numeric_Value: 6000} (短: \p{Nv=6000}) (1)
T \p{Numeric_Value: 7000} (短: \p{Nv=7000}) (1)
T \p{Numeric_Value: 8000} (短: \p{Nv=8000}) (1)
T \p{Numeric_Value: 9000} (短: \p{Nv=9000}) (1)
T \p{Numeric_Value: 10000} (= 1.0e+04) (短: \p{Nv=10000}) (8)
T \p{Numeric_Value: 20000} (= 2.0e+04) (短: \p{Nv=20000}) (1)
T \p{Numeric_Value: 30000} (= 3.0e+04) (短: \p{Nv=30000}) (1)
T \p{Numeric_Value: 40000} (= 4.0e+04) (短: \p{Nv=40000}) (1)
T \p{Numeric_Value: 50000} (= 5.0e+04) (短: \p{Nv=50000}) (4)
T \p{Numeric_Value: 60000} (= 6.0e+04) (短: \p{Nv=60000}) (1)
T \p{Numeric_Value: 70000} (= 7.0e+04) (短: \p{Nv=70000}) (1)
T \p{Numeric_Value: 80000} (= 8.0e+04) (短: \p{Nv=80000}) (1)
T \p{Numeric_Value: 90000} (= 9.0e+04) (短: \p{Nv=90000}) (1)
T \p{Numeric_Value: 100000} (= 1.0e+05) (短: \p{Nv=100000}) (1)
T \p{Numeric_Value: 216000} (= 2.2e+05) (短: \p{Nv=216000}) (1)
T \p{Numeric_Value: 432000} (= 4.3e+05) (短: \p{Nv=432000}) (1)
T \p{Numeric_Value: 1000000} (= 1.0e+06) (短: \p{Nv=1000000}) (1)
T \p{Numeric_Value: 100000000} (= 1.0e+08) (短: \p{Nv=100000000})
(3)
T \p{Numeric_Value: 10000000000} (= 1.0e+10) (短: \p{Nv=
10000000000}) (1)
T \p{Numeric_Value: 1000000000000} (= 1.0e+12) (短: \p{Nv=
1000000000000}) (2)
\p{Numeric_Value: NaN}(短:\p{Nv=NaN})(1_112_685 加上所有
Unicode 代码点以上)
\p{Nv: *} \p{数值值: *}
X \p{OCR} \p{光学字符识别} (=
\p{方块=Optical_Character_Recognition})
(32)
\p{Ogam} \p{Ogham} (= \p{Script=Ogham}) (不是
\p{块=奥格姆}) (29)
\p{Ogham} \p{Script=Ogham}(简称:\p{Ogam};不是
\p{块=奥格姆}) (29)
\p{Ol_Chiki} \p{Script=Ol_Chiki}(简称:\p{Olck})(48)
\p{Olck} \p{Ol_Chiki} (= \p{Script=Ol_Chiki}) (48)
\p{Old_Italic} \p{Script=Old_Italic}(简称:\p{Ital};
不是 \p{Block=Old_Italic}) (36)
\p{Old_North_Arabian} \p{Script=Old_North_Arabian}(短:
\p{纳尔布}) (32)
\p{Old_Permic} \p{Script=Old_Permic}(简称:\p{Perm};
不是 \p{Block=Old_Permic}) (43)
\p{Old_Persian} \p{Script=Old_Persian}(简称:\p{Xpeo};
不是 \p{Block=Old_Persian}) (50)
\p{Old_South_Arabian} \p{Script=Old_South_Arabian}(短:
\p{萨布}) (32)
\p{Old_Turkic} \p{Script=Old_Turkic}(简称:\p{Orkh};
不是 \p{Block=Old_Turkic}) (73)
\p{Open_Punctuation} \p{General_Category=Open_Punctuation}
(简称:\p{Ps})(75)
X \p{光学字符识别} \p{块=
Optical_Character_Recognition}(短:
\p{OCR}) (32)
\p{奥里亚语} \p{Script=奥里亚语}(简称:\p{奥里亚语};不是
\p{方块=奥里亚}) (90)
\p{Orkh} \p{Old_Turkic} (= \p{Script=Old_Turkic})
(不是 \p{Block=Old_Turkic})(73)
X \p{Ornamental_Dingbats} \p{块=Ornamental_Dingbats} (48)
\p{奥里亚} \p{奥里亚} (= \p{脚本=奥里亚}) (不是
\p{方块=奥里亚}) (90)
\p{Osma} \p{Osmanya} (= \p{Script=Osmanya}) (不是
\p{块=奥斯曼亚}) (40)
\p{Osmanya} \p{Script=Osmanya}(简称:\p{Osma};不是
\p{块=奥斯曼亚}) (40)
\p{Other} \p{General_Category=Other}(简称:\p{C})
(1_001_306 加上以上所有的 Unicode 代码
点)
\p{Other_Letter} \p{General_Category=Other_Letter}(短:
\p{Lo}) (99_115)
\p{Other_Number} \p{General_Category=Other_Number}(短:
\p{否}) (570)
\p{Other_Punctuation} \p{General_Category=Other_Punctuation}
(简称:\p{Po})(484)
\p{Other_Symbol} \p{General_Category=Other_Symbol}(短:
\p{所以}) (5082)
\p{P} \pP \p{标点} (= \p{General_Category=
标点符号}) (NOT
\p{通用标点符号}) (688)
\p{Pahawh_Hmong} \p{Script=Pahawh_Hmong}(简称:\p{Hmng};
不是 \p{Block=Pahawh_Hmong}) (127)
\p{棕榈} \p{棕榈树} (= \p{脚本=棕榈树}) (32)
\p{Palmyrene} \p{Script=Palmyrene}(简称:\p{Palm})(32)
\p{Paragraph_Separator} \p{General_Category=Paragraph_Separator}
(简称:\p{Zp})(1)
\p{Pat_Syn} \p{Pattern_Syntax} (= \p{Pattern_Syntax=
是}) (2760)
\p{Pat_Syn: *} \p{Pattern_Syntax: *}
\p{Pat_WS} \p{Pattern_White_Space} (=
\p{Pattern_White_Space=Y}) (11)
\p{Pat_WS: *} \p{Pattern_White_Space: *}
\p{Pattern_Syntax} \p{Pattern_Syntax=Y}(简称:\p{PatSyn})
(2760)
\p{Pattern_Syntax: N*}(简称:\p{PatSyn=N}, \P{PatSyn})
(1_111_352 加上以上所有的 Unicode 代码
点)
\p{Pattern_Syntax: Y*}(简称:\p{PatSyn=Y},\p{PatSyn})(2760)
\p{Pattern_White_Space} \p{Pattern_White_Space=Y}(短:
\p{PatWS}) (11)
\p{Pattern_White_Space: N*}(短:\p{PatWS=N},\P{PatWS})
(1_114_101 加上以上所有的 Unicode 代码
点)
\p{Pattern_White_Space: Y*}(短:\p{PatWS=Y},\p{PatWS})(11)
\p{Pau_Cin_Hau} \p{Script=Pau_Cin_Hau}(简称:\p{Pauc};
不是 \p{Block=Pau_Cin_Hau}) (57)
\p{Pauc} \p{Pau_Cin_Hau} (= \p{脚本=Pau_Cin_Hau})
(不是 \p{Block=Pau_Cin_Hau})(57)
\p{Pc} \p{连接器标点} (=
\p{一般_类别=
连接器_标点符号}) (10)
\p{Pd} \p{Dash_标点} (=
\p{General_Category=Dash_Punctuation})
(24)
\p{Pe} \p{Close_Punctuation} (=
\p{General_Category=Close_Punctuation})
(73)
\p{PerlSpace} \p{PosixSpace} (6)
\p{PerlWord} \p{PosixWord} (63)
\p{Perm} \p{Old_Permic} (= \p{Script=Old_Permic})
(不是 \p{Block=Old_Permic})(43)
\p{Pf} \p{最终标点} (=
\p{General_Category=Final_Punctuation})
(10)
\p{Phag} \p{Phags_Pa} (= \p{Script=Phags_Pa}) (不是
\p{Block=Pags_Pa}) (56)
\p{Phags_Pa} \p{Script=Phags_Pa}(简称:\p{Phag};不是
\p{Block=Pags_Pa}) (56)
X \p{Phaistos} \p{Phaistos_Disc} (= \p{块=
Phaistos_Disc}) (48)
X \p{Phaistos_Disc} \p{Block=Phaistos_Disc}(短:
\p{因斐斯托斯}) (48)
\p{Phli} \p{Inscriptional_Pahlavi} (= \p{脚本=
Inscriptional_Pahlavi}) (不是 \p{Block=
铭文_巴列维}) (27)
\p{Phlp} \p{Psalter_Pahlavi} (= \p{脚本=
Psalter_Pahlavi}) (不是 \p{Block=
诗篇_巴列维}) (29)
\p{Phnx} \p{腓尼基人} (= \p{Script=腓尼基人})
(不是 \p{Block=Phoenician})(29)
\p{腓尼基人} \p{Script=腓尼基人}(简称:\p{Phnx};
不是 \p{Block=Phoenician}) (29)
X \p{Phonetic_Ext} \p{Phonetic_Extensions} (= \p{块=
语音扩展}) (128)
X \p{Phonetic_Ext_Sup} \p{Phonetic_Extensions_Suplement} (=
\p{块=
Phonetic_Extensions_Suplement}) (64)
X \p{Phonetic_Extensions} \p{Block=Phonetic_Extensions}(短:
\p{InPhoneticExt}) (128)
X \p{Phonetic_Extensions_Supplement} \p{块=
Phonetic_Extensions_Supplement}(短:
\p{InPhoneticExtSup}) (64)
\p{Pi} \p{初始标点} (=
\p{一般_类别=
首字母_标点符号}) (12)
X \p{扑克牌} \p{块=扑克牌} (96)
\p{Plrd} \p{Miao} (= \p{Script=Miao}) (不是
\p{块=苗}) (133)
\p{Po} \p{其他标点} (=
\p{General_Category=Other_Punctuation})
(484)
\p{PosixAlnum} [A-Za-z0-9] (62)
\p{PosixAlpha} [A-Za-z] (52)
\p{PosixBlank} \t 和 ' ' (2)
\p{PosixCntrl} ASCII 控制字符:NUL、SOH、STX、
ETX、EOT、ENQ、ACK、BEL、BS、HT、LF、VT、
FF、CR、SO、SI、DLE、DC1、DC2、DC3、DC4、
NAK、SYN、ETB、CAN、EOM、SUB、ESC、FS、
GS、RS、美国和德尔 (33)
\p{PosixDigit} [0-9] (10)
\p{PosixGraph} [-!"#$%&'()*+,./:;<=>?@[\\]^_`{|}~0-9A-Za-
z] (94)
\p{PosixLower} [az] (/i= PosixAlpha) (26)
\p{PosixPrint} [- 0-9A-Za-z!"#$%&'()*+,./:;<=
>?@[\\]^_`{|}~] (95)
\p{PosixPunct} [-!"#$%&'()*+,./:;<=>?@[\\]^_`{|}~] (32)
\p{PosixSpace} \t、\n、\cK、\f、\r 和 ' '。 (\cK 是
垂直制表符)(简称:\p{PerlSpace})(6)
\p{PosixUpper} [AZ] (/i= PosixAlpha) (26)
\p{PosixWord} \w,仅限于 ASCII = [A-Za-z0-9_]
(简称:\p{PerlWord})(63)
\p{PosixXDigit} \p{ASCII_Hex_Digit=Y} [0-9A-Fa-f](短:
\p{AHex}) (22)
T \p{Present_In: 1.1} \p{Age=V1_1} (短: \p{In=1.1}) (Perl
扩展名) (33_979)
T \p{Present_In: 2.0} 版本中引入的代码点用法
2.0 或更早版本(简称:\p{In=2.0})(Perl
扩展名) (178_500)
T \p{Present_In: 2.1} 版本中引入的代码点用法
2.1 或更早版本(简称:\p{In=2.1})(Perl
扩展名) (178_502)
T \p{Present_In: 3.0} 版本中引入的代码点用法
3.0 或更早版本(简称:\p{In=3.0})(Perl
扩展名) (188_809)
T \p{Present_In: 3.1} 版本中引入的代码点用法
3.1 或更早版本(简称:\p{In=3.1})(Perl
扩展名) (233_787)
T \p{Present_In: 3.2} 版本中引入的代码点用法
3.2 或更早版本(简称:\p{In=3.2})(Perl
扩展名) (234_803)
T \p{Present_In: 4.0} 版本中引入的代码点用法
4.0 或更早版本(简称:\p{In=4.0})(Perl
扩展名) (236_029)
T \p{Present_In: 4.1} 版本中引入的代码点用法
4.1 或更早版本(简称:\p{In=4.1})(Perl
扩展名) (237_302)
T \p{Present_In: 5.0} 版本中引入的代码点用法
5.0 或更早版本(简称:\p{In=5.0})(Perl
扩展名) (238_671)
T \p{Present_In: 5.1} 版本中引入的代码点用法
5.1 或更早版本(简称:\p{In=5.1})(Perl
扩展名) (240_295)
T \p{Present_In: 5.2} 版本中引入的代码点用法
5.2 或更早版本(简称:\p{In=5.2})(Perl
扩展名) (246_943)
T \p{Present_In: 6.0} 版本中引入的代码点用法
6.0 或更早版本(简称:\p{In=6.0})(Perl
扩展名) (249_031)
T \p{Present_In: 6.1} 版本中引入的代码点用法
6.1 或更早版本(简称:\p{In=6.1})(Perl
扩展名) (249_763)
T \p{Present_In: 6.2} 版本中引入的代码点用法
6.2 或更早版本(简称:\p{In=6.2})(Perl
扩展名) (249_764)
T \p{Present_In: 6.3} 版本中引入的代码点用法
6.3 或更早版本(简称:\p{In=6.3})(Perl
扩展名) (249_769)
T \p{Present_In: 7.0} 版本中引入的代码点用法
7.0 或更早版本(简称:\p{In=7.0})(Perl
扩展名) (252_603)
\p{Present_In:未分配} \p{Age=未分配}(短:\p{In=
未分配}) (Perl 扩展) (861_509
加上以上所有的 Unicode 代码点)
\p{打印} \p{XPosixPrint} (250_422)
\p{Private_Use} \p{General_Category=Private_Use}(短:
\p{Co}; 不是 \p{Private_Use_Area})
(137_468)
X \p{Private_Use_Area} \p{Block=Private_Use_Area}(短:
\p{InPUA}) (6400)
\p{Prti} \p{Inscriptional_Parthian} (= \p{脚本=
Inscriptional_Parthian}) (不是 \p{Block=
铭文_帕提亚}) (30)
\p{Ps} \p{Open_Punctuation} (=
\p{General_Category=Open_Punctuation})
(75)
\p{Psalter_Pahlavi} \p{Script=Psalter_Pahlavi}(短:
\p{菲尔普}; 不是 \p{Block=Psalter_Pahlavi})
(29)
X \p{PUA} \p{私人使用区域} (= \p{块=
私人使用区域}) (6400)
\p{Punct} \p{General_Category=Punctuation}(短:
\p{P}; 不是 \p{General_Punctuation}) (688)
\p{标点} \p{标点} (= \p{General_Category=
标点符号}) (NOT
\p{通用标点符号}) (688)
\p{Qaac} \p{科普特} (= \p{Script=科普特}) (不是
\p{块=科普特}) (137)
\p{Qaai} \p{继承} (= \p{脚本=继承})
(563)
\p{QMark} \p{Quotation_Mark} (= \p{Quotation_Mark=
是}) (30)
\p{QMark: *} \p{Quotation_Mark: *}
\p{Quotation_Mark} \p{Quotation_Mark=Y}(简称:\p{QMark})
(30)
\p{Quotation_Mark: N*} (短: \p{QMark=N}, \P{QMark}) (1_114_082
加上以上所有的 Unicode 代码点)
\p{Quotation_Mark: Y*} (短: \p{QMark=Y}, \p{QMark}) (30)
\p{激进} \p{激进=Y} (329)
\p{激进:N*}(单:\P{激进})(1_113_783加上所有
Unicode 代码点以上)
\p{激进:Y*}(单:\p{激进})(329)
\p{Rejang} \p{Script=Rejang}(简称:\p{Rjng};不是
\p{块=Rejang}) (37)
\p{Rjng} \p{Rejang} (= \p{Script=Rejang}) (不是
\p{块=Rejang}) (37)
X \p{Rumi} \p{Rumi_Numeral_Symbols} (= \p{块=
鲁米_数字_符号}) (32)
X \p{Rumi_Numeral_Symbols} \p{Block=Rumi_Numeral_Symbols}(短:
\p{因鲁米}) (32)
\p{Runic} \p{Script=Runic}(简称:\p{Runr};不是
\p{方块=符文}) (86)
\p{Runr} \p{Runic} (= \p{Script=Runic}) (不是
\p{方块=符文}) (86)
\p{S} \pS \p{符号} (= \p{General_Category=符号})
(6198)
\p{Samaritan} \p{Script=Samaritan}(简称:\p{Samr};不是
\p{块=撒玛利亚人}) (61)
\p{Samr} \p{撒玛利亚人} (= \p{Script=撒玛利亚人})
(不是 \p{Block=Samaritan})(61)
\p{Sarb} \p{Old_South_Arabian} (= \p{脚本=
古南阿拉伯}) (32)
\p{Saur} \p{Saurashtra} (= \p{Script=Saurashtra})
(不是 \p{Block=Saurashtra})(81)
\p{Saurashtra} \p{Script=Saurashtra}(简称:\p{Saur};
不是 \p{Block=Saurashtra}) (81)
\p{SB: *} \p{Sentence_Break: *}
\p{Sc} \p{货币符号} (=
\p{General_Category=Currency_Symbol})
(52)
\p{Sc:*} \p{脚本:*}
\p{脚本:Aghb} \p{脚本=Caucasian_Albanian} (53)
\p{脚本:阿拉伯} \p{脚本=阿拉伯语} (1244)
\p{脚本:阿拉伯语}(简称:\p{Sc=Arab},\p{Arab})(1244)
\p{脚本:亚美尼亚语}(简称:\p{Sc=Armn},\p{Armn})(93)
\p{脚本:Armi} \p{脚本=Imperial_Aramaic} (31)
\p{脚本:亚美尼亚语} \p{脚本=亚美尼亚语} (93)
\p{脚本:Avestan}(简称:\p{Sc=Avst},\p{Avst})(61)
\p{脚本:Avst} \p{脚本=Avestan} (61)
\p{脚本:巴厘岛} \p{脚本=巴厘岛} (121)
\p{脚本:巴厘岛}(简称:\p{Sc=Bali},\p{Bali})(121)
\p{脚本:Bamu} \p{脚本=Bamum} (657)
\p{脚本:Bamum}(简称:\p{Sc=Bamu},\p{Bamu})(657)
\p{脚本:低音} \p{脚本=Bassa_Vah} (36)
\p{脚本:Bassa_Vah}(短:\p{Sc=Bass},\p{Bass})(36)
\p{脚本:Batak}(简称:\p{Sc=Batk},\p{Batk})(56)
\p{脚本:Batk} \p{脚本=Batak} (56)
\p{脚本:Beng} \p{脚本=孟加拉语} (93)
\p{脚本:孟加拉语}(简称:\p{Sc=Beng},\p{Beng})(93)
\p{脚本:Bopo} \p{脚本=Bopomofo} (70)
\p{脚本:Bopomofo}(短:\p{Sc=Bopo},\p{Bopo})(70)
\p{脚本:Brah} \p{脚本=Brahmi} (109)
\p{脚本:Brahmi}(简称:\p{Sc=Brah},\p{Brah})(109)
\p{脚本:盲文} \p{脚本=盲文} (256)
\p{脚本:盲文}(短:\p{Sc=Brai},\p{Brai})(256)
\p{脚本:Bugi} \p{脚本=Buginese} (30)
\p{脚本:Buginese}(简称:\p{Sc=Bugi},\p{Bugi})(30)
\p{脚本:Buhd} \p{脚本=Buhid} (20)
\p{脚本:Buhid}(简称:\p{Sc=Buhd},\p{Buhd})(20)
\p{脚本:Cakm} \p{脚本=Chakma} (67)
\p{脚本:Canadian_Aboriginal}(简称:\p{Sc=Cans},\p{Cans})
(710)
\p{脚本:Cans} \p{脚本=加拿大原住民} (710)
\p{脚本:Cari} \p{脚本=Carian} (49)
\p{脚本:Carian}(简称:\p{Sc=Cari},\p{Cari})(49)
\p{脚本:Caucasian_Albanian}(简称:\p{Sc=Aghb},\p{Aghb})(53)
\p{脚本:Chakma}(简称:\p{Sc=Cakm},\p{Cakm})(67)
\p{脚本:Cham}(简称:\p{Sc=Cham},\p{Cham})(83)
\p{脚本:雪儿} \p{脚本=切诺基} (85)
\p{脚本:Cherokee}(简称:\p{Sc=Cher},\p{Cher})(85)
\p{脚本:通用}(简称:\p{Sc=Zyyy},\p{Zyyy})(7129)
\p{脚本:科普特} \p{脚本=科普特} (137)
\p{脚本:科普特}(简称:\p{Sc=Copt},\p{Copt})(137)
\p{脚本:Cprt} \p{脚本=塞浦路斯} (55)
\p{脚本:楔形文字}(短:\p{Sc=Xsux},\p{Xsux})(1037)
\p{脚本:塞浦路斯}(简称:\p{Sc=Cprt},\p{Cprt})(55)
\p{脚本:西里尔文}(简称:\p{Sc=Cyrl},\p{Cyrl})(431)
\p{脚本:Cyrl} \p{脚本=西里尔文} (431)
\p{脚本:Deseret}(短:\p{Sc=Dsrt},\p{Dsrt})(80)
\p{脚本:Deva} \p{脚本=天城文} (152)
\p{脚本:梵文}(简称:\p{Sc=Deva},\p{Deva})(152)
\p{脚本:Dsrt} \p{脚本=Deseret} (80)
\p{脚本:复制} \p{脚本=Duployan} (143)
\p{脚本:Duployan}(简称:\p{Sc=Dupl},\p{Dupl})(143)
\p{脚本:埃及} \p{脚本=埃及象形文字} (1071)
\p{脚本:Egyptian_Hieroglyphs}(简称:\p{Sc=Egyp},\p{Egyp})
(1071)
\p{脚本:厄尔巴岛} \p{脚本=厄尔巴桑} (40)
\p{脚本:Elbasan}(简称:\p{Sc=Elba},\p{Elba})(40)
\p{脚本:Ethi} \p{Script=埃塞俄比亚语} (495)
\p{脚本:埃塞俄比亚语}(简称:\p{Sc=Ethi},\p{Ethi})(495)
\p{脚本:格鲁吉亚} \p{脚本=格鲁吉亚} (127)
\p{脚本:格鲁吉亚语}(简称:\p{Sc=Geor},\p{Geor})(127)
\p{脚本:格拉格} \p{脚本=格拉哥里} (94)
\p{脚本:Glagolitic}(简称:\p{Sc=Glag},\p{Glag})(94)
\p{脚本:哥特式} \p{脚本=哥特式} (27)
\p{脚本:哥特式}(简称:\p{Sc=Goth},\p{Goth})(27)
\p{脚本:Gran} \p{脚本=Grantha} (83)
\p{脚本:Grantha}(简称:\p{Sc=Gran},\p{Gran})(83)
\p{脚本:希腊语}(简称:\p{Sc=Grek},\p{Grek})(516)
\p{脚本:希腊语} \p{脚本=希腊语} (516)
\p{脚本:古吉拉特语}(简称:\p{Sc=Gujr},\p{Gujr})(84)
\p{脚本:Gujr} \p{脚本=古吉拉特语} (84)
\p{脚本:Gurmukhi}(简称:\p{Sc=Guru},\p{Guru})(79)
\p{脚本:大师} \p{脚本=Gurmukhi} (79)
\p{脚本:Han}(简称:\p{Sc=Han},\p{Han})(75_963)
\p{脚本:Hang} \p{Script=Hangul} (11_739)
\p{脚本:韩文}(短:\p{Sc=Hang},\p{Hang})(11_739)
\p{脚本:Hani} \p{脚本=Han} (75_963)
\p{脚本:Hano} \p{脚本=Hanunoo} (21)
\p{脚本:Hanooo}(简称:\p{Sc=Hano},\p{Hano})(21)
\p{脚本:希伯来语} \p{脚本=希伯来语} (133)
\p{脚本:希伯来语}(简称:\p{Sc=Hebr},\p{Hebr})(133)
\p{脚本:平假名} \p{脚本=平假名} (91)
\p{脚本:平假名}(短:\p{Sc=Hira},\p{Hira})(91)
\p{脚本:Hmng} \p{脚本=Pahawh_Hmong} (127)
\p{脚本:Imperial_Aramaic}(简称:\p{Sc=Armi},\p{Armi})(31)
\p{脚本:继承}(简称:\p{Sc=Zinh},\p{Zinh})(563)
\p{脚本:Inscriptional_Pahlavi}(简称:\p{Sc=Phli},\p{Phli})
(27)
\p{脚本:Inscriptional_Parthian}(简称:\p{Sc=Prti},\p{Prti})
(30)
\p{脚本:斜体} \p{脚本=Old_Italic} (36)
\p{脚本:Java} \p{脚本=Javanese} (90)
\p{脚本:爪哇语}(简称:\p{Sc=Java},\p{Java})(90)
\p{脚本:Kaithi}(简称:\p{Sc=Kthi},\p{Kthi})(66)
\p{脚本:Kali} \p{脚本=Kayah_Li} (47)
\p{脚本:假名} \p{脚本=片假名} (300)
\p{脚本:卡纳达语}(简称:\p{Sc=Knda},\p{Knda})(87)
\p{脚本:片假名}(简称:\p{Sc=假名},\p{假名})(300)
\p{脚本:Kayah_Li}(简称:\p{Sc=Kali},\p{Kali})(47)
\p{脚本:Khar} \p{脚本=Kharoshthi} (65)
\p{脚本:Kharoshthi}(简称:\p{Sc=Khar},\p{Khar})(65)
\p{脚本:高棉语}(简称:\p{Sc=Khmr},\p{Khmr})(146)
\p{脚本:高棉语} \p{脚本=高棉语} (146)
\p{脚本:Khoj} \p{脚本=Khojki} (61)
\p{脚本:Khojki}(简称:\p{Sc=Khoj},\p{Khoj})(61)
\p{脚本:Khudawadi}(简称:\p{Sc=Sind},\p{Sind})(69)
\p{脚本:Knda} \p{脚本=卡纳达语} (87)
\p{脚本:Kthi} \p{脚本=Kaithi} (66)
\p{脚本:拉娜} \p{脚本=Tai_Tham} (127)
\p{脚本:Lao}(简称:\p{Sc=Lao},\p{Lao})(67)
\p{脚本:老挝} \p{脚本=老挝} (67)
\p{脚本:拉丁语}(简称:\p{Sc=Latn},\p{Latn})(1338)
\p{脚本:拉丁语} \p{脚本=拉丁语} (1338)
\p{脚本:Lepc} \p{脚本=Lepcha} (74)
\p{脚本:Lepcha}(简称:\p{Sc=Lepc},\p{Lepc})(74)
\p{脚本:肢体} \p{脚本=肢体} (68)
\p{脚本:Limbu}(简称:\p{Sc=Limb},\p{Limb})(68)
\p{脚本:丽娜} \p{脚本=Linear_A} (341)
\p{脚本:Linb} \p{脚本=Linear_B} (211)
\p{脚本:Linear_A}(短:\p{Sc=Lina},\p{Lina})(341)
\p{脚本:Linear_B}(短:\p{Sc=Linb},\p{Linb})(211)
\p{脚本:傈僳语}(简称:\p{Sc=傈僳语},\p{傈僳族})(48)
\p{脚本:利西亚} \p{脚本=利西亚} (29)
\p{脚本:Lycian}(简称:\p{Sc=Lyci},\p{Lyci})(29)
\p{脚本:Lydi} \p{脚本=Lydian} (27)
\p{脚本:Lydian}(简称:\p{Sc=Lydi},\p{Lydi})(27)
\p{脚本:Mahajani}(简称:\p{Sc=Mahj},\p{Mahj})(39)
\p{脚本:Mahj} \p{脚本=Mahajani} (39)
\p{脚本:马拉雅拉姆语}(简称:\p{Sc=Mlym},\p{Mlym})(99)
\p{脚本:Mand} \p{脚本=Mandaic} (29)
\p{脚本:Mandaic}(简称:\p{Sc=Mand},\p{Mand})(29)
\p{脚本:摩尼} \p{脚本=摩尼教} (51)
\p{脚本:Manichaean}(简称:\p{Sc=Mani},\p{Mani})(51)
\p{脚本:Meetei_Mayek}(简称:\p{Sc=Mtei},\p{Mtei})(79)
\p{脚本:Mend} \p{Script=Mende_Kikakui} (213)
\p{脚本:Mende_Kikakui}(简称:\p{Sc=Mend},\p{Mend})(213)
\p{脚本:Merc} \p{脚本=Meroitic_Cursive} (26)
\p{脚本:Mero} \p{脚本=Meroitic_Hieroglyphs} (32)
\p{脚本:Meroitic_Cursive}(简称:\p{Sc=Merc},\p{Merc})(26)
\p{脚本:Meroitic_Hieroglyphs}(简称:\p{Sc=Mero},\p{Mero})
(32)
\p{脚本:苗}(简称:\p{Sc=苗},\p{苗})(133)
\p{脚本:Mlym} \p{脚本=马拉雅拉姆语} (99)
\p{脚本:Modi}(简称:\p{Sc=Modi},\p{Modi})(79)
\p{Script: Mong} \p{Script=蒙古语} (153)
\p{文字:蒙古语}(简称:\p{Sc=Mong},\p{Mong})(153)
\p{脚本:Mro}(简称:\p{Sc=Mro},\p{Mro})(43)
\p{脚本:Mroo} \p{脚本=Mro} (43)
\p{脚本:Mtei} \p{脚本=Meetei_Mayek} (79)
\p{脚本:缅甸}(简称:\p{Sc=Mymr},\p{Mymr})(223)
\p{脚本:Mymr} \p{脚本=缅甸} (223)
\p{脚本:Nabataean}(简称:\p{Sc=Nbat},\p{Nbat})(40)
\p{脚本:Narb} \p{脚本=Old_North_Arabian} (32)
\p{脚本:Nbat} \p{脚本=Nabataean} (40)
\p{脚本:New_Tai_Lue}(简称:\p{Sc=Talu},\p{Talu})(83)
\p{脚本:Nko}(简称:\p{Sc=Nko},\p{Nko})(59)
\p{脚本:Nkoo} \p{脚本=Nko} (59)
\p{脚本:Ogam} \p{脚本=Ogham} (29)
\p{脚本:Ogham}(简称:\p{Sc=Ogam},\p{Ogam})(29)
\p{脚本:Ol_Chiki}(简称:\p{Sc=Olck},\p{Olck})(48)
\p{脚本:Olck} \p{脚本=Ol_Chiki} (48)
\p{脚本:Old_Italic}(短:\p{Sc=Ital},\p{Ital})(36)
\p{脚本:Old_North_Arabian}(简称:\p{Sc=Narb},\p{Narb})(32)
\p{脚本:Old_Permic}(简称:\p{Sc=Perm},\p{Perm})(43)
\p{脚本:Old_Persian}(简称:\p{Sc=Xpeo},\p{Xpeo})(50)
\p{脚本:Old_South_Arabian}(简称:\p{Sc=Sarb},\p{Sarb})(32)
\p{脚本:Old_Turkic}(简称:\p{Sc=Orkh},\p{Orkh})(73)
\p{脚本:奥里亚语}(简称:\p{Sc=Orya},\p{Orya})(90)
\p{脚本:Orkh} \p{脚本=Old_Turkic} (73)
\p{脚本:奥里亚语} \p{脚本=奥里亚语} (90)
\p{脚本:Osma} \p{脚本=Osmanya} (40)
\p{脚本:Osmanya}(简称:\p{Sc=Osma},\p{Osma})(40)
\p{脚本:Pahawh_Hmong}(简称:\p{Sc=Hmng},\p{Hmng})(127)
\p{脚本:Palm} \p{脚本=Palmyrene} (32)
\p{脚本:Palmyrene}(简称:\p{Sc=Palm},\p{Palm})(32)
\p{脚本:Pau_Cin_Hau}(简称:\p{Sc=Pauc},\p{Pauc})(57)
\p{脚本:Pauc} \p{脚本=Pau_Cin_Hau} (57)
\p{脚本:烫发} \p{脚本=Old_Permic} (43)
\p{脚本:Phag} \p{脚本=Phags_Pa} (56)
\p{脚本:Phags_Pa}(简称:\p{Sc=Phag},\p{Phag})(56)
\p{脚本:Phli} \p{脚本=Inscriptional_Pahlavi} (27)
\p{脚本:Phlp} \p{脚本=Psalter_Pahlavi} (29)
\p{脚本:Phnx} \p{脚本=腓尼基人} (29)
\p{脚本:腓尼基人}(简称:\p{Sc=Phnx},\p{Phnx})(29)
\p{脚本:Plrd} \p{脚本=苗} (133)
\p{脚本:Prti} \p{脚本=Inscriptional_Parthian} (30)
\p{脚本:Psalter_Pahlavi}(简称:\p{Sc=Phlp},\p{Phlp})(29)
\p{脚本:Qaac} \p{脚本=科普特} (137)
\p{脚本:Qaai} \p{脚本=继承} (563)
\p{脚本:Rejang}(简称:\p{Sc=Rjng},\p{Rjng})(37)
\p{脚本:Rjng} \p{脚本=Rejang} (37)
\p{脚本:符文}(简称:\p{Sc=Runr},\p{Runr})(86)
\p{脚本:Runr} \p{脚本=符文} (86)
\p{脚本:Samaritan}(简称:\p{Sc=Samr},\p{Samr})(61)
\p{脚本:Samr} \p{脚本=撒玛利亚人} (61)
\p{脚本:Sarb} \p{脚本=Old_South_Arabian} (32)
\p{脚本:Saur} \p{脚本=Saurashtra} (81)
\p{脚本:Saurashtra}(简称:\p{Sc=Saur},\p{Saur})(81)
\p{脚本:Sharada}(简称:\p{Sc=Shrd},\p{Shrd})(85)
\p{脚本:Shavian}(简称:\p{Sc=Shaw},\p{Shaw})(48)
\p{脚本:Shaw} \p{脚本=Shavian} (48)
\p{脚本:碎纸} \p{脚本=Sharada} (85)
\p{脚本:Sidd} \p{脚本=Siddham} (72)
\p{脚本:Siddham}(简称:\p{Sc=Sidd},\p{Sidd})(72)
\p{脚本:信德} \p{脚本=Khudawadi} (69)
\p{脚本:Sinh} \p{脚本=僧伽罗语} (110)
\p{脚本:僧伽罗语}(简称:\p{Sc=Sinh},\p{Sinh})(110)
\p{脚本:Sora} \p{脚本=Sora_Sompeng} (35)
\p{脚本:Sora_Sompeng}(简称:\p{Sc=Sora},\p{Sora})(35)
\p{脚本:Sund} \p{Script=Sundanese} (72)
\p{脚本:巽他语}(简称:\p{Sc=Sund},\p{Sund})(72)
\p{脚本:Sylo} \p{脚本=Syloti_Nagri} (44)
\p{脚本:Syloti_Nagri}(简称:\p{Sc=Sylo},\p{Sylo})(44)
\p{脚本:Syrc} \p{脚本=Syriac} (77)
\p{脚本:叙利亚语}(简称:\p{Sc=Syrc},\p{Syrc})(77)
\p{脚本:他加禄语}(简称:\p{Sc=Tglg},\p{Tglg})(20)
\p{脚本:Tagb} \p{脚本=Tagbanwa} (18)
\p{脚本:Tagbanwa}(简称:\p{Sc=Tagb},\p{Tagb})(18)
\p{脚本:Tai_Le}(短:\p{Sc=Tale},\p{Tale})(35)
\p{脚本:Tai_Tham}(短:\p{Sc=Lana},\p{Lana})(127)
\p{脚本:Tai_Viet}(短:\p{Sc=Tavt},\p{Tavt})(72)
\p{脚本:Takr} \p{脚本=Takri} (66)
\p{脚本:Takri}(简称:\p{Sc=Takr},\p{Takr})(66)
\p{脚本:故事} \p{脚本=Tai_Le} (35)
\p{脚本:Talu} \p{脚本=New_Tai_Lue} (83)
\p{脚本:泰米尔语}(简称:\p{Sc=Taml},\p{Taml})(72)
\p{脚本:泰米尔语} \p{脚本=泰米尔语} (72)
\p{脚本:Tavt} \p{脚本=Tai_Viet} (72)
\p{脚本:泰卢语} \p{脚本=泰卢固语} (95)
\p{脚本:泰卢固语}(简称:\p{Sc=Telu},\p{Telu})(95)
\p{脚本:Tfng} \p{脚本=Tifinagh} (59)
\p{脚本:Tglg} \p{脚本=他加禄语} (20)
\p{脚本:Thaa} \p{脚本=Thaana} (50)
\p{脚本:Thaana}(简称:\p{Sc=Thaa},\p{Thaa})(50)
\p{脚本:泰语}(简称:\p{Sc=Thai},\p{Thai})(86)
\p{文字:藏语}(简称:\p{Sc=Tibt},\p{Tibt})(207)
\p{脚本:藏语} \p{脚本=藏语} (207)
\p{脚本:Tifinagh}(简称:\p{Sc=Tfng},\p{Tfng})(59)
\p{脚本:Tirh} \p{脚本=Tirhuta} (82)
\p{脚本:Tirhuta}(简称:\p{Sc=Tirh},\p{Tirh})(82)
\p{脚本:乌加尔} \p{脚本=乌加里特} (31)
\p{脚本:Ugaritic}(简称:\p{Sc=Ugar},\p{Ugar})(31)
\p{脚本:未知}(简称:\p{Sc=Zzzz},\p{Zzzz})(1_001_091
加上以上所有的 Unicode 代码点)
\p{脚本:Vai}(简称:\p{Sc=Vai},\p{Vai})(300)
\p{脚本:Vai} \p{脚本=Vai} (300)
\p{脚本:Wara} \p{脚本=Warang_Citi} (84)
\p{脚本:Warang_Citi}(简称:\p{Sc=Wara},\p{Wara})(84)
\p{脚本:Xpeo} \p{脚本=Old_Persian} (50)
\p{脚本:Xsux} \p{脚本=楔形文字} (1037)
\p{脚本:Yi}(简称:\p{Sc=Yi},\p{Yi})(1220)
\p{脚本:Yiii} \p{脚本=Yi} (1220)
\p{脚本:Zinh} \p{脚本=继承} (563)
\p{脚本:Zyyy} \p{脚本=通用} (7129)
\p{Script: Zzzz} \p{Script=Unknown} (1_001_091 加上所有
Unicode 代码点以上)
\p{Script_Extensions: Aghb} \p{Script_Extensions=
高加索人_阿尔巴尼亚人} (53)
\p{Script_Extensions: 阿拉伯语} \p{Script_Extensions=阿拉伯语} (1298)
\p{Script_Extensions:阿拉伯语}(简称:\p{Scx=Arab})(1298)
\p{Script_Extensions:亚美尼亚语}(简称:\p{Scx=Armn})(94)
\p{Script_Extensions:Armi} \p{Script_Extensions=Imperial_Aramaic}
(31)
\p{Script_Extensions: Armn} \p{Script_Extensions=亚美尼亚语} (94)
\p{Script_Extensions: Avestan}(简称:\p{Scx=Avst})(61)
\p{Script_Extensions: Avst} \p{Script_Extensions=Avestan} (61)
\p{Script_Extensions:巴厘岛} \p{Script_Extensions=巴厘岛} (121)
\p{Script_Extensions:巴厘岛语}(简称:\p{Scx=Bali})(121)
\p{Script_Extensions:巴姆} \p{Script_Extensions=巴姆} (657)
\p{Script_Extensions: Bamum}(简称:\p{Scx=Bamu})(657)
\p{Script_Extensions:低音} \p{Script_Extensions=Bassa_Vah} (36)
\p{Script_Extensions: Bassa_Vah}(简称:\p{Scx=Bass})(36)
\p{Script_Extensions: Batak}(简称:\p{Scx=Batk})(56)
\p{Script_Extensions: 巴塔克} \p{Script_Extensions=巴塔克} (56)
\p{Script_Extensions: Beng} \p{Script_Extensions=孟加拉语} (95)
\p{Script_Extensions:孟加拉语}(简称:\p{Scx=Beng})(95)
\p{Script_Extensions: Bopo} \p{Script_Extensions=Bopomofo} (306)
\p{Script_Extensions: Bopomofo}(简称:\p{Scx=Bopo})(306)
\p{Script_Extensions: Brah} \p{Script_Extensions=Brahmi} (109)
\p{Script_Extensions: Brahmi}(简称:\p{Scx=Brah})(109)
\p{Script_Extensions: Brai} \p{Script_Extensions=盲文} (256)
\p{Script_Extensions:盲文}(短:\p{Scx=Brai})(256)
\p{Script_Extensions: Bugi} \p{Script_Extensions=Buginese} (31)
\p{Script_Extensions:Buginese}(简称:\p{Scx=Bugi})(31)
\p{Script_Extensions: Buhd} \p{Script_Extensions=Buhid} (22)
\p{Script_Extensions: Buhid}(简称:\p{Scx=Buhd})(22)
\p{Script_Extensions: Cakm} \p{Script_Extensions=Chakma} (87)
\p{Script_Extensions: Canadian_Aboriginal}(简称:\p{Scx=Cans})
(710)
\p{Script_Extensions:罐头} \p{Script_Extensions=
加拿大原住民} (710)
\p{Script_Extensions:卡里} \p{Script_Extensions=卡里安} (49)
\p{Script_Extensions: Carian}(简称:\p{Scx=Cari})(49)
\p{Script_Extensions: Caucasian_Albanian}(简称:\p{Scx=Aghb})
(53)
\p{Script_Extensions: Chakma}(简称:\p{Scx=Cakm})(87)
\p{Script_Extensions: Cham}(简称:\p{Scx=Cham})(83)
\p{Script_Extensions:雪儿} \p{Script_Extensions=切诺基} (85)
\p{Script_Extensions: Cherokee}(简称:\p{Scx=Cher})(85)
\p{Script_Extensions: Common}(简称:\p{Scx=Zyyy})(6741)
\p{Script_Extensions: 科普特} \p{Script_Extensions=科普特} (165)
\p{Script_Extensions:科普特}(简称:\p{Scx=Copt})(165)
\p{Script_Extensions: Cprt} \p{Script_Extensions=塞浦路斯} (112)
\p{Script_Extensions:楔形文字}(短:\p{Scx=Xsux})(1037)
\p{Script_Extensions: Cypriot}(简称:\p{Scx=Cprt})(112)
\p{Script_Extensions: Cyrillic}(简称:\p{Scx=Cyrl})(433)
\p{Script_Extensions: Cyrl} \p{Script_Extensions=西里尔文} (433)
\p{Script_Extensions: Deseret}(简称:\p{Scx=Dsrt})(80)
\p{Script_Extensions: Deva} \p{Script_Extensions=天城文} (196)
\p{Script_Extensions: Devanagari}(简称:\p{Scx=Deva})(196)
\p{Script_Extensions: Dsrt} \p{Script_Extensions=Deseret} (80)
\p{Script_Extensions: Dupl} \p{Script_Extensions=Duployan} (147)
\p{Script_Extensions:Duployan}(简称:\p{Scx=Dupl})(147)
\p{Script_Extensions:埃及} \p{Script_Extensions=
埃及象形文字} (1071)
\p{Script_Extensions:Egyptian_Hieroglyphs}(简称:\p{Scx=Egyp})
(1071)
\p{Script_Extensions: 厄尔巴岛} \p{Script_Extensions=厄尔巴桑} (40)
\p{Script_Extensions: Elbasan}(简称:\p{Scx=Elba})(40)
\p{Script_Extensions: Ethi} \p{Script_Extensions=埃塞俄比亚} (495)
\p{Script_Extensions:埃塞俄比亚语}(简称:\p{Scx=Ethi})(495)
\p{Script_Extensions: 乔治亚语} \p{Script_Extensions=格鲁吉亚语} (128)
\p{Script_Extensions:格鲁吉亚语}(简称:\p{Scx=Geor})(128)
\p{Script_Extensions:格拉格} \p{Script_Extensions=格拉哥里} (94)
\p{Script_Extensions: Glagolitic}(简称:\p{Scx=Glag})(94)
\p{Script_Extensions: 哥特} \p{Script_Extensions=哥特} (27)
\p{Script_Extensions: Gothic}(简称:\p{Scx=Goth})(27)
\p{Script_Extensions: Gran} \p{Script_Extensions=Grantha} (85)
\p{Script_Extensions:Grantha}(简称:\p{Scx=Gran})(85)
\p{Script_Extensions:希腊语}(简称:\p{Scx=Grek})(520)
\p{Script_Extensions: 希腊语} \p{Script_Extensions=希腊语} (520)
\p{Script_Extensions:古吉拉特语}(简称:\p{Scx=Gujr})(96)
\p{Script_Extensions: Gujr} \p{Script_Extensions=古吉拉特语} (96)
\p{Script_Extensions: Gurmukhi}(简称:\p{Scx=Guru})(91)
\p{Script_Extensions:大师} \p{Script_Extensions=Gurmukhi} (91)
\p{Script_Extensions: Han}(简称:\p{Scx=Han})(76_218)
\p{Script_Extensions:挂起} \p{Script_Extensions=Hangul} (11_971)
\p{Script_Extensions: Hangul}(简称:\p{Scx=Hang})(11_971)
\p{Script_Extensions: 哈尼语} \p{Script_Extensions=Han} (76_218)
\p{Script_Extensions: Hano} \p{Script_Extensions=Hanunoo} (23)
\p{Script_Extensions: Hanunoo} (短: \p{Scx=Hano}) (23)
\p{Script_Extensions: 希伯来语} \p{Script_Extensions=希伯来语} (133)
\p{Script_Extensions:希伯来语}(简称:\p{Scx=Hebr})(133)
\p{Script_Extensions: Hira} \p{Script_Extensions=平假名} (356)
\p{Script_Extensions:平假名}(简称:\p{Scx=Hira})(356)
\p{Script_Extensions: Hmng} \p{Script_Extensions=Pahawh_Hmong}
(127)
\p{Script_Extensions: Imperial_Aramaic}(简称:\p{Scx=Armi})(31)
\p{Script_Extensions: Inherited}(简称:\p{Scx=Zinh})(496)
\p{Script_Extensions: Inscriptional_Pahlavi}(简称:\p{Scx=Phli})
(27)
\p{Script_Extensions: Inscriptional_Parthian}(简称:\p{Scx=
优先级}) (30)
\p{Script_Extensions: 斜体} \p{Script_Extensions=Old_Italic} (36)
\p{Script_Extensions: Java} \p{Script_Extensions=Javanese} (91)
\p{Script_Extensions:Javanese}(简称:\p{Scx=Java})(91)
\p{Script_Extensions: Kaithi}(简称:\p{Scx=Kthi})(86)
\p{Script_Extensions: Kali} \p{Script_Extensions=Kayah_Li} (48)
\p{Script_Extensions: 假名} \p{Script_Extensions=片假名} (565)
\p{Script_Extensions:卡纳达语}(简称:\p{Scx=Knda})(89)
\p{Script_Extensions:片假名}(简称:\p{Scx=Kana})(565)
\p{Script_Extensions: Kayah_Li}(简称:\p{Scx=Kali})(48)
\p{Script_Extensions: Khar} \p{Script_Extensions=Kharoshthi} (65)
\p{Script_Extensions: Kharoshthi}(简称:\p{Scx=Khar})(65)
\p{Script_Extensions: Khmer}(简称:\p{Scx=Khmr})(146)
\p{Script_Extensions: 高棉语} \p{Script_Extensions=高棉语} (146)
\p{Script_Extensions: 霍伊} \p{Script_Extensions=Khojki} (71)
\p{Script_Extensions: Khojki}(简称:\p{Scx=Khoj})(71)
\p{Script_Extensions: Khudawadi}(简称:\p{Scx=Sind})(81)
\p{Script_Extensions: Knda} \p{Script_Extensions=卡纳达语} (89)
\p{Script_Extensions: Kthi} \p{Script_Extensions=Kaithi} (86)
\p{Script_Extensions: 拉娜} \p{Script_Extensions=Tai_Tham} (127)
\p{Script_Extensions:Lao}(简称:\p{Scx=Lao})(67)
\p{Script_Extensions:Lao} \p{Script_Extensions=Lao} (67)
\p{Script_Extensions:拉丁语}(简称:\p{Scx=Latn})(1356)
\p{Script_Extensions: 拉丁语} \p{Script_Extensions=拉丁语} (1356)
\p{Script_Extensions: Lepc} \p{Script_Extensions=Lepcha} (74)
\p{Script_Extensions: Lepcha}(简称:\p{Scx=Lepc})(74)
\p{Script_Extensions: 肢体} \p{Script_Extensions=林布} (69)
\p{Script_Extensions: Limbu}(简称:\p{Scx=Limb})(69)
\p{Script_Extensions:莉娜} \p{Script_Extensions=Linear_A} (341)
\p{Script_Extensions:Linb} \p{Script_Extensions=Linear_B} (268)
\p{Script_Extensions:Linear_A}(简称:\p{Scx=Lina})(341)
\p{Script_Extensions:Linear_B}(简称:\p{Scx=Linb})(268)
\p{Script_Extensions: Lisu} (短: \p{Scx=Lisu}) (48)
\p{Script_Extensions: Lyci} \p{Script_Extensions=Lycian} (29)
\p{Script_Extensions: Lycian}(简称:\p{Scx=Lyci})(29)
\p{Script_Extensions: Lydi} \p{Script_Extensions=Lydian} (27)
\p{Script_Extensions: Lydian}(简称:\p{Scx=Lydi})(27)
\p{Script_Extensions: Mahajani}(简称:\p{Scx=Mahj})(61)
\p{Script_Extensions: Mahj} \p{Script_Extensions=Mahajani} (61)
\p{Script_Extensions:马拉雅拉姆语}(简称:\p{Scx=Mlym})(101)
\p{Script_Extensions: 强制} \p{Script_Extensions=Mandaic} (30)
\p{Script_Extensions: Mandaic}(简称:\p{Scx=Mand})(30)
\p{Script_Extensions:摩尼} \p{Script_Extensions=摩尼教} (52)
\p{Script_Extensions: Manichaean}(简称:\p{Scx=Mani})(52)
\p{Script_Extensions: Meetei_Mayek}(简称:\p{Scx=Mtei})(79)
\p{Script_Extensions:修补} \p{Script_Extensions=Mende_Kikakui}
(213)
\p{Script_Extensions: Mende_Kikakui}(简称:\p{Scx=Mend})(213)
\p{Script_Extensions: Merc} \p{Script_Extensions=Meroitic_Cursive}
(26)
\p{Script_Extensions: 梅罗} \p{Script_Extensions=
Meroitic_象形文字} (32)
\p{Script_Extensions: Meroitic_Cursive}(简称:\p{Scx=Merc})(26)
\p{Script_Extensions: Meroitic_Hieroglyphs}(简称:\p{Scx=Mero})
(32)
\p{Script_Extensions: Miao} (短: \p{Scx=Miao}) (133)
\p{Script_Extensions: Mlym} \p{Script_Extensions=马拉雅拉姆语} (101)
\p{Script_Extensions: Modi}(简称:\p{Scx=Modi})(89)
\p{Script_Extensions: Mong} \p{Script_Extensions=蒙古语} (156)
\p{Script_Extensions:蒙古语}(简称:\p{Scx=Mong})(156)
\p{Script_Extensions: Mro}(简称:\p{Scx=Mro})(43)
\p{Script_Extensions: Mroo} \p{Script_Extensions=Mro} (43)
\p{Script_Extensions:Mtei} \p{Script_Extensions=Meetei_Mayek} (79)
\p{Script_Extensions:缅甸}(简称:\p{Scx=Mymr})(224)
\p{Script_Extensions: Mymr} \p{Script_Extensions=缅甸} (224)
\p{Script_Extensions: Nabataean}(简称:\p{Scx=Nbat})(40)
\p{Script_Extensions: Narb} \p{Script_Extensions=
老北阿拉伯} (32)
\p{Script_Extensions: Nbat} \p{Script_Extensions=Nabataean} (40)
\p{Script_Extensions: New_Tai_Lue}(简称:\p{Scx=Talu})(83)
\p{Script_Extensions: Nko}(简称:\p{Scx=Nko})(59)
\p{Script_Extensions: Nkoo} \p{Script_Extensions=Nko} (59)
\p{Script_Extensions: Ogam} \p{Script_Extensions=Ogam} (29)
\p{Script_Extensions: Ogham}(简称:\p{Scx=Ogam})(29)
\p{Script_Extensions:Ol_Chiki}(简称:\p{Scx=Olck})(48)
\p{Script_Extensions: Olck} \p{Script_Extensions=Ol_Chiki} (48)
\p{Script_Extensions: Old_Italic} (短: \p{Scx=Ital}) (36)
\p{Script_Extensions: Old_North_Arabian}(简称:\p{Scx=Narb})(32)
\p{Script_Extensions: Old_Permic}(简称:\p{Scx=Perm})(43)
\p{Script_Extensions: Old_Persian}(简称:\p{Scx=Xpeo})(50)
\p{Script_Extensions: Old_South_Arabian}(简称:\p{Scx=Sarb})(32)
\p{Script_Extensions: Old_Turkic}(简称:\p{Scx=Orkh})(73)
\p{Script_Extensions: Oriya}(简称:\p{Scx=Orya})(92)
\p{Script_Extensions: Orkh} \p{Script_Extensions=Old_Turkic} (73)
\p{Script_Extensions:奥里亚语} \p{Script_Extensions=奥里亚语} (92)
\p{Script_Extensions:奥斯玛} \p{Script_Extensions=Osmanya} (40)
\p{Script_Extensions: Osmanya}(简称:\p{Scx=Osma})(40)
\p{Script_Extensions: Pahawh_Hmong}(简称:\p{Scx=Hmng})(127)
\p{Script_Extensions:棕榈} \p{Script_Extensions=棕榈} (32)
\p{Script_Extensions: Palmyrene}(简称:\p{Scx=Palm})(32)
\p{Script_Extensions: Pau_Cin_Hau}(简称:\p{Scx=Pauc})(57)
\p{Script_Extensions: Pauc} \p{Script_Extensions=Pau_Cin_Hau} (57)
\p{Script_Extensions: Perm} \p{Script_Extensions=Old_Permic} (43)
\p{Script_Extensions: Phag} \p{Script_Extensions=Phags_Pa} (59)
\p{Script_Extensions: Phags_Pa}(简称:\p{Scx=Phag})(59)
\p{Script_Extensions: Phli} \p{Script_Extensions=
铭文_巴列维} (27)
\p{Script_Extensions: Phlp} \p{Script_Extensions=Psalter_Pahlavi}
(30)
\p{Script_Extensions: Phnx} \p{Script_Extensions=腓尼基} (29)
\p{Script_Extensions: Phoenician}(简称:\p{Scx=Phnx})(29)
\p{Script_Extensions: Plrd} \p{Script_Extensions=Miao} (133)
\p{Script_Extensions: Prti} \p{Script_Extensions=
铭文_帕提亚} (30)
\p{Script_Extensions: Psalter_Pahlavi}(简称:\p{Scx=Phlp})(30)
\p{Script_Extensions:Qaac} \p{Script_Extensions=科普特} (165)
\p{Script_Extensions:Qaai} \p{Script_Extensions=继承} (496)
\p{Script_Extensions: Rejang}(简称:\p{Scx=Rjng})(37)
\p{Script_Extensions: Rjng} \p{Script_Extensions=Rejang} (37)
\p{Script_Extensions: Runic}(简称:\p{Scx=Runr})(86)
\p{Script_Extensions: Runr} \p{Script_Extensions=Runic} (86)
\p{Script_Extensions: Samaritan}(简称:\p{Scx=Samr})(61)
\p{Script_Extensions: Samr} \p{Script_Extensions=撒玛利亚人} (61)
\p{Script_Extensions: Sarb} \p{Script_Extensions=
古南阿拉伯} (32)
\p{Script_Extensions: Saur} \p{Script_Extensions=Saurashtra} (81)
\p{Script_Extensions:Saurashtra}(简称:\p{Scx=Saur})(81)
\p{Script_Extensions: Sharada}(简称:\p{Scx=Shrd})(85)
\p{Script_Extensions: Shavian}(简称:\p{Scx=Shaw})(48)
\p{Script_Extensions: Shaw} \p{Script_Extensions=Shavian} (48)
\p{Script_Extensions: Shrd} \p{Script_Extensions=Sharada} (85)
\p{Script_Extensions: Sidd} \p{Script_Extensions=Siddham} (72)
\p{Script_Extensions: Siddham}(简称:\p{Scx=Sidd})(72)
\p{Script_Extensions:信德} \p{Script_Extensions=Khudawadi} (81)
\p{Script_Extensions: Sinh} \p{Script_Extensions=僧伽罗语} (112)
\p{Script_Extensions:僧伽罗语}(简称:\p{Scx=Sinh})(112)
\p{Script_Extensions:Sora} \p{Script_Extensions=Sora_Sompeng} (35)
\p{Script_Extensions:Sora_Sompeng}(简称:\p{Scx=Sora})(35)
\p{Script_Extensions: Sundanese} \p{Script_Extensions=Sundanese} (72)
\p{Script_Extensions: Sundanese}(简称:\p{Scx=Sund})(72)
\p{Script_Extensions: Sylo} \p{Script_Extensions=Syloti_Nagri} (56)
\p{Script_Extensions:Syloti_Nagri}(简称:\p{Scx=Sylo})(56)
\p{Script_Extensions: Syrc} \p{Script_Extensions=叙利亚语} (93)
\p{Script_Extensions: 叙利亚语}(简称:\p{Scx=Syrc})(93)
\p{Script_Extensions:他加禄语}(简称:\p{Scx=Tglg})(22)
\p{Script_Extensions: Tagb} \p{Script_Extensions=Tagbanwa} (20)
\p{Script_Extensions: Tagbanwa}(简称:\p{Scx=Tagb})(20)
\p{Script_Extensions: Tai_Le}(简称:\p{Scx=Tale})(45)
\p{Script_Extensions:Tai_Tham}(简称:\p{Scx=Lana})(127)
\p{Script_Extensions: Tai_Viet}(简称:\p{Scx=Tavt})(72)
\p{Script_Extensions: Takr} \p{Script_Extensions=Takri} (78)
\p{Script_Extensions: Takri}(简称:\p{Scx=Takr})(78)
\p{Script_Extensions: 故事} \p{Script_Extensions=Tai_Le} (45)
\p{Script_Extensions: Talu} \p{Script_Extensions=New_Tai_Lue} (83)
\p{Script_Extensions:泰米尔语}(简称:\p{Scx=Taml})(74)
\p{Script_Extensions: 泰米尔语} \p{Script_Extensions=泰米尔语} (74)
\p{Script_Extensions: Tavt} \p{Script_Extensions=Tai_Viet} (72)
\p{Script_Extensions: 泰卢语} \p{Script_Extensions=泰卢固语} (97)
\p{Script_Extensions:泰卢固语}(简称:\p{Scx=Telu})(97)
\p{Script_Extensions: Tfng} \p{Script_Extensions=Tifinagh} (59)
\p{Script_Extensions: Tglg} \p{Script_Extensions=他加禄语} (22)
\p{Script_Extensions: Thaa} \p{Script_Extensions=Thaana} (65)
\p{Script_Extensions: Thaana}(简称:\p{Scx=Thaa})(65)
\p{Script_Extensions: Thai}(短:\p{Scx=Thai})(86)
\p{Script_Extensions:藏语}(简称:\p{Scx=Tibt})(207)
\p{Script_Extensions: Tibt} \p{Script_Extensions=藏文} (207)
\p{Script_Extensions:Tifinagh}(简称:\p{Scx=Tfng})(59)
\p{Script_Extensions: Tirh} \p{Script_Extensions=Tirhuta} (94)
\p{Script_Extensions: Tirhuta}(简称:\p{Scx=Tirh})(94)
\p{Script_Extensions: 乌加尔} \p{Script_Extensions=乌加里特} (31)
\p{Script_Extensions: Ugaritic}(简称:\p{Scx=Ugar})(31)
\p{Script_Extensions:未知}(简称:\p{Scx=Zzzz})(1_001_091
加上以上所有的 Unicode 代码点)
\p{Script_Extensions: Vai}(简称:\p{Scx=Vai})(300)
\p{Script_Extensions: Vai} \p{Script_Extensions=Vai} (300)
\p{Script_Extensions: Wara} \p{Script_Extensions=Warang_Citi} (84)
\p{Script_Extensions: Warang_Citi}(简称:\p{Scx=Wara})(84)
\p{Script_Extensions: Xpeo} \p{Script_Extensions=Old_Persian} (50)
\p{Script_Extensions: Xsux} \p{Script_Extensions=楔形文字} (1037)
\p{Script_Extensions: Yi}(简称:\p{Scx=Yi})(1246)
\p{Script_Extensions:Yiii} \p{Script_Extensions=Yi} (1246)
\p{Script_Extensions:Zinh} \p{Script_Extensions=继承} (496)
\p{Script_Extensions: Zyyy} \p{Script_Extensions=Common} (6741)
\p{Script_Extensions: Zzzz} \p{Script_Extensions=未知}
(1_001_091 加上以上所有的 Unicode 代码
点)
\p{Scx: *} \p{Script_Extensions: *}
\p{SD} \p{软点} (= \p{软点=Y}) (46)
\p{标清:*} \p{软点:*}
\p{Sentence_Break: AT} \p{Sentence_Break=ATErm} (4)
\p{Sentence_Break: ATerm}(简称:\p{SB=AT})(4)
\p{Sentence_Break: CL} \p{Sentence_Break=关闭} (187)
\p{Sentence_Break:关闭}(短:\p{SB=CL})(187)
\p{Sentence_Break: CR} (短: \p{SB=CR}) (1)
\p{Sentence_Break: EX} \p{Sentence_Break=扩展} (1834)
\p{Sentence_Break: Extend} (短: \p{SB=EX}) (1834)
\p{Sentence_Break: FO} \p{Sentence_Break=格式} (148)
\p{Sentence_Break:格式}(短:\p{SB=FO})(148)
\p{Sentence_Break: LE} \p{Sentence_Break=OLetter} (99_420)
\p{Sentence_Break: LF} (短: \p{SB=LF}) (1)
\p{Sentence_Break:LO} \p{Sentence_Break=较低} (2029)
\p{Sentence_Break: Lower} (短: \p{SB=LO}) (2029)
\p{Sentence_Break: NU} \p{Sentence_Break=数字} (532)
\p{Sentence_Break:数字}(短:\p{SB=NU})(532)
\p{Sentence_Break: OLetter} (短: \p{SB=LE}) (99_420)
\p{Sentence_Break: Other} (短: \p{SB=XX}) (1_008_170 plus all
Unicode 代码点以上)
\p{Sentence_Break: SC} \p{Sentence_Break=SContinue} (26)
\p{Sentence_Break: SContinue} (短: \p{SB=SC}) (26)
\p{Sentence_Break: SE} \p{Sentence_Break=Sep} (3)
\p{Sentence_Break:Sep}(短:\p{SB=SE})(3)
\p{Sentence_Break: Sp} (短: \p{SB=Sp}) (20)
\p{Sentence_Break: ST} \p{Sentence_Break=STerm} (96)
\p{Sentence_Break: STerm} (短: \p{SB=ST}) (96)
\p{Sentence_Break: 上} \p{Sentence_Break=上} (1641)
\p{Sentence_Break: Upper} (短: \p{SB=UP}) (1641)
\p{Sentence_Break: XX} \p{Sentence_Break=Other} (1_008_170 加
以上所有 - Unicode 代码点)
\p{分隔符} \p{General_Category=分隔符}(短:
\p{Z}) (19)
\p{Sharada} \p{Script=Sharada}(简称:\p{Shrd};不是
\p{块=沙拉达}) (85)
\p{Shavian} \p{Script=Shavian}(简称:\p{Shaw})(48)
\p{Shaw} \p{Shavian} (= \p{脚本=Shavian}) (48)
X \p{Shorthand_Format_Controls} \p{块=Shorthand_Format_Controls}
(16)
\p{Shrd} \p{Sharada} (= \p{Script=Sharada}) (不是
\p{块=沙拉达}) (85)
\p{Sidd} \p{Siddham} (= \p{Script=Siddham}) (不是
\p{块=悉达}) (72)
\p{Siddham} \p{Script=Siddham}(简称:\p{Sidd};不是
\p{块=悉达}) (72)
\p{信德} \p{Khudawadi} (= \p{Script=Khudawadi})
(不是 \p{Block=Khudawadi})(69)
\p{Sinh} \p{僧伽罗语}(= \p{Script=僧伽罗语})(不是
\p{块=僧伽罗语}) (110)
\p{僧伽罗语} \p{Script=僧伽罗语}(简称:\p{Sinh};不是
\p{块=僧伽罗语}) (110)
X \p{Sinhala_Archaic_Numbers} \p{块=Sinhala_Archaic_Numbers} (32)
\p{Sk} \p{Modifier_Symbol} (=
\p{General_Category=Modifier_Symbol})
(116)
\p{Sm} \p{数学符号} (= \p{General_Category=
数学符号}) (948)
X \p{Small_Form_Variants} \p{Block=Small_Form_Variants}(短:
\p{小形式}) (32)
X \p{Small_Forms} \p{Small_Form_Variants} (= \p{块=
Small_Form_Variants}) (32)
\p{所以} \p{Other_Symbol} (= \p{General_Category=
其他_符号}) (5082)
\p{Soft_Dotted} \p{Soft_Dotted=Y}(简称:\p{SD})(46)
\p{Soft_Dotted: N*} (短: \p{SD=N}, \P{SD}) (1_114_066 plus
以上所有 - Unicode 代码点)
\p{软点:Y*}(短:\p{SD=Y},\p{SD})(46)
\p{Sora} \p{Sora_Sompeng} (= \p{脚本=
Sora_Sompeng}) (不是 \p{Block=
Sora_Sompeng}) (35)
\p{Sora_Sompeng} \p{Script=Sora_Sompeng}(简称:\p{Sora};
不是 \p{Block=Sora_Sompeng}) (35)
\p{空格} \p{White_Space} (= \p{White_Space=Y}) (25)
\p{空格:*} \p{白色空格:*}
\p{Space_Separator} \p{General_Category=Space_Separator}
(简称:\p{Zs})(17)
\p{SpacePerl} \p{XPosixSpace} (25)
\p{Spacing_Mark} \p{General_Category=Spacing_Mark}(短:
\p{麦克}) (399)
X \p{Spacing_Modifier_Letters} \p{块=Spacing_Modifier_Letters}
(简称:\p{InModifierLetters})(80)
X \p{特价} \p{块=特价} (16)
\p{STerm} \p{STerm=Y} (99)
\p{STerm: N*}(单个:\P{STerm})(1_114_013 加上所有
Unicode 代码点以上)
\p{STerm:Y*}(单:\p{STerm})(99)
\p{周日} \p{巽他语} (= \p{脚本=巽他语})
(不是 \p{Block=Sundanese})(72)
\p{Sundanese} \p{Script=Sundanese}(简称:\p{Sund};不是
\p{块=巽他}) (72)
X \p{Sundanese_Sup} \p{Sundanese_Supplement} (= \p{Block=
巽他语_补充}) (16)
X \p{Sundanese_Supplement} \p{Block=Sundanese_Supplement}(短:
\p{InSundaneseSup}) (16)
X \p{Sup_Arrows_A} \p{Suplemental_Arrows_A} (= \p{块=
补充箭头_A}) (16)
X \p{Sup_Arrows_B} \p{Suplemental_Arrows_B} (= \p{块=
补充箭头_B}) (128)
X \p{Sup_Arrows_C} \p{Suplemental_Arrows_C} (= \p{块=
补充箭头_C}) (256)
X \p{Sup_Math_Operators} \p{Suplemental_Mathematical_Operators} (=
\p{块=
Supplemental_Mathematical_Operators})
(256)
X \p{Sup_PUA_A} \p{Supplementary_Private_Use_Area_A} (=
\p{块=
Supplementary_Private_Use_Area_A})
(65_536)
X \p{Sup_PUA_B} \p{Supplementary_Private_Use_Area_B} (=
\p{块=
补充_私人_使用_区域_B})
(65_536)
X \p{Sup_Punctuation} \p{Suplemental_Punctuation} (= \p{块=
补充_标点符号}) (128)
X \p{Super_And_Sub} \p{上标_And_下标} (=
\p{块=上标_和_下标})
(48)
X \p{上标_和_下标} \p{块=
Superscripts_And_Subscripts}(短:
\p{InSuperAndSub}) (48)
X \p{Supplemental_Arrows_A} \p{Block=Supplemental_Arrows_A}(短:
\p{InSupArrowsA}) (16)
X \p{Supplemental_Arrows_B} \p{Block=Supplemental_Arrows_B}(短:
\p{InSupArrowsB}) (128)
X \p{Supplemental_Arrows_C} \p{Block=Supplemental_Arrows_C}(短:
\p{InSupArrowsC}) (256)
X \p{补充数学运算符} \p{块=
补充数学运算符}
(简称:\p{InSupMathOperators})(256)
X \p{补充标点} \p{块=补充标点}
(简称:\p{InSupPunctuation})(128)
X \p{Supplementary_Private_Use_Area_A} \p{块=
补充_私人_使用_区域_A}
(简称:\p{InSupPUAA})(65_536)
X \p{Supplementary_Private_Use_Area_B} \p{块=
补充_私人_使用_区域_B}
(简称:\p{InSupPUAB})(65_536)
\p{Surrogate} \p{General_Category=Surrogate}(短:
\p{Cs}) (2048)
\p{Sylo} \p{Syloti_Nagri} (= \p{脚本=
Syloti_Nagri}) (不是 \p{Block=
Syloti_Nagri}) (44)
\p{Syloti_Nagri} \p{Script=Syloti_Nagri}(简称:\p{Sylo};
不是 \p{Block=Syloti_Nagri}) (44)
\p{符号} \p{General_Category=符号}(简称:\p{S})
(6198)
\p{Syrc} \p{Syriac} (= \p{Script=Syriac}) (不是
\p{块=叙利亚}) (77)
\p{Syriac} \p{Script=Syriac}(简称:\p{Syrc};不是
\p{块=叙利亚}) (77)
\p{他加禄语} \p{Script=他加禄语}(简称:\p{Tglg};不是
\p{块=他加禄语}) (20)
\p{Tagb} \p{Tagbanwa} (= \p{Script=Tagbanwa}) (不是
\p{块=Tagbanwa}) (18)
\p{Tagbanwa} \p{Script=Tagbanwa}(简称:\p{Tagb};不是
\p{块=Tagbanwa}) (18)
X \p{标签} \p{块=标签} (128)
\p{Tai_Le} \p{Script=Tai_Le}(简称:\p{Tale};不是
\p{块=Tai_Le}) (35)
\p{Tai_Tham} \p{Script=Tai_Tham}(简称:\p{Lana};不是
\p{块=Tai_Tham}) (127)
\p{Tai_Viet} \p{Script=Tai_Viet}(简称:\p{Tavt};不是
\p{块=Tai_Viet}) (72)
X \p{太玄经} \p{太玄经符号} (= \p{块=
太玄经符}) (96)
X \p{Tai_Xuan_Jing_Symbols} \p{Block=Tai_Xuan_Jing_Symbols}(简称:
\p{In太玄境}) (96)
\p{Takr} \p{Takri} (= \p{Script=Takri}) (不是
\p{方块=塔克里}) (66)
\p{Takri} \p{Script=Takri}(简称:\p{Takr};不是
\p{方块=塔克里}) (66)
\p{故事} \p{Tai_Le} (= \p{Script=Tai_Le}) (NOT
\p{块=Tai_Le}) (35)
\p{Talu} \p{New_Tai_Lue} (= \p{Script=New_Tai_Lue})
(不是 \p{Block=New_Tai_Lue})(83)
\p{泰米尔语} \p{Script=泰米尔语}(简称:\p{泰米尔语};不是
\p{块=泰米尔语}) (72)
\p{泰米尔语} \p{泰米尔语} (= \p{脚本=泰米尔语}) (不是
\p{块=泰米尔语}) (72)
\p{Tavt} \p{Tai_Viet} (= \p{Script=Tai_Viet}) (不是
\p{块=Tai_Viet}) (72)
\p{泰卢语} \p{泰卢固语} (= \p{脚本=泰卢固语}) (不是
\p{块=泰卢固语}) (95)
\p{泰卢固语} \p{Script=泰卢固语}(简称:\p{泰卢固语};不是
\p{块=泰卢固语}) (95)
\p{术语} \p{终端标点} (=
\p{Terminal_Punctuation=Y}) (214)
\p{术语:*} \p{终端标点符号:*}
\p{Terminal_Punctuation} \p{Terminal_Punctuation=Y}(短:
\p{术语}) (214)
\p{Terminal_Punctuation:N*}(简称:\p{Term=N},\P{Term})
(1_113_898 加上以上所有的 Unicode 代码
点)
\p{Terminal_Punctuation:Y*}(简称:\p{Term=Y},\p{Term})(214)
\p{Tfng} \p{Tifinagh} (= \p{Script=Tifinagh}) (不是
\p{块=蒂菲纳}) (59)
\p{Tglg} \p{他加禄语} (= \p{Script=他加禄语}) (不是
\p{块=他加禄语}) (20)
\p{Thaa} \p{Thaana} (= \p{Script=Thaana}) (不是
\p{块=萨纳}) (50)
\p{Thaana} \p{Script=Thaana}(简称:\p{Thaa};不是
\p{块=萨纳}) (50)
\p{泰语} \p{脚本=泰语}(不是 \p{块=泰语})(86)
\p{藏文} \p{Script=藏文}(简称:\p{藏文};不是
\p{方块=藏语}) (207)
\p{藏文} \p{藏文} (= \p{Script=藏文}) (不是
\p{方块=藏语}) (207)
\p{Tifinagh} \p{Script=Tifinagh}(简称:\p{Tfng};不是
\p{块=蒂菲纳}) (59)
\p{Tirh} \p{Tirhuta} (= \p{Script=Tirhuta}) (不是
\p{块=Tirhuta}) (82)
\p{Tirhuta} \p{Script=Tirhuta}(简称:\p{Tirh};不是
\p{块=Tirhuta}) (82)
\p{标题} \p{标题大小写} (/i= 大小写=是) (31)
\p{Titlecase} (= \p{Gc=Lt}) (简称:\p{Title}; /i=
装箱=是)(31)
\p{Titlecase_Letter} \p{General_Category=Titlecase_Letter}
(简称:\p{Lt};/i= General_Category=
Cased_Letter)(31 年)
X \p{Transport_And_Map} \p{Transport_And_Map_Symbols} (= \p{块=
交通和地图符号}) (128)
X \p{Transport_And_Map_Symbols} \p{块=Transport_And_Map_Symbols}
(简称:\p{InTransportAndMap})(128)
X \p{UCAS} \p{Unified_Canadian_Aboriginal_Syllabics}
(= \p{块=
统一加拿大原住民音节})
(640)
X \p{UCAS_Ext} \p{Unified_Canadian_Aboriginal_Syllabics_-
扩展} (= \p{块=
统一_加拿大_原住民_音节_-
扩展}) (80)
\p{Ugar} \p{Ugaritic} (= \p{Script=Ugaritic}) (不是
\p{块=乌加里特}) (31)
\p{Ugaritic} \p{Script=Ugaritic}(简称:\p{Ugar};不是
\p{块=乌加里特}) (31)
\p{UIdeo} \p{Unified_Ideograph} (=
\p{Unified_Ideograph=Y}) (74_617)
\p{UIdeo: *} \p{Unified_Ideograph: *}
\p{未分配} \p{General_Category=未分配}(短:
\p{Cn}) (861_575 加上以上所有-Unicode
码点)
\p{Unicode} \p{任何} (1_114_112)
X \p{Unified_Canadian_Aboriginal_Syllabics} \p{块=
统一加拿大原住民音节}
(简称:\p{InUCAS})(640)
X \p{Unified_Canadian_Aboriginal_Syllabics_Extended} \p{块=
统一_加拿大_原住民_音节_-
扩展}(短:\p{InUCASExt})(80)
\p{Unified_Ideograph} \p{Unified_Ideograph=Y}(简称:\p{UIdeo})
(74_617)
\p{Unified_Ideograph:N*}(简称:\p{UIdeo=N},\P{UIdeo})
(1_039_495 加上以上所有的 Unicode 代码
点)
\p{Unified_Ideograph:Y*}(简称:\p{UIdeo=Y},\p{UIdeo})(74_617)
\p{未知} \p{脚本=未知}(简称:\p{Zzzz})
(1_001_091 加上以上所有的 Unicode 代码
点)
\p{大写} \p{XPosixUpper} (= \p{大写=Y}) (/i=
装箱=是)(1610)
\p{大写:*} \p{大写:*}
\p{大写} \p{XPosixUpper} (= \p{大写=Y}) (/i=
装箱=是)(1610)
\p{大写:N*}(短:\p{Upper=N},\P{Upper};/i= Cased=
否)(1_112_502 加上以上所有 - Unicode
码点)
\p{大写:Y*}(短:\p{Upper=Y},\p{Upper};/i= Cased=
是)(1610 年)
\p{大写字母} \p{General_Category=大写字母}
(简称:\p{Lu}; /i= General_Category=
Cased_Letter)(1490 年)
\p{Vai} \p{Script=Vai}(不是 \p{Block=Vai})(300)
\p{Vaii} \p{Vai} (= \p{Script=Vai}) (不是 \p{Block=
维}) (300)
\p{Variation_Selector} \p{Variation_Selector=Y}(简称:\p{VS};
不是 \p{Variation_Selectors}) (259)
\p{Variation_Selector: N*} (短: \p{VS=N}, \P{VS}) (1_113_853
加上以上所有的 Unicode 代码点)
\p{Variation_Selector: Y*}(简称:\p{VS=Y}, \p{VS})(259)
X \p{Variation_Selectors} \p{Block=Variation_Selectors}(短:
\p{InVS}) (16)
X \p{Variation_Selectors_Supplement} \p{块=
Variation_Selectors_Supplement}(短:
\p{InVSSup}) (240)
X \p{吠陀扩展} \p{吠陀扩展}(= \p{块=
吠陀扩展}) (48)
X \p{吠陀扩展} \p{块=吠陀扩展}(短:
\p{InVedicExt}) (48)
X \p{垂直_形式} \p{块=垂直_形式} (16)
\p{垂直空间} \v (7)
\p{VS} \p{Variation_Selector} (=
\p{Variation_Selector=Y}) (不是
\p{变体选择器}) (259)
\p{VS: *} \p{Variation_Selector: *}
X \p{VS_Sup} \p{Variation_Selectors_Supplement} (=
\p{块=
变体_选择器_补充}) (240)
\p{Wara} \p{Warang_Citi} (= \p{Script=Warang_Citi})
(不是 \p{Block=Warang_Citi})(84)
\p{Warang_Citi} \p{Script=Warang_Citi}(简称:\p{Wara};
不是 \p{Block=Warang_Citi}) (84)
\p{WB: *} \p{Word_Break: *}
\p{White_Space} \p{White_Space=Y}(简称:\p{Space})(25)
\p{White_Space: N*} (短: \p{Space=N}, \P{Space}) (1_114_087
加上以上所有的 Unicode 代码点)
\p{White_Space: Y*} (短: \p{Space=Y}, \p{Space}) (25)
\p{字} \p{XPosixWord} (105_473)
\p{Word_Break: ALetter}(简称:\p{WB=LE})(26_647)
\p{Word_Break: CR}(简称:\p{WB=CR})(1)
\p{Word_Break: Double_Quote}(简称:\p{WB=DQ})(1)
\p{Word_Break: DQ} \p{Word_Break=Double_Quote} (1)
\p{Word_Break: EX} \p{Word_Break=ExtendNumLet} (10)
\p{Word_Break: Extend}(短:\p{WB=Extend})(1834)
\p{Word_Break: ExtendNumLet} (短: \p{WB=EX}) (10)
\p{Word_Break: FO} \p{Word_Break=格式} (147)
\p{Word_Break:格式}(短:\p{WB=FO})(147)
\p{Word_Break:Hebrew_Letter}(简称:\p{WB=HL})(74)
\p{Word_Break: HL} \p{Word_Break=Hebrew_Letter} (74)
\p{Word_Break: KA} \p{Word_Break=片假名} (310)
\p{Word_Break:片假名}(简称:\p{WB=KA})(310)
\p{Word_Break: LE} \p{Word_Break=ALetter} (26_647)
\p{Word_Break: LF}(简称:\p{WB=LF})(1)
\p{Word_Break: MB} \p{Word_Break=MidNumLet} (7)
\p{Word_Break: MidLetter} (短: \p{WB=ML}) (9)
\p{Word_Break: MidNum} (短: \p{WB=MN}) (15)
\p{Word_Break: MidNumLet} (短: \p{WB=MB}) (7)
\p{Word_Break: ML} \p{Word_Break=MidLetter} (9)
\p{Word_Break: MN} \p{Word_Break=MidNum} (15)
\p{Word_Break:换行符}(短:\p{WB=NL})(5)
\p{Word_Break: NL} \p{Word_Break=换行符} (5)
\p{Word_Break: NU} \p{Word_Break=数字} (531)
\p{Word_Break:数字}(短:\p{WB=NU})(531)
\p{Word_Break: Other} (短: \p{WB=XX}) (1_084_493 plus all
Unicode 代码点以上)
\p{Word_Break:Regional_Indicator}(简称:\p{WB=RI})(26)
\p{Word_Break: RI} \p{Word_Break=Regional_Indicator} (26)
\p{Word_Break: Single_Quote}(简称:\p{WB=SQ})(1)
\p{Word_Break: SQ} \p{Word_Break=Single_Quote} (1)
\p{Word_Break: XX} \p{Word_Break=Other} (1_084_493 加上所有
Unicode 代码点以上)
\p{WSpace} \p{White_Space} (= \p{White_Space=Y}) (25)
\p{WSpace: *} \p{White_Space: *}
\p{XDigit} \p{XPosixXDigit} (= \p{Hex_Digit=Y}) (44)
\p{XID_Continue} \p{XID_Continue=Y}(简称:\p{XIDC})
(105_324)
\p{XID_Continue: N*} (短: \p{XIDC=N}, \P{XIDC}) (1_008_788
加上以上所有的 Unicode 代码点)
\p{XID_Continue: Y*} (短: \p{XIDC=Y}, \p{XIDC}) (105_324)
\p{XID_Start} \p{XID_Start=Y}(短:\p{XIDS})(102_941)
\p{XID_Start: N*} (短: \p{XIDS=N}, \P{XIDS}) (1_011_171
加上以上所有的 Unicode 代码点)
\p{XID_Start: Y*} (短: \p{XIDS=Y}, \p{XIDS}) (102_941)
\p{XIDC} \p{XID_Continue} (= \p{XID_Continue=Y})
(105_324)
\p{XIDC: *} \p{XID_Continue: *}
\p{XIDS} \p{XID_Start} (= \p{XID_Start=Y}) (102_941)
\p{XIDS: *} \p{XID_Start: *}
\p{Xpeo} \p{Old_Persian} (= \p{Script=Old_Persian})
(不是 \p{Block=Old_Persian})(50)
\p{XPerlSpace} \p{XPosixSpace} (25)
\p{XPosixAlnum} 字母和(十进制)数字(短:
\p{铝}) (104_617)
\p{XPosixAlpha} \p{Alphabetic=Y}(简称:\p{Alpha})
(104_077)
\p{XPosixBlank} \h,水平空白(短:
\p{空白}) (18)
\p{XPosixCntrl} \p{General_Category=Control} 控制
字符(短:\p{Cc})(65)
\p{XPosixDigit} \p{General_Category=Decimal_Number} [0-9]
+ 所有其他十进制数字(短:
\p{Nd}) (540)
\p{XPosixGraph} 图形字符(短:
\p{图}) (250_405)
\p{XPosixLower} \p{Lowercase=Y}(简称:\p{Lower}; /i=
装箱=是)(2030)
\p{XPosixPrint} 图形加空格的字符
字符(但没有控件)(短:
\p{打印}) (250_422)
\p{XPosixPunct} \p{Punct} + ASCII 范围 \p{符号} (697)
\p{XPosixSpace} \s 包括超出 ASCII 和垂直制表符
(简称:\p{SpacePerl})(25)
\p{XPosixUpper} \p{Uppercase=Y}(简称:\p{Upper}; /i=
装箱=是)(1610)
\p{XPosixWord} \w,包括ASCII以外; = \p{铝} +
\pM + \p{Pc}(简称:\p{Word})(105_473)
\p{XPosixXDigit} \p{Hex_Digit=Y}(简称:\p{Hex})(44)
\p{Xsux} \p{楔形文字} (= \p{脚本=楔形文字})
(不是 \p{块=楔形文字})(1037)
\p{易} \p{脚本=易} (1220)
X \p{Yi_Radicals} \p{块=Yi_Radicals} (64)
X \p{义_音节} \p{块=义_音节} (1168)
\p{Yiii} \p{Yi} (= \p{脚本=Yi}) (1220)
X \p{易经} \p{易经_Hexagram_Symbols} (= \p{块=
易经_卦_符号}) (64)
X \p{易经_Hexagram_Symbols} \p{块=易经_Hexagram_Symbols}
(简称:\p{InYijing})(64)
\p{Z} \pZ \p{分隔符} (= \p{General_Category=
分隔符}) (19)
\p{Zinh} \p{继承} (= \p{脚本=继承})
(563)
\p{Zl} \p{Line_Separator} (= \p{General_Category=
行_分隔符}) (1)
\p{Zp} \p{段落分隔符} (=
\p{一般_类别=
段落分隔符}) (1)
\p{Zs} \p{空格分隔符} (=
\p{General_Category=Space_Separator})
(17)
\p{Zyyy} \p{常见} (= \p{脚本=常见}) (7129)
\p{Zzzz} \p{未知} (= \p{脚本=未知})
(1_001_091 加上以上所有的 Unicode 代码
点)
TX\p{_CanonDCIJ}(供 Perl 内部使用,不一定
稳定)(= \p{Soft_Dotted=Y})(46)
TX\p{_Case_Ignorable} (供 Perl 内部使用,不一定
稳定)(= \p{Case_Ignorable=Y})(1961)
TX\p{_CombAbove} (供 Perl 内部使用,不一定
稳定)(= \p{Canonical_Combining_Class=
以上}) (399)
法律 “\p{}” 和 "\P{}" 结构体 这 匹配 没有 字符
Unicode 有一些当前不匹配的属性值对。 有时候是这样的
通常要么是因为它们已经过时,要么它们的存在是为了与其他形式对称,
但尚未编码使用它们的语言。 在这个版本的 Unicode 中,
以下匹配零代码点:
\p{Canonical_Combining_Class=Attached_Below_Left}
\p{Canonical_Combining_Class=CCC133}
\p{Grapheme_Cluster_Break=前置}
查看房源 无障碍 通过 统一码::UCD
提到的任何 Unicode(不包括 Perl 扩展)字符属性的值
以上任何单个代码点都可以通过“属性()" 在 Unicode::UCD 中。
"charprops_all()" 在 Unicode::UCD 中返回所有 Unicode 属性的值
给定的代码点。
除此之外,上面提到的所有 Unicode 字符属性(除了那些
标记为供 Perl 内部使用)也可以通过“prop_invlist()“中
Unicode::UCD。
由于其性质,并非所有 Unicode 字符属性都适用于常规
表达式匹配,也不是“prop_invlist()”。 其余非临时、非内部
可以通过“prop_invmap()" 在 Unicode::UCD 中(除了这个 Perl
不包括安装; 见下文)。
为了与 Perl 的其他部分兼容,在
上面的部分被认可。 但是,一些 Perl 之间存在一些歧义
扩展名和 Unicode 属性,所有这些都以静默方式解决,有利于
官方 Unicode 属性。 为避免意外,您应该只使用“prop_invmap()”
下表列出的表格,省略了不推荐的表格。 受影响的表格
是 Unicode 属性的 Perl 单一形式等价物,例如 "\p{sc}" 是
“\p{gc=sc}”的单一形式等价物,被“prop_invmap()”视为“脚本”
属性,简称为“sc”。 该表显示了当前的歧义
INFO 列,以“NOT”开头。
下面列出的标准 Unicode 属性记录在
<http://www.unicode.org/reports/tr44/>; Perl_Decimal_Digit 记录在
"prop_invmap()" 在 Unicode::UCD 中。其他 Perl 扩展在“其他属性”中
perlunicode;
表中的第一列是属性的名称; 第二列是
替代名称(如果有),可能还有一些注释。 替代名称是
属性的全名,除非它只是重复第一列,在这种情况下
第二列表示属性的简称(如果不同)。 注释是
仅在全名条目中给出。 如果某个属性已过时等,该条目将
使用上一节表格中使用的相同字符进行标记,例如 D or S.
姓名信息
年龄
AHex ASCII_Hex_Digit
全部(Perl 扩展)。 所有代码点,
包括那些高于 Unicode 的。 如同
qr/./s
Alnum XPosixAlnum。 (Perl 扩展)
阿尔法字母
字母(简称:Alpha)
任何(Perl 扩展)。 所有 Unicode 代码
点数:[\x{0000}-\x{10FFFF}]
ASCII 块=ASCII。 (Perl 扩展)。
[[:ASCII:]]
ASCII_Hex_Digit(简称:AHex)
已分配(Perl 扩展)。 所有分配的代码点
BC Bidi_Class
Bidi_C Bidi_Control
Bidi_Class(简称:bc)
Bidi_Control(简称:Bidi_C)
Bidi_M Bidi_镜像
Bidi_Mirrored(简称:Bidi_M)
Bidi_Mirroring_Glyph(简称:bmg)
Bidi_Paired_Bracket(简称:bpb)
Bidi_Paired_Bracket_Type(简称:bpt)
空白 Xposix 空白。 (Perl 扩展)
大块
块(简称:blk)
Bmg Bidi_Mirroring_Glyph
Bpb Bidi_Paired_Bracket
Bpt Bidi_Paired_Bracket_Type
Canonical_Combining_Class(简称:ccc)
Case_Folding(简称:cf)
Case_Ignorable(简称:CI)
装箱
类别 General_Category
Ccc Canonical_Combining_Class
CE组合_排除
比照 Case_Folding; 不是'cf'的意思
'General_Category=格式'
Changes_When_Casefolded(简称:CWCF)
Changes_When_Casemapped(简称:CWCM)
Changes_When_Lowercased(简称:CWL)
Changes_When_NFKC_Casefolded(简称:CWKCF)
Changes_When_Titlecased(简称:CWT)
Changes_When_Uppercased(简称:CWU)
CI 案例_可忽略
Cntrl General_Category=XPosixCntrl。 (Perl
延期)
Comp_Ex 完整_组合_排除
Composition_Exclusion(简称:CE)
CWCF 变更_When_Casefolded
CWCM 变更_时间_案例映射
CWKCF 更改_When_NFKC_Casefolded
CWL Changes_When_Lowercased
CWT Changes_When_Titlecased
CWU 更改_When_Uppercased
Dash 达世币
分解_映射(简称:dm)
分解类型(简称:dt)
Default_Ignorable_Code_Point(简称:DI)
弃用
已弃用(简称:Dep)
DI 默认_可忽略_代码_点
变音符号
变音符号(简称:Dia)
数字 General_Category=XPosixDigit。 (Perl
延期)
Dm分解_映射
Dt 分解类型
E East_Asian_Width
East_Asian_Width(简称:ea)
分机扩展器
扩展器(简称:Ext)
Full_Composition_Exclusion(简称:Comp_Ex)
Gc 常规_类别
GCB Grapheme_Cluster_Break
General_Category(简称:gc)
Gr_Base Grapheme_Base
Gr_Ext 字素_扩展
图 XPosixGraph。 (Perl 扩展)
Grapheme_Base(简称:Gr_Base)
Grapheme_Cluster_Break(简称:GCB)
Grapheme_Extend(简称:Gr_Ext)
Hangul_Syllable_Type(简称:hst)
十六进制 Hex_Digit
Hex_Digit(简称:十六进制)
水平空间 Xposix 空白。 (Perl 扩展)
Hst Hangul_Syllable_Type
D 由 Line_Break 属性值补充的连字符;
见 www.unicode.org/reports/tr14
ID_Continue(简称:IDC)
ID_Start(简称:IDS)
IDC ID_继续
象形文字
表意文字(简称:Ideo)
IDS ID_开始
IDS_Binary_Operator(简称:IDSB)
IDS_Trinary_Operator(简称:IDST)
IDSB IDS_Binary_Operator
IDST IDS_Trinary_Operator
在 Present_In。 (Perl 扩展)
Isc ISO_Comment; 不是'isc'的意思
'一般_类别=其他'
ISO_Comment(简称:isc)
Jg加入_群
Join_C Join_Control
Join_Control(简称:Join_C)
Joining_Group(简称:jg)
Joining_Type(简称:jt)
Jt Joining_Type
Lb 换行
Lc 小写_映射; 不是'lc'的意思
'General_Category=Cased_Letter'
Line_Break(简称:lb)
LOE 逻辑顺序异常
Logical_Order_Exception(简称:LOE)
小写字母
小写(简称:Lower)
Lowercase_Mapping(简称:lc)
数学
姓名
Na1 Unicode_1_名称
姓名(简称:na)
名称_别名
NChar 非字符_代码_点
NFC_QC NFC_Quick_Check
NFC_Quick_Check(简称:NFC_QC)
NFD_QC NFD_Quick_Check
NFD_Quick_Check(简称:NFD_QC)
NFKC_Casefold(简称:NFKC_CF)
NFKC_CF NFKC_手提箱
NFKC_QC NFKC_Quick_Check
NFKC_Quick_Check(简称:NFKC_QC)
NFKD_QC NFKD_Quick_Check
NFKD_Quick_Check(简称:NFKD_QC)
Noncharacter_Code_Point(简称:NChar)
Nt 数值类型
Numeric_Type(简称:nt)
Numeric_Value(简称:nv)
Nv 数值
Pat_Syn 模式_语法
Pat_WS 图案_White_Space
Pattern_Syntax(简称:Pat_Syn)
Pattern_White_Space(简称:Pat_WS)
Perl_Decimal_Digit(Perl 扩展)
PerlSpace PosixSpace。 (Perl 扩展)
PerlWord PosixWord。 (Perl 扩展)
PosixAlnum(Perl 扩展)。 [A-Za-z0-9]
PosixAlpha(Perl 扩展)。 [阿-扎-兹]
PosixBlank(Perl 扩展)。 \t 和 ' '
PosixCntrl(Perl 扩展)。 ASCII 控制
字符:NUL、SOH、STX、ETX、EOT、ENQ、
ACK、BEL、BS、HT、LF、VT、FF、CR、SO、SI、
DLE、DC1、DC2、DC3、DC4、NAK、SYN、ETB、
CAN、EOM、SUB、ESC、FS、GS、RS、US 和 DEL
PosixDigit(Perl 扩展)。 [0-9]
PosixGraph(Perl 扩展)。 [-!"#$%&'()*+,./:;<=
>?@[\\]^_`{|}~0-9A-Za-z]
PosixLower(Perl 扩展)。 [阿兹]
PosixPrint(Perl 扩展)。 [- 0-9A-Za-
z!"#$%&'()*+,./:;<=>?@[\\]^_`{|}~]
PosixPunct(Perl 扩展)。 [-!"#$%&'()*+,./:;<=
>?@[\\]^_`{|}~]
PosixSpace(Perl 扩展)。 \t, \n, \cK, \f, \r,
和 ' '。 (\cK 是垂直制表符)
PosixUpper(Perl 扩展)。 [阿兹]
PosixWord(Perl 扩展)。 \w,仅限于 ASCII
= [A-Za-z0-9_]
PosixXDigit(Perl 扩展)。 [0-9A-Fa-f]
Present_In(简称:In)。 (Perl 扩展)
打印 Xposix 打印。 (Perl 扩展)
Punct General_Category=Punct。 (Perl 扩展)
QMark报价_马克
Quotation_Mark(简称:QMark)
激进
SB 断句
脚本; 不是'sc'的意思
'General_Category=Currency_Symbol'
Scf Simple_Case_Folding
脚本(简称:sc)
Script_Extensions(简称:scx)
Scx 脚本扩展
SD软点
Sentence_Break(简称:SB)
Sfc Simple_Case_Folding
Simple_Case_Folding(简称:scf)
Simple_Lowercase_Mapping(简称:slc)
Simple_Titlecase_Mapping(简称:stc)
Simple_Uppercase_Mapping(简称:suc)
Slc 简单小写映射
Soft_Dotted(简称:SD)
空间 White_Space
SpacePerl XPosix 空间。 (Perl 扩展)
Stc Simple_Titlecase_Mapping
学期
Suc Simple_Uppercase_Mapping
Tc Titlecase_Mapping
术语终端_标点符号
Terminal_Punctuation(简称:Term)
标题标题。 (Perl 扩展)
Titlecase(简称:标题)。 (Perl 扩展)。 (=
\p{Gc=Lt})
Titlecase_Mapping(简称:tc)
Uc 大写_映射
UIdeo 统一象形文字
Unicode 任何。 (Perl 扩展)
Unicode_1_Name(简称:na1)
Unified_Ideograph(简称:UIdeo)
大写字母
大写(简称:大写)
Uppercase_Mapping(简称:uc)
Variation_Selector(简称:VS)
VertSpace(Perl 扩展)。 \v
VS 变体选择器
WB Word_Break
White_Space(简称:WSpace)
字 XPosixWord。 (Perl 扩展)
Word_Break(简称:WB)
WSpace 空白_Space
XDigit XPosixXDigit。 (Perl 扩展)
XID_Continue(简称:XIDC)
XID_Start(简称:XIDS)
XIDC XID_继续
XIDS XID_Start
XPerlSpace XPosixSpace。 (Perl 扩展)
XPosixAlnum(简称:Alnum)。 (Perl 扩展)。
字母和(十进制)数字
XPosixAlpha(Perl 扩展)
XPosixBlank(简称:空白)。 (Perl 扩展)。 \H,
水平空白
XPosixCntrl General_Category=XPosixCntrl(简称:
控制)。 (Perl 扩展)。 控制
字符
XPosixDigit General_Category=XPosixDigit(简称:
数字)。 (Perl 扩展)。 [0-9] + 全部
其他十进制数字
XPosixGraph(简称:图形)。 (Perl 扩展)。
图形字符
XPosixLower(Perl 扩展)
XPosixPrint(简称:打印)。 (Perl 扩展)。
图形加空格的字符
字符(但没有控件)
XPosixPunct(Perl 扩展)。 \p{Punct} + ASCII 范围
\p{符号}
XPosixSpace(Perl 扩展)。 \s 包括超越
ASCII 和垂直制表符
XPosixUpper(Perl 扩展)
XPosixWord(简称:Word)。 (Perl 扩展)。 \w,
包括超越 ASCII; = \p{Alnum} + \pM
+ \p{电脑}
XPosixXDigit(简称:XDigit)。 (Perl 扩展)
查看房源 无障碍 通过 other 手段
某些属性也可以通过核心函数调用访问。 这些都是:
Lowercase_Mapping lc() 和 lcfirst()
Titlecase_Mapping ucfirst()
大写_映射 uc()
此外,Case_Folding 可通过正则表达式中的“/i”修饰符访问,
“\F”音译转义,和“fc”运算符。
并且,可以通过“\N{}”插值访问 Name 和 Name_Aliases 属性
在双引号字符串和正则表达式中; 和函数“charnames::viacode()”,
“charnames::vianame()”和“charnames::string_vianame()”(这需要一个“use charnames
();”来说明。
最后,大多数与分解相关的属性都可以通过 Unicode::Normalize 访问。
统一 字符 这 旨在 不是 公认 by Perl的
当在
正则表达式。 下面列出了非 Unihan 的,以及它们不是的原因
接受,也许有变通办法。 列出了属性的简称
括在(括号)中。 如列表后所述,安装可以更改
默认值并选择接受其中任何一个。 该列表是基于机器生成的
为生成此文档的安装所做的选择。
Expands_On_NFC (XO_NFC)
Expands_On_NFD (XO_NFD)
展开_On_NFKC (XO_NFKC)
展开_On_NFKD (XO_NFKD)
由 Unicode 弃用。 这些是扩展为多个字符的字符
指定的规范化形式,但它们是否实际占用更多字节
取决于所使用的编码。 例如,一个 UTF-8 编码的字符可能会展开
与 UTF-32 编码字符不同的字节数。
字素链接 (Gr_Link)
Unicode 弃用:Duplicates ccc=vr (Canonical_Combining_Class=Virama)
Indic_Matra_Category 类别 (在MC中)
Indic_Sylabic_Category (南卡罗来纳州)
临时
Jamo_Short_Name (日本)
其他_字母 (奥阿尔法)
其他_默认_可忽略_代码_点 (对外直接投资)
其他_字形_扩展 (OGr_Ext)
其他_ID_继续 (OIDC)
其他_ID_开始 (OID)
其他_小写 (O下)
其他_数学 (奥数学)
其他_大写 (上)
由 Unicode 在内部用于生成其他属性,不打算使用
单机
脚本=Katakana_Or_Hiragana (sc=人力资源)
过时的。 之前与此匹配的所有代码点都已移至
“脚本=通用”。 考虑改用“Script_Extensions=Katakana”或
“Script_Extensions=平假名”(或两者)
Script_Extensions=片假名_Or_平假名 (scx=Hrkt)
与此匹配的所有代码点都匹配
“Script_Extensions=片假名”或“Script_Extensions=平假名”
安装可以选择允许通过下载 Unicode 来匹配其中任何一个
数据库来自http://www.unicode.org/Public/> 到 $Config{privlib}/单核/ 在 Perl 中
源代码树,更改程序中包含的控制列表
$配置{privlib}/单核/mktables 然后重新编译安装。 (%配置是
可从配置模块获得)。
此外,可以重新编译 perl 以在早期版本的 Unicode 标准上运行。
更多信息位于 $Config{privlib}/单核/README.perl.
其他 信息 in 这些因素包括原料奶的可用性以及达到必要粉末质量水平所需的工艺。 统一 data 基地
Unicode 数据库以两种不同的格式提供。 XML 版本适用于
更现代的 Unicode 版本。 另一个版本是文件的集合。 两者是
旨在提供同等信息。 Perl 使用旧形式; 这让你
重新编译 Perl 以使用早期的 Unicode 版本。
Perl 当前支持的唯一非字符属性是命名序列,其中
一系列代码点被赋予一个名称,通常被视为一个单一的实体。 (Perl
通过 "\N{...}" 双引号结构支持这些,
charnames 中的“charnames::string_vianame(name)”,以及“命名序列()" 在 Unicode::UCD 中。
下面是 Perl 当前不使用的 Unicode 数据库中的文件列表,
以及对它们目的的非常简短的描述。 一些文件的名称有
从 Unicode 使用的那些缩短,以允许它们是可区分的
来自文件系统上类似命名的文件,只有名称的前 8 个字符
非常重要。
辅助/GraphemeBreakTest.html
辅助/LineBreakTest.html
辅助/SentenceBreakTest.html
辅助/WordBreakTest.html
验证测试的文档
辅助/LBTest.txt
双向字符测试.txt
双向测试.txt
标准测试.txt
验证测试
中日韩部首.txt
将 kRSUnicode 属性值映射到相应的代码点
表情符号来源.txt
将某些 Unicode 代码点映射到其遗留的日本手机值
索引.txt
Unicode 字符的字母索引
IndicMatraCategory.txt文件
IndicSylabicCategory.txt
临时; 用于分析和处理印度文字
NamedSqProv.txt文件
提议包含在 Unicode 标准的更高版本中的命名序列; 如果
您现在需要它们,您可以将此文件附加到 命名序列.txt 并重新编译 perl
名称列表.html
描述格式和内容 姓名列表.txt
姓名列表.txt
带注释的字符列表
规范化更正.txt
已纳入 Unicode 数据库的更正文档
道具.txt
仅在非常早期的版本中; 是一个子集 道具列表.txt (代替使用)
自述文件
文件记录
标准化变体.html
提供源自的标准变体序列的可视化显示
标准化变体.txt.
标准化变体.txt
字符显示的某些字形变体是标准化的。 这列出了非
Unihan的; Unihan 的也不被 Perl 使用,而是在一个单独的 Unicode 中
数据库http://www.unicode.org/ivd>
U源数据.txt
Unicode 编码提案的状态文档和交叉参考
统一汉字
USourceGlyphs.pdf
里面的人物图片 U源数据.txt
使用 onworks.net 服务在线使用 perluniprops
