网络编程 
首页 > 网络编程 > 浏览文章

正则表达式u修饰符(支持UTF-16编码)

(编辑:jimmy 日期: 2024/11/16 浏览:3 次 )

正则表达式u修饰符:

此修饰符标识能够正确处理大于\uFFFF的Unicode字符。
也就是说,会正确处理四个字节的UTF-16编码。
此修饰符是ES2015新增,更多正则表达式新特性可以参阅ES2015 正则表达式新增特性一章节。
更多正则表达式教程可以参阅正则表达式教程板块。

代码实例:

console.log(/^\uD842/u.test("\uD842\uDFB7"))

输出false,由于"\uD842\uDFB7"是一个四个字节的UTF-16编码,代表一个字符,所以如果正则表达式带有u修饰符,那么就能够识别它。

console.log(/^\uD842/.test("\uD842\uDFB7"))

输出true;不加u修饰符,那么就无法将四个字节的UTF-16编码识别为一个字符,所以就可以产生匹配。

/^.$/.test("\uD842\uDFB7")//false
/^.$/u.test("\uD842\uDFB7")//true

关于元字符点(.)的用法可以参阅正则表达式.号元字符一章节。

/^.$/.test("\uD842\uDFB7")//false
/^.$/u.test("\uD842\uDFB7")//true

添加u修饰符之后,点元字符就可以匹配码点大于0xFFFF的Unicode字符。

/ \u{61} /.test("a")//false
/ \u{61} / u.test("a")//true

使用u修饰符,正则表达式能够识别大括号{}表示的Unicode字符,否则无法识别,{61}也会被解读为量词,表示61个u字符。
关于大括号表示的Unicode字符可以参阅ES2015 字符串新增特性一章节。

上一篇:正则表达式\w元字符使用介绍
下一篇:ES2015 正则表达式新增特性
一句话新闻
微软与英特尔等合作伙伴联合定义“AI PC”:键盘需配有Copilot物理按键
几个月来,英特尔、微软、AMD和其它厂商都在共同推动“AI PC”的想法,朝着更多的AI功能迈进。在近日,英特尔在台北举行的开发者活动中,也宣布了关于AI PC加速计划、新的PC开发者计划和独立硬件供应商计划。
在此次发布会上,英特尔还发布了全新的全新的酷睿Ultra Meteor Lake NUC开发套件,以及联合微软等合作伙伴联合定义“AI PC”的定义标准。