JS正则表达式,汉字表示!!!

JavaScript07

JS正则表达式,汉字表示!!!,第1张

中文字符匹配js正则表达式,普遍使用的正则是[\u4e00-\u9fa5],但这个范围并不完整。例如: /[\u4e00-\u9fa5]/.test( '⻏' ) // 测试部首⻏,返回false 。根据Unicode 5.0版编码,要准确的判断一个中文字符要包括: 范围含义范围 含义 2E80-2EFF CJK 部首补充2F00-2FDF 康熙字典部首 3000-303F CJK 符号和标点 31C0-31EF CJK 笔画 3200-32FF 封闭式 CJK 文字和月份 3300-33FF CJK 兼容 3400-4DBF CJK 统一表意符号扩展 A 4DC0-4DFF 易经六十四卦符号 4E00-9FBF CJK 统一表意符号 F900-FAFF CJK 兼容象形文字 FE30-FE4F CJK 兼容形式FF00-FFEF 全角ASCII、全角标点因此,正确的匹配中文字符正则表达式为: var rcjk = /[\u2E80-\u2EFF\u2F00-\u2FDF\u3000-\u303F\u31C0-\u31EF\u3200-\u32FF\u3300-\u33FF\u3400-\u4DBF\u4DC0-\u4DFF\u4E00-\u9FBF\uF900-\uFAFF\uFE30-\uFE4F\uFF00-\uFFEF]+/g

1、用正则表达式判断

function CheckChinese(obj,val){

var reg = new RegExp("[\\u4E00-\\u9FFF]+","g")

if(reg.test(val)){alert("包含汉字!")}

}

2、用 Unicode 字符范围判断

function chkstrlen(str){

var strlen = 0

for(var i = 0i <str.lengthi++){

if(str.charCodeAt(i) >255) //如果是汉

这些符号有:^ $ . * + - ? = ! : | \ / ( ) [ ] { }1.“[ ]”表示字符类: 即括号里是个字符集:如/[abc]/,表示和含有a,b,c任何一个字母的字符串都匹配。注:特殊字符类:\s表示空格符、制表符、Unicode空白符。\S表示非空格空白符。 (也可自定义Unicode字符类:如:/[\u4E00-\u9FA5]/表示只匹配中文字符。)\w 任何单字字符,相当于[a-zA-X0-9_];\W与\w相反。\d 任何数字,相当于[0-9];\D与 \d相反。\b在字符类中使用表示退格符,[\b]则表示退格直接量;\b可以用来指定匹配位置,即匹配到达单词边界,称为锚;如:查找一个句子里的单词 java , 可以使用/\bjava\b/;\B与\b相反。2.“-"表示连字符,如[a-z];3."."表示除换行符;表示匹配除“\r\n”之外的任意单个字符。若要匹配包括“\r\n”在内的任何字符,请使用像“[\w\W|\d\D|\s\S|]”的模式。4."^"具有两重含义:开始标记和非,如:/^a/表示以a开始的字符;当在[]中时:/[^a]/表示非a的所有字符。5."$"表示字符结尾。如:/^abc$/表示以c结束的字符。6.”{}"表示重复上一项。如/\d{2,4}/表示数字出现至少2次,最多4次。如/3{2,4}/匹配33...;333....;3333.....不匹配3和4个3相连以上的了。它的三种格式如下{n,m}表示至少3次,最多m次;{n,}至少n次;{n}恰好n次。7."?"表示{0,1}。8."+"表示{1,}。9."*"表示{0,}。注:非贪婪的重复(如??,+?,*?,{1,5}?只匹配第一个。)10."|"表示分割,即或的含义。如:/ab|cd|ef/匹配含有ab或cd或ef的字符串。11."()"包含三重用途:一是定义子表达式。二是在完整的模式中定义子模式。三是子表达式的引用。子模式的定义可以从目标串中抽取和括号中的子模式相匹配的部分。子模式的表达式的引用是指:可识别子模式的编号,提取它。如/(abc)\sis\s(string\w*)/;里面含有两个字表达式:可通过\1指(abc);\2指(string\w*); 应用如:/['"][^'"]*['"]/不能取前后同样的引号,可以这样写:/[('")[^'"]*\1]/,可起到约束作用。注:若想()里的不想被记忆,可采用(?:.....),将不会对其编号。还有(?=p),(?!p)如下:如/(javascript)?(?=\:)/ 表示匹配javascript:,但不包含:;它不匹配javascript,因为他有个条件就是后要接:;(?!p)反前向声明,要求接下来的字符不与模式p匹配,与(?=p)相反。