GBK字符集实际长度计算function
getStrLeng(str){
var
realLength
=
0
var
len
=
str.length
var
charCode
=
-1
for(var
i
=
0
i
<
len
i++){
charCode
=
str.charCodeAt(i)
if
(charCode
>=
0
&&
charCode
<=
128)
{
realLength
+=
1
}else{
//
如果是中文则长度加2
realLength
+=
2
}
}
return
realLength}
//
UTF8字符集实际长度计算function
getStrLeng(str){
var
realLength
=
0
var
len
=
str.length
var
charCode
=
-1
for(var
i
=
0
i
<
len
i++){
charCode
=
str.charCodeAt(i)
if
(charCode
>=
0
&&
charCode
<=
128)
{
realLength
+=
1
}else{
//
如果是中文则长度加3
realLength
+=
3
}
}
return
realLength}
在JS中字符串的长度不分中英文字符,
每一个字符都算一个长度,这跟PHP里的strlen()函数就不太一样。PHP里的strlen()函数根据字符集把GBK的中文每个2累加,把UTF-8的中文字符每个按3累加。主要是为了匹配数据库的长度范围内,比如GBK的数据库某字段是varchar(10),那么就相当于5个汉字长度,一个汉字等于两个字母长度。如果是UTF8的数据库则是每个汉字长度为3。
一个英文字符(ASCII码)占1个字节在GBK编码下,一个中文字符占2个字节
在UTF-8编码下,一个中文字符通常占3个字节,一些生僻字可能要占4个字节
UTF-8是一种针对Unicode的可变长度字符编码,编码长度是可变的