js获取一个字符串的字节长度

JavaScript012

js获取一个字符串的字节长度,第1张

因为中文字占两个字节,英文占一个字节。

方法1:把中文字替换成两个字母。然后计算长度。

方法2:直接判断中文,长度+2。

运用的方法大同小异。都是通过正则表达式,写unicode编码。

方法1中

[\u4e00-\u9fa5]:匹配中文字符

[^\x0000-\x00ff]:匹配双字节字符(包括中文字)

正则表达示 /[\u4e00-\u9fa5]/g 的 g 必须要,global,全部都要检查的意思。没有的话输出的是(2333aa哈)

方法2中的函数

扩展:

//

GBK字符集实际长度计算function

getStrLeng(str){

var

realLength

=

0

var

len

=

str.length

var

charCode

=

-1

for(var

i

=

0

i

<

len

i++){

charCode

=

str.charCodeAt(i)

if

(charCode

>=

0

&&

charCode

<=

128)

{

realLength

+=

1

}else{

//

如果是中文则长度加2

realLength

+=

2

}

}

return

realLength}

//

UTF8字符集实际长度计算function

getStrLeng(str){

var

realLength

=

0

var

len

=

str.length

var

charCode

=

-1

for(var

i

=

0

i

<

len

i++){

charCode

=

str.charCodeAt(i)

if

(charCode

>=

0

&&

charCode

<=

128)

{

realLength

+=

1

}else{

//

如果是中文则长度加3

realLength

+=

3

}

}

return

realLength}

在JS中字符串的长度不分中英文字符,

每一个字符都算一个长度,这跟PHP里的strlen()函数就不太一样。PHP里的strlen()函数根据字符集把GBK的中文每个2累加,把UTF-8的中文字符每个按3累加。主要是为了匹配数据库的长度范围内,比如GBK的数据库某字段是varchar(10),那么就相当于5个汉字长度,一个汉字等于两个字母长度。如果是UTF8的数据库则是每个汉字长度为3。