对于JS 中编码(encode)和解码(decode)的三种方法

JavaScript023

对于JS 中编码(encode)和解码(decode)的三种方法,第1张

JS对文字进行编码涉及3个函数:escape,encodeURI,encodeURIComponent,相应3个解码函数:unescape,decodeURI,decodeURIComponent

下面简单介绍一下它们的区别

1 escape()函数

定义和用法 

escape() 函数可对字符串进行编码,这样就可以在所有的计算机上读取该字符串。

语法 

escape(string)

参数  描述 

string  必需。要被转义或编码的字符串。

返回值 

已编码的 string 的副本。其中某些字符被替换成了十六进制的转义序列。

说明 

该方法不会对 ASCII 字母和数字进行编码,也不会对下面这些 ASCII 标点符号进行编码: - _ . ! ~ * ' ( ) 。其他所有的字符都会被转义序列替换。

2 encodeURI()函数 

定义和用法 

encodeURI() 函数可把字符串作为 URI 进行编码。

语法 

encodeURI(URIstring)

参数  描述 

URIstring  必需。一个字符串,含有 URI 或其他要编码的文本。

返回值 

URIstring 的副本,其中的某些字符将被十六进制的转义序列进行替换。

说明 

该方法不会对 ASCII 字母和数字进行编码,也不会对这些 ASCII 标点符号进行编码: - _ . ! ~ * ' ( ) 。

该方法的目的是对 URI 进行完整的编码,因此对以下在 URI 中具有特殊含义的 ASCII 标点符号,encodeURI() 函数是不会进行转义的:/?:@&=+$,#

3 encodeURIComponent() 函数

定义和用法 

encodeURIComponent() 函数可把字符串作为 URI 组件进行编码。

语法 

encodeURIComponent(URIstring)

参数  描述 

URIstring  必需。一个字符串,含有 URI 组件或其他要编码的文本。

返回值 

URIstring 的副本,其中的某些字符将被十六进制的转义序列进行替换。

说明 

该方法不会对 ASCII 字母和数字进行编码,也不会对这些 ASCII 标点符号进行编码: - _ . ! ~ * ' ( ) 。

其他字符(比如 :/?:@&=+$,# 这些用于分隔 URI 组件的标点符号),都是由一个或多个十六进制的转义序列替换的。

提示和注释 

提示:请注意 encodeURIComponent() 函数 与 encodeURI() 函数的区别之处,前者假定它的参数是 URI 的一部分(比如协议、主机名、路径或查询字符串)。因此 encodeURIComponent() 函数将转义用于分隔 URI 各个部分的标点符号。

4 总结:

 通过对三个函数的分析,我们可以知道:escape()除了 ASCII 字母、数字和特定的符号外,对传进来的字符串全部进行转义编码,因此如果想对URL编码,最好不要使用此方法。而encodeURI() 用于编码整个URI,因为URI中的合法字符都不会被编码转换。encodeURIComponent方法在编码单个URIComponent(指请求参数)应当是最常用的,它可以讲参数中的中文、特殊字符进行转义,而不会影响整个URL。

1、   传递参数时需要使用encodeURIComponent,这样组合的url才不会被#等特殊字符截断。 

例如:document.write(' 退出

2、   进行url跳转时可以整体使用encodeURI

例如:Location.href=encodeURI("http://cang.baidu.com/do/s?word=百度&ct=21")

3、   js使用数据时可以使用escape

例如:搜藏中history纪录。

4、   escape对0-255以外的unicode值进行编码时输出%u****格式,其它情况下escape,encodeURI,encodeURIComponent编码结果相同。

最多使用的应为encodeURIComponent,它是将中文、韩文等特殊字符转换成utf-8格式的url编码,所以如果给后台传递参数需要使用encodeURIComponent时需要后台解码对utf-8支持(form中的编码方式和当前页面编码方式相同)

escape不编码字符有69个:*,+,-,.,/,@,_,0-9,a-z,A-Z

encodeURI不编码字符有82个:!,#,$,&,',(,),*,+,,,-,.,/,:,,=,?,@,_,~,0-9,a-z,A-Z

encodeURIComponent不编码字符有71个:!, ',(,),*,-,.,_,~,0-9,a-z,A-Z

示例(摘自 W3School):

1 escape()

document.write(escape("Visit W3School!") + "

")

document.write(escape("?!=()#%&"))

输出结果:

Visit%20W3School%21

%3F%21%3D%28%29%23%25%26

2 encodeURI()

document.write(encodeURI("http://www.w3school.com.cn")+ "

")

document.write(encodeURI("http://www.w3school.com.cn/My first/")+ "

")

document.write(encodeURI(",/?:@&=+$#"))

输出结果:

http://www.w3school.com.cn

http://www.w3school.com.cn/My%20first/

,/?:@&=+$#

对整个URL进行编码,而URL的特定标识符不会被转码。

3  encodeURIComponent()

例1:

document.write(encodeURIComponent("http://www.w3school.com.cn"))

document.write("

")

document.write(encodeURIComponent("http://www.w3school.com.cn/p 1/"))

document.write("

")

document.write(encodeURIComponent(",/?:@&=+$#"))

输出结果:

http%3A%2F%2Fwww.w3school.com.cn

http%3A%2F%2Fwww.w3school.com.cn%2Fp%201%2F

%2C%2F%3F%3A%40%26%3D%2B%24%23

对URL中的参数进行编码,因为参数也是一个URL,如果不编码会影响整个URL的跳转。

最近在做一个插件开发,我用c++在插件里面把带中文的字符串用base64算法加密后推给网页的js去解码,解出来的相信大家预料到了,洋文一字不差,中文就TMD的都是乱码。

google了一下,也没找到能解决问题的方法,没办法只好自己研究了。后来发现问题原因了,编码过程肯定是没有问题的,看到前面加颜色那段字了没,就是我解出来的编码虽然是utf8,但是将中文文字进行Base64编码再解码后,重新排列编码的时候,往往就会出现乱码,UTF8页面的编码实际还是用UTF-16存储的。应该在解码后把UTF8还原为UTF-16格式。这样就能真正搞定javascript解密中文base64编码的问题了。

这里我就把js解码代码贴出来,给广大同胞:

/**

* Waitang.com

*/

var base64EncodeChars = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/"

var base64DecodeChars = new Array(

-1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1,

-1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1,

-1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, 62, -1, -1, -1, 63,

52, 53, 54, 55, 56, 57, 58, 59, 60, 61, -1, -1, -1, -1, -1, -1,

-1, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14,

15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, -1, -1, -1, -1, -1,

-1, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40,

41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, -1, -1, -1, -1, -1)

//base64编码

function base64encode(str) {

var out, i, len

var c1, c2, c3

len = str.length

i = 0

out = ""

while(i <len) {

c1 = str.charCodeAt(i++) &0xff

if(i == len)

{

out += base64EncodeChars.charAt(c1 >>2)

out += base64EncodeChars.charAt((c1 &0x3) <<4)

out += "=="

break

}

c2 = str.charCodeAt(i++)

if(i == len)

{

out += base64EncodeChars.charAt(c1 >>2)

out += base64EncodeChars.charAt(((c1 &0x3)<<4) | ((c2 &0xF0) >>4))

out += base64EncodeChars.charAt((c2 &0xF) <<2)

out += "="

break

}

c3 = str.charCodeAt(i++)

out += base64EncodeChars.charAt(c1 >>2)

out += base64EncodeChars.charAt(((c1 &0x3)<<4) | ((c2 &0xF0) >>4))

out += base64EncodeChars.charAt(((c2 &0xF) <<2) | ((c3 &0xC0) >>6))

out += base64EncodeChars.charAt(c3 &0x3F)

}

return out

}

//base64解码

function base64decode(str) {

var c1, c2, c3, c4

var i, len, out

len = str.length

i = 0

out = ""

while(i <len) {

/* c1 */

do {

c1 = base64DecodeChars[str.charCodeAt(i++) &0xff]

} while(i <len &&c1 == -1)

if(c1 == -1)

break

/* c2 */

do {

c2 = base64DecodeChars[str.charCodeAt(i++) &0xff]

} while(i <len &&c2 == -1)

if(c2 == -1)

break

out += String.fromCharCode((c1 <<2) | ((c2 &0x30) >>4))

/* c3 */

do {

c3 = str.charCodeAt(i++) &0xff

if(c3 == 61)

return out

c3 = base64DecodeChars[c3]

} while(i <len &&c3 == -1)

if(c3 == -1)

break

out += String.fromCharCode(((c2 &0XF) <<4) | ((c3 &0x3C) >>2))

/* c4 */

do {

c4 = str.charCodeAt(i++) &0xff

if(c4 == 61)

return out

c4 = base64DecodeChars[c4]

} while(i <len &&c4 == -1)

if(c4 == -1)

break

out += String.fromCharCode(((c3 &0x03) <<6) | c4)

}

return out

}

这是转换utf8到utf16的代码:

/**

* Yovae.com

*/

//utf-8转utf16

function utf16to8(str) {

var out, i, len, c

out = ""

len = str.length

for(i = 0i <leni++) {

c = str.charCodeAt(i)

if ((c >= 0x0001) &&(c <= 0x007F)) {

out += str.charAt(i)

} else if (c >0x07FF) {

out += String.fromCharCode(0xE0 | ((c >>12) &0x0F))

out += String.fromCharCode(0x80 | ((c >>6) &0x3F))

out += String.fromCharCode(0x80 | ((c >>0) &0x3F))

} else {

out += String.fromCharCode(0xC0 | ((c >>6) &0x1F))

out += String.fromCharCode(0x80 | ((c >>0) &0x3F))

}

}

return out

}

//utf-16转utf-8

function utf8to16(str) {

var out, i, len, c

var char2, char3

out = ""

len = str.length

i = 0

while(i <len) {

c = str.charCodeAt(i++)

switch(c >>4)

{

case 0: case 1: case 2: case 3: case 4: case 5: case 6: case 7:

// 0xxxxxxx

out += str.charAt(i-1)

break

case 12: case 13:

// 110x xxxx 10xx xxxx

char2 = str.charCodeAt(i++)

out += String.fromCharCode(((c &0x1F) <<6) | (char2 &0x3F))

break

case 14:

// 1110 xxxx 10xx xxxx 10xx xxxx

char2 = str.charCodeAt(i++)

char3 = str.charCodeAt(i++)

out += String.fromCharCode(((c &0x0F) <<12) |

((char2 &0x3F) <<6) |

((char3 &0x3F) <<0))

break

}

}

return out

}

这是c++ base64编码代码:

/**

* Yovae.com

*/

CString encode(const CString in_str)

{

const CString _base64_encode_chars = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/"

CString out_str

unsigned char c1, c2, c3

int i = 0

int len = in_str.GetLength()

while ( i {

c1 = in_str[i++]

if ( i==len )

{

out_str += _base64_encode_chars[ c1>>2 ]

out_str += _base64_encode_chars[ (c1&0x3)<<4 ]

out_str += "=="

break

}

c2 = in_str[i++]

if ( i==len )

{

out_str += _base64_encode_chars[ c1>>2 ]

out_str += _base64_encode_chars[ ((c1&0x3)<<4) | ((c2&0xF0)>>4) ]

out_str += _base64_encode_chars[ (c2&0xF)<<2 ]

out_str += "="

break

}

c3 = in_str[i++]

out_str += _base64_encode_chars[ c1>>2 ]

out_str += _base64_encode_chars[ ((c1&0x3)<<4) | ((c2&0xF0)>>4) ]

out_str += _base64_encode_chars[ ((c2&0xF)<<2) | ((c3&0xC0)>>6) ]

out_str += _base64_encode_chars[ c3&0x3F ]

}

return out_str

}

以下是用js解码的方法:

<script language="vbscript">

//this is for javascript encode

Function str2asc(strstr)

str2asc = hex(asc(strstr))

End Function

Function asc2str(ascasc)

asc2str = chr(ascasc)

End Function

</script>

<script language="javascript">

function UrlEncode(str){

var ret=""

var strSpecial="!\"#$%&()*+,/:<=>?[]^`{|}~%"

var tt=""

for(var i=0i<str.lengthi++){

var chr = str.charAt(i)

var c=str2asc(chr)

tt += chr+":"+c+"n"

if(parseInt("0x"+c) >0x7f){

ret+="%"+c.slice(0,2)+"%"+c.slice(-2)

}else{

if(chr==" ")

ret+="+"

else if(strSpecial.indexOf(chr)!=-1)

ret+="%"+c.toString(16)

else

ret+=chr

}

}

return ret

}

function UrlDecode(str){

var ret=""

for(var i=0i<str.lengthi++)

{

var chr = str.charAt(i)

if(chr == "+")

{

ret+=" "

}

else if(chr=="%")

{

var asc = str.substring(i+1,i+3)

if(parseInt("0x"+asc)>0x7f)

{

ret+=asc2str(parseInt("0x"+asc+str.substring(i+4,i+6)))

i+=5

}

else

{

ret+=asc2str(parseInt("0x"+asc))

i+=2

}

}

else

{

ret+= chr

}

}

return ret

}

alert(UrlEncode('上海'))

</script>