html charset="utf-8" 和 lang="zh-cmn-hans"有什么区别

html-css010

html charset="utf-8" 和 lang="zh-cmn-hans"有什么区别,第1张

charset表示这个html文档存储时使用的编码,UTF-8是编码格式。

lang表示的是内容使用的语言:zh表示“中文”,cmn表示"普通话",Hans表示"汉字,简体"。

一般charset标签放在html文档的head标签下,根据HTML5标准可以使用这个格式:

<meta charset="UTF-8">

一般来说,网页实际使用的编码由HTTP协议头部指定的内容编码决定,但如果HTTP协议头部没有给出内容编码,浏览器则会使用html文档head标签下使用上述语句指定的编码来解释网页。

一般lang作为属性,放在html标签上,比如:

<!DOCTYPE html>

<html lang="zh-cmn-Hans">

</html>

表示整个html文档使用的语言,但是如果网页中包含其他语言的内容(比如在某个标签中引用了一段英文内容,或是在网页中插入了一段其他语言的音频、视频),则应该在这些单独的标签上再单独使用lang注明内容使用的语言。

一般来说,html文档中指定lang,对于现代浏览器来说暂时没有什么显而易见的作用(部分浏览器会根据这个属性来提供翻译建议,但并不完全依赖这个属性,也会自行判断网页语言)。

而html文档中指定charset也只有当HTTP头部中未包含编码信息时才有效,如果HTTP头部中包含了编码信息,则优先使用HTTP头部指定的编码而忽略HTML文档中指定的编码(如果两者不同的话)。

一般指定编码放在html网页中的<head>和</head>中间,

<meta http-equiv="Content-Type" content="text/htmlcharset=utf-8" />

希望可以帮到你!

1、<meta http-equiv="Content-Type" content="text/htmlcharset=gb2312" />

   charset=gb2312代表说明网站是采用的编码是简体中文;

2、<meta http-equiv="Content-Type" content="text/htmlcharset=utf-8"/>

    charset=utf-8代表世界通用的语言编码;

最常用到的是charset=gb2312、charset=iso-8859-1和charset=utf-8

charset=utf-8这个编码可以用到中文、韩文、日文等世界上所有语言编码上。

“ANSI 编码”的特点:

1. 这些“ANSI 编码标准”都只能处理各自语言范围之内的 UNICODE 字符。

2. “UNICODE 字符”与“转换出来的字节”之间的关系是人为规定的。

3、UTF-8,UTF-16,UnicodeBig

与“ANSI 编码”类似的,把字符串通过 UNICODE 编码转化成“字节串”时,一个 UNICODE 字符可能转化成一个字节或多个字节。

与“ANSI 编码”不同的是:

1. 这些“UNICODE 编码”能够处理所有的 UNICODE 字符。

2. “UNICODE 字符”与“转换出来的字节”之间是可以通过计算得到的。