GB2312里面的7k多个汉字是按照拼音排序的,后来扩充的汉字并没有按照拼音排序,(为了不打乱已经排好的GB2312编码表),所以要准确获取拼音最好还是用词库来比对。
这里有比较好的例子:
http://www.cssrain.cn/demo/pinyin/lukin/Pinyin.html
自己改写一下就可以。
如果要搞好那个函数,需要把编码转换为ansi编码,网上有很多这里函数。
复杂的汉字确实不能找到正确的拼音,只适用简单的汉字GB2312里的。
改写如下:
先去http://www.cftea.com/c/2009/04/3T7WXDO9S9VFBXH3.asp 里弄两个函数来:字数超过限制就不贴这两个函数了。自己去下载一下:
function UnicodeChr()
function AnsicodeChr()
var s='拼音转换'
alert( getPY_str(s) )
function getPY_str(str){
var py_str=''
for ( var i=0i < str.length i++)
{
py_str +=getPY(str.substr(i,1))
}
return py_str
}
function ansi(c){
return UnicodeToAnsi(c.charCodeAt(0))
}
function UnicodeToAnsi(chrCode)
{
var chrHex=chrCode.toString(16)
chrHex="000"+chrHex.toUpperCase()
chrHex=chrHex.substr(chrHex.length-4)
var i=UnicodeChr().indexOf(chrHex)
if(i!=-1)
{
chrHex=AnsicodeChr().substr(i,4)
}
return parseInt(chrHex,16)
}
function getPY(ch)
{
if(ch !='') {
var code = ansi(ch)
var py = ''
if(code>=45217 &&code<=45252) {
py = "A"
} else if(code>=45253 &&code<=45760) {
py = "B"
} else if(code>=45761 &&code<=46317) {
py = "C"
} else if(code>=46318 &&code<=46825) {
py = "D"
} else if(code>=46826 &&code<=47009) {
py = "E"
} else if(code>=47010 &&code<=47296) {
py = "F"
} else if((code>=47297 &&code<=47613) || (code == 63193)) {
py = "G"
} else if(code>=47614 &&code<=48118) {
py = "H"
} else if(code>=48119 &&code<=49061) {
py = "J"
} else if(code>=49062 &&code<=49323) {
py = "K"
} else if(code>=49324 &&code<=49895) {
py = "L"
} else if(code>=49896 &&code<=50370) {
py = "M"
} else if(code>=50371 &&code<=50613) {
py = "N"
} else if(code>=50614 &&code<=50621) {
py = "O"
} else if(code>=50622 &&code<=50905) {
py = "P"
} else if(code>=50906 &&code<=51386) {
py = "Q"
} else if(code>=51387 &&code<=51445) {
py = "R"
} else if(code>=51446 &&code<=52217) {
py = "S"
} else if(code>=52218 &&code<=52697) {
py = "T"
} else if(code>=52698 &&code<=52979) {
py = "W"
} else if(code>=52980 &&code<=53688) {
py = "X"
} else if(code>=53689 &&code<=54480) {
py = "Y"
} else if(code>=54481 &&code<=62289) {
py = "Z"
} else {
py =ch
}
return py
}else{
return ''
}
}
//参数,中文字符串
//返回值:拼音首字母串数组function makePy(str){
if(typeof(str) != "string")
throw new Error(-1,"函数makePy需要字符串类型参数!")
var arrResult = new Array() //保存中间结果的数组
for(var i=0,len=str.lengthi<leni++){
//获得unicode码
var ch = str.charAt(i)
//检查该unicode码是否在处理范围之内,在则返回该码对映汉字的拼音首字母,不在则调用其它函数处理
arrResult.push(checkCh(ch))
}
//处理arrResult,返回所有可能的拼音首字母串数组
return mkRslt(arrResult)
}
function checkCh(ch){
var uni = ch.charCodeAt(0)
//如果不在汉字处理范围之内,返回原字符,也可以调用自己的处理函数
if(uni > 40869 || uni < 19968)
return ch //dealWithOthers(ch)
//检查是否是多音字,是按多音字处理,不是就直接在strChineseFirstPY字符串中找对应的首字母
return (oMultiDiff[uni]?oMultiDiff[uni]:(strChineseFirstPY.charAt(uni-19968)))
}
function mkRslt(arr){
var arrRslt = [""]
for(var i=0,len=arr.lengthi<leni++){
var str = arr[i]
var strlen = str.length
if(strlen == 1){
for(var k=0k<arrRslt.lengthk++){
arrRslt[k] += str
}
}else{
var tmpArr = arrRslt.slice(0)
arrRslt = []
for(k=0k<strlenk++){
//复制一个相同的arrRslt
var tmp = tmpArr.slice(0)
//把当前字符str[k]添加到每个元素末尾
for(var j=0j<tmp.lengthj++){
tmp[j] += str.charAt(k)
}
//把复制并修改后的数组连接到arrRslt上
arrRslt = arrRslt.concat(tmp)
}
}
}
return arrRslt
}
//两端去空格函数
String.prototype.trim = function() { return this.replace(/(^\s*)|(\s*$)/g,"") }
//查看拼音首字母缩写
function query(){
var str = document.getElementById("txtChinese").value.trim()
if(str == "") return
var arrRslt = makePy(str)
alert(arrRslt)