Java获取字符的Unicode编码以及如何过滤特

Python019

Java获取字符的Unicode编码以及如何过滤特,第1张

java中可以使用char类提供的charAt()方法来获得字符的unicode的编码值,示例如下:

public static String getUnicode(String source){ String returnUniCode=nullString uniCodeTemp=nullfor(int i=0i<source.length()i++){ uniCodeTemp = "\\u"+Integer.toHexString((int)source.charAt(i))//使用char类的charAt()的方法 returnUniCode=returnUniCode==null?uniCodeTemp:returnUniCode+uniCodeTemp} System.out.print(source +" 's unicode = "+returnUniCode)return returnUniCode//返回一个字符的unicode的编码值}

(java)如何获取字符串字节数!, java怎样获取字符串的字节数

字符串是可以转变成字节数组,然后统计一下字节数组的长度即可,参考如下代码:

Java语言中,中文字符所占的字节数取决于字符的编码方式,一般情况下,采用ISO8859-1编码方式时,一个中文字符与一个英文字符一样只占1个字节;采用GB2312或GBK编码方式时,一个中文字符占2个字节;而采用UTF-8编码方式时,一个中文字符会占3个字节。

public static void main(String []args) throws UnsupportedEncodingException {

运行结果:2

System.out.println("测试".getBytes("ISO8859-1").length)

运行结果:4

System.out.println("测试".getBytes("GB2312").length)

运行结果:4

System.out.println("测试".getBytes("GBK").length)

运行结果:6

System.out.println("测试".getBytes("UTF-8").length)

}

c# 获取字符串的字节数

C#截取字符串字节数 代码如下:

public int bytelenght(string str)

{

byte[] bytestr = System.Text.Encoding.Unicode.GetBytes(str)

int j = 0

for (int i = 0i <bytestr.GetLength(0)i++)

{

if (i % 2 == 0)

{

j++

}

else

{

if (bytestr[i] >0)

{

j++

}

}

}

return j

}

谢谢采纳

c++ 怎样获取一串字符串的字符数,不是字节数

定义一个字符数组,然后根据字符长度循环得到字符

比如char ch[20]

这个20可以用字符实际长度getlength()获取

然后再循环获取字符

ch[i]

c#求字符串的字节数

其实用不着那么复杂计算的。注意:C#中string.Length只是计算字符串“字符”的个数,不计算字节;但是汉字两个字节+数字(英文字符)一个字节,才是6个,简单的代码如下: byte[] bytes = Encoding.Default.GetBytes("1243我")Default(根据自己究竟是汉字还是数字等,自动合理分配内存所需要的字节空间)

Console.WriteLine(bytes.Length)

C#如何获得存放字符串的字节数组?

byte[] System.Text.Encoding.Default.GetBytes(string s)

如何计算一个Unicode字符串的字节数

你就是一个byte一个byte读取的吧?一个汉字两个byte(不含surrogate情况),文件中存两个byte,你从文件中读取2个byte,就是这样 查看原帖>>

java下字符串和字节数组如何转换?

strRead = String.copyValueOf(strRead.toCharArray(), 0, byBuffer.length])2、字符串转换成字节数组 byte[] byBuffer = new byte[200]byBuffer= strInput.getBytes()注意:如果字符串里面含有中文,要特别注意,在android系统下,默认是UTF8编码,一个中文字符相当于3个字节,只有gb2312下一个中文相当于2字节。

这样的测试方法是不正确的。getBytes(charset)是解码,new String(byte[], charset)是编码。new String(str.getBytes(charset),charset)是解码再编码,无论charset是什么编码格式,返回的字符串内容原始str是一致,因此equals方法都是返回true,达不到测试字符串编码格式的目的。个人观点:正确的测试姿势应该是这样的:

String charset ="xxx" //假定编码格式

String str = "中文";

boolean flag = str.equals(new String(str.getBytes(),charset))

flag为true则表明str的编码格式是假定的编码格式。其中说明str.getBytes()该方法就是按其自身编码格式去解码。其自身编码格式跟你的操作系统编码格式或你使用的IDE设置的文件的Text file encoding有关。