java中文字符串处理方法

Python010

java中文字符串处理方法,第1张

处理方法有分割,合并,等很多方法的

1、String类是final的,不可被继承。public final class String。

2、String类是的本质是字符数组char[], 并且其值不可改变。private final char value[]

然后打开String类的API文档,可以发现:

3、String类对象有个特殊的创建的方式,就是直接指定比如String x = "abc","abc"就表示一个字符串对象。而x是"abc"对象的地址,也叫做"abc"对象的引用。

4、String对象可以通过“+”串联。串联后会生成新的字符串。也可以通过concat()来串联,这个后面会讲述。

6、Java运行时会维护一个String Pool(String池),JavaDoc翻译很模糊“字符串缓冲区”。String池用来存放运行时中产生的各种字符串,并且池中的字符串的内容不重复。而一般对象不存在这个缓冲池,并且创建的对象仅仅存在于方法的堆栈区。下面是个系统内存示意图:

5、创建字符串的方式很多,归纳起来有三类:

其一,使用new关键字创建字符串,比如String s1 = new String("abc")

其二,直接指定。比如String s2 = "abc"

其三,使用串联生成新的字符串。比如String s3 = "ab" + "c"

【实例描述】

字符串中可以包含数字,字母、汉字或者其他字符。使用Character类的isDigit()方法可以判断字符中的某个字符是否为数字,使用Character类的isLetter()方法可以判断字符中的某个字符是否为字母。实例中将介绍一种方法用来判断字符串中的某个字符是否为汉字,通过此方法可以计算字符串中汉字的数量。实例的运行效果如图4.24所示。

【实现过程】

在Eclipse中新建项目ChineseCharacter,并在其中创建一个ChineseCharacter.java文件。在该类的主方法中创建标准输入流的扫描器对象,接收用户输入的字符串。我们在程序中使用matches()方法来统计该字符串中汉字的个数。核心代码如下所示:

protectedvoiddo_button_actionPerformed(ActionEvente){Stringtext=chineseArea.getText()//获取用户输入intamount=0//创建汉字数量计数器for(inti=0i<text.length()i++){//遍历字符串每一个字符//使用正则表达式判断字符是否属于汉字编码booleanmatches=Pattern.matches("^[\u4E00-\u9FA5]{0,}$",""+text.charAt(i))if(matches){//如果是汉字amount++//累加计数器}}umField.setText(amount+"")//在文本框显示汉字数量}

【代码解析】

本实例的关键点在于正则表达式的使用。Java提供了Pattern用于正则表达式的编译表示形式,该类提供的静态方法matches()可以执行正则表达式的匹配。该方法编译给定正则表达式并尝试给定输入与其匹配。如果要匹配的字符序列与正则表达式匹配则返回true,否则返回false。其声明语法如下:

publicstaticbooleanmatches(Stringregex,CharSequenceinput)【知识扩展】

使用正则表达式可以方便地进行字符串操作,正则表达式经常被用来验证用户输入的信息,如可以判断用户输入的格式是否正确。本实例中使用正则表达式来判断用户输入的字符串是否为汉字,如果为汉字则计数器加1,最后得到字符串中所有汉字的数量。

1.判断字符串是否全是汉字。

String str1 = "java判断是否为汉字"

String str2 = "全为汉字"

String reg = "[\\u4e00-\\u9fa5]+"

boolean result1 = str1.matches(reg)//false

boolean result2 = str2.matches(reg)//true

2.提取字符串中的汉字。

String str = "java怎么把asdasd字符串中的asdasd的汉字取出来"

String reg = "[^\u4e00-\u9fa5]"

str = str.replaceAll(reg, " ")

System.out.println(str)

3.判断字符串中是否含有汉字。

boolean result = (str.length() == str.getBytes().length)//true:无汉字  false:有汉字

4.获取字符串中汉字的个数。

int count = 0

String reg = "[\\u4e00-\\u9fa5]"

String str = "java获取汉字Chinese的个数"

Pattern p = Pattern.compile(reg)

Matcher m = p.matcher(str)

while (m.find()) {for (int i = 0i <= m.groupCount()i++) {count = count + 1}}

System.out.println("共有汉字 " + count + "个 ")