java 根据汉语字符串获得对应的拼音字符串或者拼音首字母字符串等操作,需要添加jar包:
引入包
代码实现:
import java.util.regex.matcher;
import java.util.regex.pattern;
import net.sourceforge.pinyin4j.pinyinhelper;
import net.sourceforge.pinyin4j.format.hanyupinyinoutputformat;
import net.sourceforge.pinyin4j.format.hanyupinyintonetype;
/***
* 汉字工具类
* @author csharper
* @since .12.26
*
*/
public class chinesecharacterutil {
/***
* 将汉字转成拼音(取首字母或全拼)
* @param hanzi
* @param full 是否全拼
* @return
*/
public static string converthanzi2pinyin(string hanzi,boolean full)
{
/***
* ^[\u2e80-\u9fff]+$ 匹配所有东亚区的语言
* ^[\u4e00-\u9fff]+$ 匹配简体和繁体
* ^[\u4e00-\u9fa5]+$ 匹配简体
*/
string regexp="^[\u4e00-\u9fff]+$";
stringbuffer sb=new stringbuffer();
if(hanzi==null||"".equals(hanzi.trim()))
{
return "";
}
string pinyin="";
for(int i=0;i
{
char unit=hanzi.charat(i);
if(match(string.valueof(unit),regexp))//是汉字,则转拼音
{
pinyin=convertsinglehanzi2pinyin(unit);
if(full)
{
sb.append(pinyin);
}
else
{
sb.append(pinyin.charat(0));
}
}
else
{
sb.append(unit);
}
}
return sb.tostring();
}
/***
* 将单个汉字转成拼音
* @param hanzi
* @return
*/
private static string convertsinglehanzi2pinyin(char hanzi)
{
hanyupinyinoutputformat outputformat = new hanyupinyinoutputformat();
outputformat.settonetype(hanyupinyintonetype.without_tone);
string[] res;
stringbuffer sb=new stringbuffer();
try {
res = pinyinhelper.tohanyupinyinstringarray(hanzi,outputformat);
sb.append(res[0]);//对于多音字,只用第一个拼音
} catch (exception e) {
e.printstacktrace();
return "";
}
return sb.tostring();
}
/***
* @param str 源字符串
* @param regex 正则表达式
* @return 是否匹配
*/
public static boolean match(string str,string regex)
{
pattern pattern=pile(regex);
matcher matcher=pattern.matcher(str);
return matcher.find();
}
public static void main(string[] args) {
system.out.println(converthanzi2pinyin("我是中国人123abc",true));
}
}
运行结果:
(1)全拼:
woshizhongguoren123abc
(2)首字母:
wszgr123abc
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流。
如您对本文有疑问或者有任何想说的,请点击进行留言回复,万千网友为您解惑!