服务器之家

服务器之家 > 正文

Java实现将汉字转化为汉语拼音的方法

时间:2020-03-12 11:43     来源/作者:李超@hicc

本文实例讲述了Java实现将汉字转化为汉语拼音的方法。分享给大家供大家参考,具体如下:

网上乱转,偶然看到一个很有意思的小工具,名字叫pinyin4j,可以把汉字转换为汉语拼音,利用他的话再配合上lucene、中文分词就可以做出类似google那种输入汉语拼音进行全文检索的功能了。实现的代码如下

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
package pinyin4j;
import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;
public class pinyin4jTest {
  public static void main(String argsp[]) {
    try {
      String output = pinyin4jTest.CNToPinyin("你和你好", null);
      System.out.println(output);
    } catch (BadHanyuPinyinOutputFormatCombination e) {
      // TODO Auto-generated catch block
      e.printStackTrace();
    }
  }
  /**
   * @parm inputCN 输入的中文字符串
   * @parm seg 输出汉语拼音时的分隔符
   *
   * HanyuPinyinOutputFormat提供了几种输出模式
   * HanyuPinyinCaseType:设定输入的结果是大写英文还是小写英文 LOWERCASE :小写 UPPERCASE :大写
   * HanyuPinyinToneType:输出是否表明音调和重音 WITH_TONE_NUMBER:标明音调 如YE1 1-4表示 1-4声
   * WITHOUT_TONE:不显示音调符 HanyuPinyinVCharType :输出要用何种的拼音编码
   */
  public static String CNToPinyin(String inputCN, String seg)
      throws BadHanyuPinyinOutputFormatCombination {
    char[] inputArray = inputCN.toCharArray();
    if (seg == null)
      seg = " ";
    HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat();
    format.setCaseType(HanyuPinyinCaseType.LOWERCASE);
    format.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
    format.setVCharType(HanyuPinyinVCharType.WITH_V);
    String output = "";
    String[] temp = new String[10];
    for (int i = 0; i < inputArray.length; i++) {
      temp = PinyinHelper.toHanyuPinyinStringArray(inputArray[i], format);
      //若输入的汉字为多音字则会将不同的读音依次放入temp[]中,若不是多音字则只有temp[0]中有值
      for (int j = 0; j < temp.length; j++) {
        output += temp[j] + seg;
      }
    }
    return output;
  }
}

希望本文所述对大家Java程序设计有所帮助。

标签:

相关文章

热门资讯

玄元剑仙肉身有什么用 玄元剑仙肉身境界等级划分
玄元剑仙肉身有什么用 玄元剑仙肉身境界等级划分 2019-06-21
沙雕群名称大全2019精选 今年最火的微信群名沙雕有创意
沙雕群名称大全2019精选 今年最火的微信群名沙雕有创意 2019-07-07
男生常说24816是什么意思?女生说13579是什么意思?
男生常说24816是什么意思?女生说13579是什么意思? 2019-09-17
超A是什么意思 你好a表达的是什么
超A是什么意思 你好a表达的是什么 2019-06-06
华为nova5pro和p30pro哪个好 华为nova5pro和华为p30pro对比详情
华为nova5pro和p30pro哪个好 华为nova5pro和华为p30pro对比详情 2019-06-22
返回顶部