服务器之家

服务器之家 > 正文

asp.net中C#获取字符串中汉字的个数的具体实现方法

时间:2019-12-01 11:58     来源/作者:ASP.NET教程网

符串可以包括数字,字母,汉字或者其他的字符。使用Char类型的IsDigit静态方法可以判断字符串中的字符是否为数字,使用Char类型中的IsLetter静态方法可以判断字符串中是否为字母。我们来实现一种方法来实现判断字符串中是否为汉字,通过此方法可以计算字符串中汉字的个数:

 

首先根据效果图设置好Form的界面和内容,Box1.Text为输入的字符串,我们对该字符串的处理,来计算汉字的个数,双击Buton控件,编辑其单击事件代码。

我们看下汉字的Unicode范围,普遍给出了0x4E00到0x9FA5,只要我们接受到的字符的16进制编码在此范围,我们就认为此字符为汉字(label4.Text显示汉字的个数)

 

复制代码代码如下:

string a=Box1.Text;
int K = 0;
for (int i = 0; i < a.Length;i++ )
{
char j=a[i];
ushort s = j;
if (s >= 0x4E00&&s<=0x9FA5)
{
K++;
}
label4.Text = “” + K;

 

后再再整理了一些函数 C#中使用正则表达式来从字符串中判断出汉字

 

复制代码代码如下:


//首先引用命名空间
using System.Text.RegularExpressions;

 

//定义一个函数,返回字符串中的汉字个数
public static int GetHanNumFromString(string str)
{
    int count = 0;
    Regex regex = new Regex(@"^[u4E00-u9FA5]{0,}$");

    for (int i = 0; i < str.Length; i++)
    {
        if (regex.IsMatch(str[i].ToString()))
        {
            count++;
        }
    }

    return count;
}

 

 

代码说明:

1、Unicode字符的u4E00到u9FA5之间为汉字编码,所以使用它来表示汉字的正则匹配范围。
2、字符串可以直接进行索引,索引得到的值的数据类型为char,所以str[i].ToString()是为了把char再度转换为字符串。
3、使用Regex的IsMatch方法,可以判断字符串是否与给定的正则表达式匹配,如果匹配成功则返回True,否则为False。

例,获取一个字符串中的汉字的个数 C#获取字符串全角的个数

复制代码代码如下:


static void Main(string[] args)
        {
            while (true)
            {

 

      Console.WriteLine("输入一串字符");
                string str = Console.ReadLine();//定义一个变量str用来存储输入的字符串
                int num= Encoding.Default.GetByteCount(str);//Encoding.Default.GetByteCount(str)在系统默认下计算对字符进行编码是所产生的字节数
                int len = str.Length;//获取字符串的长度
                Console.WriteLine("有{0}汉字",num-len);//num-len就是字符串中的汉字个数          
            }
}

 

例,这个也是正常的

 

复制代码代码如下:

ArrayList itemList = new ArrayList(); 
CharEnumerator CEnumerator = textBox1.Text.GetEnumerator(); 
Regex regex = new Regex("^[/u4E00-/u9FA5]{0,}$"); 
while (CEnumerator.MoveNext()) 

     if(regex.IsMatch(CEnumerator.Current.ToString(),0)) 
         itemList.Add(CEnumerator.Current.ToString()); 
     textBox2.Text = itemList.Count.ToString(); 
}

 

原理是:获得字符串中汉字的个数时,可以首先定义一个与汉字相匹配的正则表达式,然后使用CharEnumerator对象的MoveNext方法循环访问字符串中的每个字符,如果访问的字符与定义的正则表达式相匹配,则将其添加到一个数组中,最后获得该数组的项数即为字符串中汉字的个数。获得字符串中汉字个数.

相关文章

热门资讯

玄元剑仙肉身有什么用 玄元剑仙肉身境界等级划分
玄元剑仙肉身有什么用 玄元剑仙肉身境界等级划分 2019-06-21
男生常说24816是什么意思?女生说13579是什么意思?
男生常说24816是什么意思?女生说13579是什么意思? 2019-09-17
配置IIS网站web服务器的安全策略配置解决方案
配置IIS网站web服务器的安全策略配置解决方案 2019-05-23
Nginx服务器究竟是怎么执行PHP项目
Nginx服务器究竟是怎么执行PHP项目 2019-05-24
华为nova5pro和p30pro哪个好 华为nova5pro和华为p30pro对比详情
华为nova5pro和p30pro哪个好 华为nova5pro和华为p30pro对比详情 2019-06-22
返回顶部