本文实例讲述了php自定义中文字符串截取函数substr_for_gb2312及substr_for_utf8用法。分享给大家供大家参考,具体如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
|
/* *gb2312中文字符串截取 */ function substr_for_gb2312( $str , $start , $len =null) { $totlelength = strlen ( $str ); //特例情况 if ( $len == null) $len = $totlelength ; if ( $len ==0) return "" ; if ( $len >= $totlelength && $start == 0 ) return $str ; if ( $start > $totlelength ) return "" ; //分析$start if ( $start < 0 ) //$start<0时,转化为$start>0时的定位. { if ( abs ( $start ) >= $totlelength ) $start = 0; else $start = $totlelength - abs ( $start ); } //确定起始位置,当起始位拆分某汉字时,返回值包含此汉字. if ( $start > 0) { $i = $start -1; $flag = -1; while ( $i >= 0) { if ( ord( substr ( $str , $i ,1)) > 160) { $flag = -1* $flag ; } else break ; $i --; } if ( $flag ==1) { $start = $start - 1; $len ++; //保证不位移. } } $str = substr ( $str , $start ); //截除字符串$str的$start位前的字符 $totlelength = strlen ( $str ); //确定结束位置,当结束位拆分某汉字时,返回值不包含此汉字. if ( $len <0) $len = $totlelength - abs ( $len ); if ( $len <= 0) return "" ; $i =min( $len , $totlelength ); $i --; $flag = -1; while ( $i >= 0) { if (ord( substr ( $str , $i ,1))>160) { $flag =-1* $flag ; } else break ; $i --; } if ( $flag == 1) $len = $len -1; $subit = substr ( $str ,0, $len ); return $subit ; } /****************************************************************** * PHP截取UTF-8字符串,解决半字符问题。 * 英文、数字(半角)为1字节(8位),中文(全角)为3字节 * @return 取出的字符串, 当$len小于等于0时, 会返回整个字符串 * @param $str 源字符串 * $len 左边的子串的长度 ****************************************************************/ function substr_for_utf( $str , $len ) { for ( $i =0; $i < $len ; $i ++) { $temp_str = substr ( $str ,0,1); if (ord( $temp_str ) > 127) { $i ++; if ( $i < $len ) { $new_str []= substr ( $str ,0,3); $str = substr ( $str ,3); } } else { $new_str []= substr ( $str ,0,1); $str = substr ( $str ,1); } } return join( $new_str ); } ?> /*带start位置的utf8截取函数*/ function utf8_substr( $string , $start , $length ) { preg_match_all ('/[/x00-/x7F]|[/xC2-/xDF][/x80-/xBF]|[/xE0-/xEF][/x80-/xBF][/x80-/xBF]|[/xF0-/xF4][/x80-/xBF][/x80-/xBF][/x80-/x BF]/', $string , $rs ); $out = '' ; $size = count ( $rs [0]); $end = $start + $length ; if ( $end > $size ) { $end = $size ; } for ( $i = $start ; $i < $end ; $i ++) { $out .= $rs [0][ $i ]; } return $out ; } |
希望本文所述对大家PHP程序设计有所帮助。