本文实例讲述了PHP字典树(Trie树)定义与实现方法。分享给大家供大家参考,具体如下:
Trie树的概念(百度的解释):字典树又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希树高。
我的理解是用来做字符串搜索的,每个节点只包含一个字符,比如录入单词"world",则树的结构是:
这时再录入单词"worab",则树的结构为:
所以每个节点必须还要一个字段is_end标识是否为结束单词。比如用户输入wor,搜索所有wor开头的单词,假设现在有一个单词就是wor,从"w"开始检索,当检索到"r"的时候需要判断"r"节点的is_end为true,则把wor加入到结果列表,然后继续往下面检索。
PHP实现代码:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
|
<?php class Node{ public $value ; // 节点值 public $is_end = false; // 是否为结束--是否为某个单词的结束节点 public $childNode = array (); // 子节点 /* 添加孩子节点--注意:可以不为引用函数,因为PHP对象赋值本身就是引用赋值 */ public function &addChildNode( $value , $is_end = false){ $node = $this ->searchChildNode( $value ); if ( empty ( $node )){ // 不存在节点,添加为子节点 $node = new Node(); $node ->value = $value ; $this ->childNode[] = $node ; } $node ->is_end = $is_end ; return $node ; } /* 查询子节点 */ public function searchChildNode( $value ){ foreach ( $this ->childNode as $k => $v ) { if ( $v ->value == $value ){ // 存在节点,返回该节点 return $this ->childNode[ $k ]; } } return false; } } /* 添加字符串 */ function addString(& $head , $str ){ $node = null; for ( $i =0; $i < strlen ( $str ); $i ++) { if ( $str [ $i ] != ' ' ){ $is_end = $i != ( strlen ( $str ) - 1) ? false : true; if ( $i == 0){ $node = $head ->addChildNode( $str [ $i ], $is_end ); } else { $node = $node ->addChildNode( $str [ $i ], $is_end ); } } } } /* 获取所有字符串--递归 */ function getChildString( $node , $str_array = array (), $str = '' ){ if ( $node ->is_end == true){ $str_array [] = $str ; } if ( empty ( $node ->childNode)){ return $str_array ; } else { foreach ( $node ->childNode as $k => $v ) { $str_array = getChildString( $v , $str_array , $str . $v ->value); } return $str_array ; } } /* 搜索 */ function searchString( $node , $str ){ for ( $i =0; $i < strlen ( $str ); $i ++) { if ( $str [ $i ] != ' ' ){ $node = $node ->searchChildNode( $str [ $i ]); // print_r($node); if ( empty ( $node )){ // 不存在返回空 return false; } } } return getChildString( $node ); } /* 调用测试开始 */ $head = new Node; // 树的head // 添加单词 addString( $head , 'hewol' ); addString( $head , 'hemy' ); addString( $head , 'heml' ); addString( $head , 'you' ); addString( $head , 'yo' ); // 获取所有单词 $str_array = getChildString( $head ); // 搜索 $search_array = searchString( $head , 'hem' ); // 循环打印所有搜索结果 foreach ( $search_array as $key => $value ) { echo 'hem' . $value . '<br>' ; // 输出带上搜索前缀 } |
希望本文所述对大家PHP程序设计有所帮助。
原文链接:http://blog.csdn.net/mxdzchallpp/article/details/51684090