问题:
例如我们要选从不同省份选取一个号码,每个省份的权重不一样,直接选随机数肯定是不行的了,就需要一个模型来解决这个问题。
简化成下面的问题:
字典的key代表是省份,value代表的是权重,我们现在需要一个函数,每次基于权重选择一个省份出来
{"A":2, "B":2, "C":4, "D":10, "E": 20}
解决:
这是能想到和能看到的最多的版本,不知道还没有更高效好用的算法。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
|
#!/usr/bin/env python # -*- coding: utf-8 -*- #python2.7x #random_weight.py #author: orangleliu@gmail.com 2014-10-11 ''''' 每个元素都有权重,然后根据权重随机取值 输入 {"A":2, "B":2, "C":4, "D":10, "E": 20} 输出一个值 ''' import random import collections as coll data = { "A" : 2 , "B" : 2 , "C" : 4 , "D" : 6 , "E" : 11 } #第一种 根据元素权重值 "A"*2 ..等,把每个元素取权重个元素放到一个数组中,然后最数组下标取随机数得到权重 def list_method(): all_data = [] for v, w in data.items(): temp = [] for i in range (w): temp.append(v) all_data.extend(temp) n = random.randint( 0 , len (all_data) - 1 ) return all_data[n] #第二种 也是要计算出权重总和,取出一个随机数,遍历所有元素,把权重相加sum,当sum大于等于随机数字的时候停止,取出当前的元组 def iter_method(): total = sum (data.values()) rad = random.randint( 1 ,total) cur_total = 0 res = "" for k, v in data.items(): cur_total + = v if rad< = cur_total: res = k break return res def test(method): dict_num = coll.defaultdict( int ) for i in range ( 100 ): dict_num[ eval (method)] + = 1 for i,j in dict_num.items(): print i, j if __name__ = = "__main__" : test( "list_method()" ) print "-" * 50 test( "iter_method()" ) |
一次执行的结果
1
2
3
4
5
6
7
8
9
10
11
|
A 4 C 14 B 7 E 44 D 31 -------------------------------------------------- A 8 C 16 B 6 E 43 D 27 |
思路:
思路都很原始可以参考下面的连接,还有别的好方法一起交流!!
代码: https://gist.github.com/orangle/d83bec8984d0b4293710