本文实例讲述了Python抓取百度查询结果的方法。分享给大家供大家参考。具体实现方法如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
|
#win python 2.7.x import re,sys,urllib,codecs xh = urllib.urlopen( "http://www.baidu.com/s?q1=123&rn=100" ).read().decode( 'utf-8' ) rc = re. compile (r '<td class=f><h3 class="t"><a.*?>(?P<first>.*?)</h3>' ,re.I) match = rc.finditer(xh) rcr = re. compile (r '<[^>]+>' ,re.I) f = codecs. open ( "xiaohei.txt" , "w" , "utf-8" ) for i in rc.finditer(xh): ss = i.group( 0 ) s1 = rcr.sub('',ss) print (s1) f.write(s1) f.close() |
希望本文所述对大家的Python程序设计有所帮助。