服务器之家

服务器之家 > 正文

python处理“&#”开头加数字的html字符方法

时间:2021-07-03 00:33     来源/作者:脚本之家

python如何处理“&#”开头加数字的html字符,比如:风水这类数据。

用python抓取数据时,有时会遇到想要数据是以“&#”开头加数字的字符,比如图中所示的这些:

?
1
风水大术士

 

python处理“&#”开头加数字的html字符方法

python处理“&#”开头加数字的html字符方法

这些字符需要再次转换才能变回中文内容。这些字符需要再次转换才能变回中文内容。

python2.7版本

在python2.7版本中,使用import htmlparser

python处理“&#”开头加数字的html字符方法

定义变量,再定义转换代码。

python处理“&#”开头加数字的html字符方法

代码中最重要的是“data_parser = htmlparser.htmlparser()”,通过此才能用“.unescape()”方法。 

python处理“&#”开头加数字的html字符方法

测试运行,这串字符串正常输出了中文。

python处理“&#”开头加数字的html字符方法

python3.7+版本

在最新python版本中,不能用上面的导入方法。可以用"import html"或者“from html import unescape”。这里使用"import html"做测试。

python处理“&#”开头加数字的html字符方法

导入html后,直接用".unescape()"来处理字符串。

python处理“&#”开头加数字的html字符方法

运行后,正常转换成了中文字符。

python处理“&#”开头加数字的html字符方法

感谢大家的阅读和对服务器之家的支持。

标签:

相关文章

热门资讯

2020微信伤感网名听哭了 让对方看到心疼的伤感网名大全
2020微信伤感网名听哭了 让对方看到心疼的伤感网名大全 2019-12-26
yue是什么意思 网络流行语yue了是什么梗
yue是什么意思 网络流行语yue了是什么梗 2020-10-11
背刺什么意思 网络词语背刺是什么梗
背刺什么意思 网络词语背刺是什么梗 2020-05-22
苹果12mini价格表官网报价 iPhone12mini全版本价格汇总
苹果12mini价格表官网报价 iPhone12mini全版本价格汇总 2020-11-13
2021德云社封箱演出完整版 2021年德云社封箱演出在线看
2021德云社封箱演出完整版 2021年德云社封箱演出在线看 2021-03-15
返回顶部