服务器之家

服务器之家 > 正文

Python语法分析之字符串格式化

时间:2021-07-12 00:09     来源/作者:TinyDolphin

前序

there should be one - and preferably only one - obvious way to do it.
———— the zen of python
意译:python提倡用一种,而且最好是只有一种方法来完成一件事

虽然 python 有以上的提倡,但却在字符串格式化方面,没有做到这一点。

字符串格式化

敲黑板,划重点:在 python 中有至少三种常见方式实现字符串格式化:

  1. %-formatting 格式(python2.6以前,推荐输出时使用)
  2. str.format() 格式(python2.6,推荐字符串拼接使用)
  3. f-string 格式(python3.6,推荐使用)

1、printf 风格的字符串格式化(%-formatting 格式)

python2.6 之前只有这一种方式,使用与 c 中 printf 函数一样的语法。

基础语法:format % value(其中 format 为一个字符串),在 format 中的 % 转换标记符将被替换为零个或者多个 value 条目

基础用法

?
1
2
3
4
5
6
7
8
9
10
11
# coding in python3.7
print('this is %s blog written in %d%%%02d%%%d %02d:%d:%06.2f'
  % ('tinydolphin', 2019, 5, 31, 9, 30, 22.3333))
# this is tinydolphin blog written in 2019%05%31 09:30:022.33
 
print('title=%(title)s, author=%(name)s'
  % {'name': 'tinydolphin', 'title': 'python 语法浅析:字符串格式化'})
# python" id="highlighter_576089">
?
1
2
3
4
5
6
7
8
9
'{0}-{1}-{2}'.format('a', 'b', 'c')   # 'a-b-c'
'{}-{}-{}'.format('a', 'b', 'c')    # 'a-b-c'
'{2}-{1}-{0}'.format('a', 'b', 'c')   # 'c-b-a'
'{2}-{1}-{0}'.format(*'abc')      # 'c-b-a'
 
args = ['a', 'b', 'c']
'{2}-{1}-{0}'.format(*args)       # 'c-b-a'
 
'{0}-{1}-{0}'.format(*['abc', 'def'])  # 'abc-def-abc'

2、按名称访问参数

?
1
2
3
4
'{a}-{b}'.format(a='1', b='2')     # '1-2'
 
kwargs = {'a':'1', 'b':'2'}
'{a}-{b}'.format(**kwargs)       # '1-2'

3、访问参数的属性

?
1
2
3
4
5
6
7
class point:
  def __init__(self, x, y):
    self.x, self.y = x, y
  def __str__(self):
    return 'point({self.x}, {self.y})'.format(self=self)
    
str(point(3, 4))            # 'point(3, 4)'

4、访问参数的项

?
1
2
point = (3, 5)
'x:{0[0]} y:{0[1]}'.format(point)    # 'x:3 y:5'

5、替代 %s 和 %r (!s、!r)

?
1
'str() = {!s}; repr() = {!r}'.format('a', 'a') # "str() = a; repr() = 'a'"

6、对齐文本以及制定宽度(:<、:^、:>)

?
1
2
3
4
5
'{:<20}'.format('left aligned')     # 'left aligned    '
'{:>20}'.format('right aligned')    # '    right aligned'
'{:^20}'.format('centered')       # '   centered   '
# 使用 '*' 作为填充字符
'{:*^20}'.format('centered')      # '******centered******'

7、替代 %+f、%-f 和 %f 以及指定正负号(:+、:-、:)

?
1
2
3
'{:+f} {:+f}'.format(3.14, -3.14)    # '+3.140000 -3.140000'
'{: f} {: f}'.format(3.14, -3.14)    # ' 3.140000 -3.140000' 正号—>空格
'{:-f} {:-f}'.format(3.14, -3.14)    # '3.140000 -3.140000' == '{:f} {:f}'

8、替换 %x 和 %o 以及转换基于不同进位制的值(:x、:d、:o、:b)

?
1
2
3
4
5
'int:{0:d} hex:{0:x} oct:{0:o} bin:{0:b}'.format(42)
# 'int:42 hex:2a oct:52 bin:101010'
'int:{0:d} hex:{0:#x} oct:{0:#o} bin:{0:#b}'.format(42)
# 'int:42 hex:0x2a oct:0o52 bin:0b101010'
# '#' : 加上前缀:0x、0o、0b

9、使用逗号作为千位分隔符(:,)

?
1
'{:,}'.format(123456789)        # '123,456,789'

10、表示为百分数(:.2%)

?
1
'{:.2%}'.format(19/22)         # '86.36%'

11、使用特定类型的专属格式化

?
1
2
3
4
import datetime
d = datetime.datetime(2019, 6, 10, 22, 5, 13)
'{:%y-%m-%d %h:%m:%s}'.format(d)
# '2019-06-10 22:05:13'

12、嵌套参数以及更复杂的示例

3、格式化字符串字面值(f-string 格式)

是带有 'f' 或 'f' 前缀的字符串字面值。

花括号以外的部分按其字面值处理,除了双重花括号 '{{' 或 '}}' 会被替换为相应的单个花括号。

语法如下:

单个花括号 '{',标示一个替换字段(以 python 表达式打头)
 + 可能有一个以叹号 '!' 标示的转换字符
 + 可能有一个以冒号 ':' 标示的格式说明符
 + 以一个右花括号 '}' 作为结束

注意:格式化字符串字面值中的表达式:

  • 当作正常的 python 表达式处理 (这一点很重要,也很强大)
  • 不允许空表达式
  • lambda 表达式必须显式地加上圆括号
  • 可以包含换行(例如三引号字符串中)
  • 不能包含注释
  • 从左到右被求值

如果指定了转换符,则表达式求值的结果会先转换再格式化。之后使用 python 内置函数 format() 进行格式化。

基本用法

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
name = 'tinydolphin'
f'my name is {name}'      # 'my name is tinydolphin'
f'my name is {name!r}'     # "my name is 'tinydolphin'"
 
width = 10
precision = 4
value = 12.34567
f'{value:{width}.{precision}}' # '   12.35'
 
today = datetime.datetime(year=2019, month=6, day=10)
f'{today:%b %d, %y}'      # 'june 10, 2019'
 
number = 1024
f'{number:#0x}'         # '0x400'

ps:与 str.format() 有一点不同:在 str.format() 中,非数字索引将自动转化为字符串,而f-strings则不会。

?
1
2
3
4
5
6
7
8
9
10
11
12
kwargs = {'a':1, 'b':2}
# 使用 str.format()
'a={kwargs[a]}'.format(kwargs=kwargs)  # 'a=1'
 
# 使用 f-string
f"a={kwargs[a]}"            # × 发生异常
traceback (most recent call last):
 file "<stdin>", line 1, in <module>
nameerror: name 'a' is not defined
 
# 正确使用 f-string
f"a={kwargs['a']}"           # 'a=1'

总结

从以下三个方面进行对比:

速度上:f-string > %-formatting > str.format()
功能上:f-string > str.format() > %-formatting
可读性: f-string > str.format() > %-formatting

对于速度验证,笔者就不在此进行验证了。

推荐使用场景:

%-formatting:python2 中,由于其性能优势,在涉及输出的一些操作时,优先推荐使用
str.format():python2 中,由于其功能优势,在涉及字符串拼接的一些操作时,优先推荐使用
f-string:    python3 中,强烈推荐使用

好了,以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对服务器之家的支持。

原文链接:https://juejin.im/post/5cfe7e74e51d45106172109c

相关文章

热门资讯

返回顶部