详解Python 3.8的海象算子:大幅提高程序执行效率

2019 年 12 月 30 日 CVer

点击上方“CVer”,选择加"星标"或“置顶”

重磅干货,第一时间送达

本文转载自:机器之心
作者: Animesh Gaitonde  |   参与: Panda
前几个月发布的 Python 3.8 包含了一项重要的新功能,即海象算子。 如果合理运用,该算子能有效地提升 Python 程序的执行效率。 本文将对海象算子的作用和效果进行介绍,并会通过示例演示其使用方法和不适用的场景。 本文作者为软件工程师 Animesh Gaitonde。


自我开始学习 Python 以及利用它的能力以来,我就一直是这门编程语言的死忠粉。 Python 句法简单,易于掌握,而且有助于提升代码库的可读性和可维护性。 相比于 C、C++、Java 或 Ruby 等其它高级语言,使用 Python 实现一个算法所需的代码量能少 5 倍之多。
 
最近,Python 社区发布了该语言的 3.8 版本。 作为 Python 语法糖的爱好者,我探索了发布说明,关注到了其中一个独特的算子。 这个算子被称为「海象算子(Walrus Operator)」或「命名表达式算子(Named Expression operator)」,符号为「:=」。
 
海象算子
 
这个新算子(:=)能让我们为表达式中的一个变量赋值。 这个符号看起来颇有些类似于海象的眼睛和犬齿。
 
我们先来看看下面一段代码:
 

countries = [“India”, “USA”, “France”, “Germany”]if len(countries) < 5:     print ("Length of countries is " + len(countries))


在上面的代码段中,我们两次调用了函数 len()。 我们可以避免重复计算以提升可读性吗? 当然可以,我们可对这段代码进行如下改进:
 

country_size = len(countries)if country_size < 5:

  print ("Length of countries is " + country_size)

还有进一步改进的空间吗? 我们可以不用单独一行来给「country_size」赋值吗?
 
if country_size := len(countries) < 5 :
  print ("Length of countries is " + country_size)

这就是 Python 3.8 引入的海象算子的用武之地。 我们可以在 if 语句之中直接执行声明和赋值操作。 我们下面进一步探索该算子的能力。
 
代码行数与复杂度的平衡

先看看以下示例

powers = [get_count(), get_count()**2, get_count()**3]

def get_count():
  "Fetches count of records from a database"
多次调用一个高成本的函数
 
上面的示例是通过多次调用一个高成本的函数 get_count() 来填充一个列表。
 
有了海象算子的帮助,我们可以避免多次调用函数 get_count(),其具体的功能是将结果存储到一个变量中,然后我们可在后续的计算中复用同一个变量。 下面演示了海象算子的用法:
 
powers =[result:= get_count(), result**2, result**3]

def get_count():
  "Fetches count of records from a database"
 使用海象算子避免多次调用函数
 
从上面的例子可以看到,海象算子可以减少代码行数,让代码更可读,因此能简化代码审查人员的工作。 此外,这也能实现代码行数和代码复杂度的平衡。
 
解决理解低效的问题
 
employees = []
for id in employee_ids:
 employee = fetch_employee(id)
 if employee:
   employees.append(employee)
基于一个条件填充列表

上面的示例需要多次执行循环。 一开始,我们创建一个空列表,然后在 id 列表上迭代并通过检查结果是否有效来填充我们创建的列表。
 
我们可以简化上面的代码,将其浓缩为一行:
 
employees = [result for id in employee_ids if (result:= fetch_employee(id))]
使用海象算子避免低效理解
 
文件分块处理
 
在处理大文件时,我们会将文件分块读取。 每当读取一个分块时,都会检查它的值,并且该值也是 while 循环的终止条件。
 
chunk = file.read(256)

while chunk:
   process(chunk)
   chunk = file.read(256)

我们可以在 while 循环表达式中读取数据以及为要读取的数据赋值。 由此我们就能避免在 while 循环之外显式地声明变量。 如下示例:
 
while chunk := file.read(256) :

  process(chunk)

正则表达式匹配
 
正则表达式匹配是一个两步式过程。 第一步是检查是否有匹配,第二步是提取匹配的部分。
 
obj = re.match(info).group(1if re.match(info) else None
正则表达式匹配
 
从上面的代码可以观察到,我们在一次匹配中重复计算了 re.match(info)。 这会减慢该程序的执行速度,而且数据量越大减慢得越明显。 上面的代码可以重写为如下形式,从而避免重复计算:
 
obj = match.group(1if match:= re.match(info) else None
使用 := 的正则表达式匹配
 
不能使用海象算子的地方
 
为变量赋值
 
a = 5 # 有效
a := 5 # 无效
 
empty_list = [] # 有效
empty_list := [] # 无效

如上所示,我们不能使用 := 替代 =。 海象算子只能是一个表达式的一部分。
 
加法/减法赋值
 
a += 5 # 有效
a :+=5 # 无效

在 lambda 函数中为表达式赋值
 
(lambda: a:= 5# 无效
 lambda: (a := 5# 有效但无用
 (var := lambda5# 有效

PEP-572 及其争议
 
海象算子是作为 PEP-572(Python 改进提议)的一部分而引入的。 如果要为 Python 语言引入一项新功能,总是需要经由 PEP 来实现,而且必须得到 Python 的发明者 Guido van Rossum 或他选择的代表的批准。
 
围绕海象算子的争议非常多,而且由此引发的「战争」导致了 Python 之父 Guido van Rossum 告退,不再担任 Python 社区的终身仁慈独裁者(BDFL)。 海象算子的争议点有很多,下面是其中几个:
 
  • 句法变化问题:开发者们为 := 提议了多种替代方案,比如「表达式 -> NAME」、「NAME -> 表达式」、「{表达式} NAME」等等。少数人建议使用现有的关键字,其他人则使用了新的算子。

  • 后向兼容问题:这个特性无法向后兼容,也无法运行在之前的 Python 版本上。

  • 算子名称问题:人们建议不要使用「海象算子」这样的代号,而是使用「赋值算子」、「命名表达式算子」、「成为算子」等术语,以免人们不明白。


重磅!CVer-学术交流群已成立


扫码可添加CVer助手,可申请加入CVer大群和细分方向群,细分方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索等群。


一定要备注:研究方向+地点+学校/公司+昵称(如目标检测+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群

▲长按加群


▲长按关注我们

麻烦给我一个在看!

登录查看更多
0

相关内容

Python的3.0版本,常被称为Python 3000,或简称Py3k。相对于Python的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0在设计的时候没有考虑向下兼容。
Python图像处理,366页pdf,Image Operators Image Processing in Python
【2020新书】使用高级C# 提升你的编程技能,412页pdf
专知会员服务
56+阅读 · 2020年6月26日
专知会员服务
166+阅读 · 2020年6月4日
Python导论,476页pdf,现代Python计算
专知会员服务
254+阅读 · 2020年5月17日
Python分布式计算,171页pdf,Distributed Computing with Python
专知会员服务
105+阅读 · 2020年5月3日
【经典书】Python数据数据分析第二版,541页pdf
专知会员服务
189+阅读 · 2020年3月12日
Python 3.8.0来了!
数据派THU
5+阅读 · 2019年10月22日
PHP使用Redis实现订阅发布与批量发送短信
安全优佳
7+阅读 · 2019年5月5日
如何编写完美的 Python 命令行程序?
CSDN
5+阅读 · 2019年1月19日
Python3.8新特性概览
Python程序员
4+阅读 · 2018年12月8日
Python高级技巧:用一行代码减少一半内存占用
AI研习社
5+阅读 · 2018年11月28日
Python | Jupyter导出PDF,自定义脚本告别G安装包
程序人生
7+阅读 · 2018年7月17日
实战 | 用Python做图像处理(三)
七月在线实验室
15+阅读 · 2018年5月29日
用 Python 和 OpenCV 检测图片上的条形码
Python开发者
5+阅读 · 2018年1月20日
Talking-Heads Attention
Arxiv
15+阅读 · 2020年3月5日
Star-Transformer
Arxiv
5+阅读 · 2019年2月28日
Area Attention
Arxiv
5+阅读 · 2019年2月5日
Music Transformer
Arxiv
5+阅读 · 2018年12月12日
Arxiv
4+阅读 · 2018年10月31日
Arxiv
5+阅读 · 2018年3月28日
VIP会员
相关VIP内容
Python图像处理,366页pdf,Image Operators Image Processing in Python
【2020新书】使用高级C# 提升你的编程技能,412页pdf
专知会员服务
56+阅读 · 2020年6月26日
专知会员服务
166+阅读 · 2020年6月4日
Python导论,476页pdf,现代Python计算
专知会员服务
254+阅读 · 2020年5月17日
Python分布式计算,171页pdf,Distributed Computing with Python
专知会员服务
105+阅读 · 2020年5月3日
【经典书】Python数据数据分析第二版,541页pdf
专知会员服务
189+阅读 · 2020年3月12日
相关资讯
Python 3.8.0来了!
数据派THU
5+阅读 · 2019年10月22日
PHP使用Redis实现订阅发布与批量发送短信
安全优佳
7+阅读 · 2019年5月5日
如何编写完美的 Python 命令行程序?
CSDN
5+阅读 · 2019年1月19日
Python3.8新特性概览
Python程序员
4+阅读 · 2018年12月8日
Python高级技巧:用一行代码减少一半内存占用
AI研习社
5+阅读 · 2018年11月28日
Python | Jupyter导出PDF,自定义脚本告别G安装包
程序人生
7+阅读 · 2018年7月17日
实战 | 用Python做图像处理(三)
七月在线实验室
15+阅读 · 2018年5月29日
用 Python 和 OpenCV 检测图片上的条形码
Python开发者
5+阅读 · 2018年1月20日
相关论文
Talking-Heads Attention
Arxiv
15+阅读 · 2020年3月5日
Star-Transformer
Arxiv
5+阅读 · 2019年2月28日
Area Attention
Arxiv
5+阅读 · 2019年2月5日
Music Transformer
Arxiv
5+阅读 · 2018年12月12日
Arxiv
4+阅读 · 2018年10月31日
Arxiv
5+阅读 · 2018年3月28日
Top
微信扫码咨询专知VIP会员