|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
本帖最后由 元豪 于 2023-4-9 07:02 编辑
Python作为2019年必备语言之一,展现了不可替代作用。对于所有的数据科学工作者,如何提高使用Python的效率,这里,总结了30种Python的最佳实践、技巧和窍门。希望这些可以帮助大家在2020年提高工作的效率,并且在此过程中学习到一些有用的东西。
1. 使用Python 3
Python官方宣布:从2020年1月1日起,正式不支持Python 2。本文有一堆的例子,只能在Python 3工作。如果你的版本还是Python 2.7版,赶紧升级到Python 3.x吧。
2.检查所需的最低Python版本
大家可以在代码中检查Python版本,以确保没有使用不兼容的版本运行脚本。使用以下简单检查:
import sys# 检查python版本,如果是低于3.5就退出程序
def check_version():
v = sys.version_info # print(v) # sys.version_info(major=3, minor=6, micro=5, releaselevel='final', serial=0) if v.major == 3 and v.minor >= 5: return print('Your current python is %d.%d. Please use Python 3.6.' % (v.major, v.minor)) exit(1)
3.使用IPython
IPython是一个增强的shell工具。可以进行代码自动补全,其实还有很多命令,我也喜欢内置的所有magic命令。比如:
%cd —更改当前工作目录
%edit —打开编辑器并在关闭编辑器后执行键入的代码
%env —显示当前环境变量
%time和%timeit—定时执行Python代码
另一个有用的功能是引用先前命令的输出。输入和输出是实际对象。你可以通过使用Out[3]来使用第三个命令的输出。
使用以下命令安装IPython:
pip3 install ipython
4.列表(list)理解
列表(list)理解可以代替丑陋的for循环来填充列表。列表理解的基本语法为:[ expression for item in list if conditional ]
一个非常简单的示例,用数字序列填充列表:
[i for i in range(10)]
并且因为可以使用表达式,所以还可以进行一些数学运算,甚至调用外部函数。
最后,你可以使用if筛选列表。在这种情况下,我们仅保留可被2整除的值:
[i for i in range(10) if i%2==0]
5.检查对象的内存使用情况
使用sys.getsizeof(),你可以检查对象的内存使用情况。
6.返回多个值
Python中的函数可以返回多个变量,而无需字典,列表或类。
对于有限数量的返回值,这是可以的。但是超过3个值的任何内容都应放入类中。
7.使用data类
从Python 3.7版开始,Python提供data类。与常规类或其他替代方法(如返回多个值或字典)相比,它具有多个优点:
数据类需要最少的代码
你可以比较data类,因为它__eq__已为您实现
你也可以轻松打印数据类以进行调试,因为它__repr__也已实现
data类需要类型提示,从而减少了发生错误的机会
8.就地变量交换
一项巧妙的小技巧,可以节省几行代码。
a,b = b,a
9.合并字典(Python 3.5+)
从Python 3.5开始,合并字典变得更加容易:
如果键(key)重叠,则第一个词典中的键(key)将被覆盖。
10.首字母大小写
使用capitalize()函数将字符串的首字母转为大写,其余变为小写。
"welcome".capitalize()
11.将字符串拆分为列表
你可以将字符串拆分为字符串列表。在这种情况下,我们分割空格字符:
list("welcome")
12.从字符串列表创建一个字符串
反之亦然,从上一个技巧开始,从列表中创建一个字符串,并在每个单词之间添加一个空格字符:
" ".join(['2','0','2','0'])
13.表情符号
表情
这将使人印象深刻或被排斥,这取决于谁在寻找。更严重的是,这可以派上用场,尤其是在分析社交媒体数据时。
首先,安装表情符号模块:
pip3 install emoji
安装此程序后,您可以执行以下操作:
访问emoji库页面(https://pypi.org/project/emoji/)以获取更多示例和文档。
14.列表(list)切片
列表切片的基本语法是:a[start:stop:step]
start,stop和step是可选的。如果不填写,则默认为:
0为 start
字符串的结尾 end
step默认为1
这里有些例子:
a=[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]a[2:5:2]15.反转字符串和列表
你可以从上方使用切片符号来反转字符串或列表。通过使用step=-1,将元素反转:a[::-1]
16.展示小猫
我终于找到了一个很好的借口,可以在其中一篇文章中展示小猫了!但是,可能会使用它来显示图形等。首先,安装Pillow(https://pypi.org/project/Pillow/),它是Python图像库的一个分支:
pip3 install Pillow
现在,将该图像下载到一个名为“ kitchess.jpg”的文件中:
你可以直接从IPython进行操作:
小猫
Pillow不仅可以显示图像,还可以做更多的事情。它可以分析,调整大小,过滤,增强,变形等。有关所有功能,请参阅文档(https://pillow.readthedocs.io/en/stable/)。
17.使用map()
Python的内置函数之一称为map()。map()的语法为:
map(function, something_iterable)
因此,你给它提供了要执行的功能以及要执行的某些功能。这可以是任何可迭代的事情。在下面的示例中,我将使用一个列表a=[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]。
list(map(lambda x: x+1,a))看一下自己的代码,看看是否可以map()在某处使用而不是循环!
18.从列表或字符串中获取唯一元素
通过使用set()函数创建一个集合,你可以从列表或类似列表的对象中a=[1,1,2,3,4,4]获取所有唯一元素。
set(a)19.查找最常出现的值
要在列表或字符串中查找最频繁出现的值:
test=[1,1,2,3,4,4,4,4]您知道这为何有效吗?在继续阅读之前,请先自己弄清楚。您没有尝试,对吗?无论如何,我会告诉你:
max()将返回列表中的最大值。该key参数采用单个参数函数来自定义排序顺序,在本例中为test.count。该函数应用于迭代器上的每个项目。
test.count是list的内置函数。它接受一个参数,并将计算该参数的出现次数。因此test.count(1)将返回2,test.count(4)返回4。
set(test) 返回测试的所有唯一值,因此{1、2、3、4} 因此,我们在单行代码中所做的就是获取test的所有唯一值,即{1, 2, 3, 4}。接下来,max将list.count函数应用到它们并返回最大值。
20.创建一个进度条
你可以创建自己的进度条,这很有趣。但是使用进度包更快:
pip3 install progress
现在,你可以轻松创建进度条。
以下动画演示了所有可用的进度类型(动画显示可查看官网):
21.在交互式shell使用_
你可以使用下划线运算符获取最后一个表达式的结果,例如在IPython中,它看起来像:
In [1]: 3 * 3Out[1]: 9In [2]: _ + 3Out[2]: 12这也可以在Python Shell中使用。此外,IPython shell允许使用Out[n]来获得表达式在In [n]中的值例如,Out[1]在上面的示例中,_可以得到数字9。
22.快速创建Web服务器
你可以快速启动Web服务器,以提供当前目录的内容:
python3 -m http.server
如果你想与同事共享一些东西或想要测试一个简单的HTML网站,这将很有用。
23.多行字符串
尽管可以在代码中使用三引号将多行字符串包括在内,但这并不理想。放在三引号之间的所有内容都将成为字符串,包括格式,如下所示。我更喜欢第二种方法,该方法将多行连接在一起,可以很好地格式化代码。唯一的缺点是你需要显式添加换行符。
24.三元运算符,用于条件赋值
这是使代码更简洁同时又保持可读性的另一种方法:
[on_true] if [expression] else [on_false]
举个例子:
x = "Success!" if (y == 2) else "Failed!"25.计数
您可以使用集合库中的Counter来获取包含列表中所有唯一元素计数的字典:
from collections import Countera=[1, 1, 2, 3, 4, 4]Counter(a)26.比较运算符的链接
您可以在Python中链接比较运算符,以创建更易读和简洁的代码:
27.添加一些颜色
使用Colorama(https://pypi.org/project/colorama/),你可以为终端添加一些颜色。
28.处理日期
python-dateutil模块(https://pypi.org/project/python-dateutil/)提供了对标准datetime模块的强大扩展。通过以下方式安装:
pip3 install python-dateutil
你可以用这个库做很多很酷的事情。我将把示例限制在我认为特别有用的一个:日志文件中日期的模糊解析等。
只需记住:常规的Python日期时间功能在哪里结束,python-dateutil就出现了!
29.整数除法
在Python 2中,除法运算符(/)默认为整数除法,除非操作数之一是浮点数。因此,你有以下行为:
#Python 2 5/2 = 2 5 / 2.0 = 2.5在Python 3中,除法运算符默认为浮点除法,并且//运算符已成为整数除法。这样我们得到:
#Python 3 5/2 = 2.5 5 // 2 = 2有关此更改背后的全部动机,您应该阅读PEP-0238(https://www.python.org/dev/peps/pep-0238/)。
30.使用chardet进行字符集检测
您可以使用chardet模块来检测文件的字符集。在分析大量随机文本时,这很有用。安装方式:
pip install chardet
现在你有了一个名为chardetect的额外命令行工具,它可以像这样使用
chardetect somefile.txtsomefile.txt: ascii with confidence 1.0你还可以通过编程方式使用该库,请查阅docs(https://chardet.readthedocs.io/en/latest/usage.html)。
新的一年开始的30条Python技巧和窍门。我希望大家喜欢它们。如果有任何问题,请随时发表评论!
-----------------------------------------------------------------------
原作者 : AI科技大本营
原文链接 : https://baijiahao.baidu.com/s?id=1658977577917416998
|
|