新四季網

python開發經驗之談(5年Python功力)

2023-04-16 21:11:40 1

作者 | 寫代碼的明哥

來源 | Python編程時光

如何在運行狀態查看原始碼

查看函數的原始碼,我們通常會使用 IDE 來完成。

比如在 PyCharm 中,你可以 Ctrl 滑鼠點擊進入函數的原始碼。

那如果沒有 IDE 呢?

當我們想使用一個函數時,如何知道這個函數需要接收哪些參數呢?

當我們在使用函數時出現問題的時候,如何通過閱讀原始碼來排查問題所在呢?

這時候,我們可以使用 inspect 來代替 IDE 幫助你完成這些事:

# demo.pyimport inspectdef add(x, y):return x yprint("===================")print(inspect.getsource(add))

運行結果如下:

$ Python demo.py===================def add(x, y):return x y

如何關閉異常自動關聯上下文

當你在處理異常時,由於處理不當或者其他問題,再次拋出另一個異常時,往外拋出的異常也會攜帶原始的異常信息。

就像這樣子:

try:print(1 / 0)except Exception as exc:raise RuntimeError("Something bad happened")

從輸出可以看到兩個異常信息:

Traceback (most recent call last):File "demo.py", line 2, in print(1 / 0)ZeroDivisionError: division by zeroDuring handling of the above exception, another exception occurred:Traceback (most recent call last):File "demo.py", line 4, in raise RuntimeError("Something bad happened")RuntimeError: Something bad happened

如果在異常處理程序或 finally 塊中引發異常,默認情況下,異常機制會隱式工作會將先前的異常附加為新異常的 __context__屬性。這就是 Python 默認開啟的自動關聯異常上下文。

如果你想自己控制這個上下文,可以加個 from 關鍵字(from 語法會有個限制,就是第二個表達式必須是另一個異常類或實例。)來表明你的新異常是直接由哪個異常引起的。

try:print(1 / 0)except Exception as exc:raise RuntimeError("Something bad happened") from exc

輸出如下:

Traceback (most recent call last):File "demo.py", line 2, in print(1 / 0)ZeroDivisionError: division by zeroThe above exception was the direct cause of the following exception:Traceback (most recent call last):File "demo.py", line 4, in raise RuntimeError("Something bad happened") from excRuntimeError: Something bad happened

當然,你也可以通過 with_traceback 方法為異常設置上下文__context__屬性,這也能在 traceback 更好的顯示異常信息。

try:print(1 / 0)except Exception as exc:raise RuntimeError("bad thing").with_traceback(exc)

最後,如果我想徹底關閉這個自動關聯異常上下文的機制?有什麼辦法呢?

可以使用 raise...from None,從下面的例子上看,已經沒有了原始異常。

$ cat demo.pytry:print(1 / 0)except Exception as exc:raise RuntimeError("Something bad happened") from None$$ python demo.pyTraceback (most recent call last):File "demo.py", line 4, in raise RuntimeError("Something bad happened") from NoneRuntimeError: Something bad happened(PythonCodingTime)

最快查看包搜索路徑的方式

當你使用 import 導入一個包或模塊時,Python 會去一些目錄下查找,而這些目錄是有優先級順序的,正常人會使用 sys.path 查看。

>>> import sys>>> from pprint import pprint>>> pprint(sys.path)['','/usr/local/Python3.7/lib/python37.zip','/usr/local/Python3.7/lib/python3.7','/usr/local/Python3.7/lib/python3.7/lib-dynload','/home/wangbm/.local/lib/python3.7/site-packages','/usr/local/Python3.7/lib/python3.7/site-packages']>>>

那有沒有更快的方式呢?

我這有一種連console 模式都不用進入的方法呢!

你可能會想到這種,但這本質上與上面並無區別:

[wangbm@localhost ~]$ python -c "print('\n'.join(__import__('sys').path))"/usr/lib/python2.7/site-packages/pip-18.1-py2.7.egg/usr/lib/python2.7/site-packages/redis-3.0.1-py2.7.egg/usr/lib64/python27.zip/usr/lib64/python2.7/usr/lib64/python2.7/plat-linux2/usr/lib64/python2.7/lib-tk/usr/lib64/python2.7/lib-old/usr/lib64/python2.7/lib-dynload/home/wangbm/.local/lib/python2.7/site-packages/usr/lib64/python2.7/site-packages/usr/lib64/python2.7/site-packages/gtk-2.0/usr/lib/python2.7/site-packages

這裡我要介紹的是比上面兩種都方便得多的方法,一行命令即可解決。

[wangbm@localhost ~]$ python3 -m sitesys.path = ['/home/wangbm','/usr/local/Python3.7/lib/python37.zip','/usr/local/Python3.7/lib/python3.7','/usr/local/Python3.7/lib/python3.7/lib-dynload','/home/wangbm/.local/lib/python3.7/site-packages','/usr/local/Python3.7/lib/python3.7/site-packages',]USER_BASE: '/home/wangbm/.local' (exists)USER_SITE: '/home/wangbm/.local/lib/python3.7/site-packages' (exists)ENABLE_USER_SITE: True

從輸出你可以發現,這個列的路徑會比 sys.path 更全,它包含了用戶環境的目錄。

將嵌套 for 循環寫成單行

我們經常會如下這種嵌套的 for 循環代碼:

list1 = range(1,3)list2 = range(4,6)list3 = range(7,9)for item1 in list1:for item2 in list2:for item3 in list3:print(item1 item2 item3)

這裡僅僅是三個 for 循環,在實際編碼中,有可能會有更層。

這樣的代碼,可讀性非常的差,很多人不想這麼寫,可又沒有更好的寫法。

這裡介紹一種我常用的寫法,使用 itertools 這個庫來實現更優雅易讀的代碼。

from itertools import productlist1 = range(1,3)list2 = range(4,6)list3 = range(7,9)for item1,item2,item3 in product(list1, list2, list3):print(item1 item2 item3)

輸出如下:

$ python demo.py1213131413141415

如何使用 print 輸出日誌

初學者喜歡使用 print 來調試代碼,並記錄程序運行過程。

但是 print 只會將內容輸出到終端上,不能持久化到日誌文件中,並不利於問題的排查。

如果你熱衷於使用 print 來調試代碼(雖然這並不是最佳做法),記錄程序運行過程,那麼下面介紹的這個 print 用法,可能會對你有用。

Python 3 中的 print 作為一個函數,由於可以接收更多的參數,所以功能變為更加強大,指定一些參數可以將 print 的內容輸出到日誌文件中。

代碼如下:

>>> with open('test.log', mode='w') as f:... print('hello, python', file=f, flush=True)>>> exit$ cat test.loghello, python

如何快速計算函數運行時間

計算一個函數的運行時間,你可能會這樣子做:

import timestart = time.time# run the functionend = time.timeprint(end-start)

你看看你為了計算函數運行時間,寫了幾行代碼了。

有沒有一種方法可以更方便的計算這個運行時間呢?

有。

有一個內置模塊叫 timeit,使用它,只用一行代碼即可:

import timeimport timeitdef run_sleep(second):print(second)time.sleep(second)# 只用這一行print(timeit.timeit(lambda :run_sleep(2), number=5))

運行結果如下:

2222210.020059824

利用自帶的緩存機制提高效率

緩存是一種將定量數據加以保存,以備迎合後續獲取需求的處理方式,旨在加快數據獲取的速度。

數據的生成過程可能需要經過計算,規整,遠程獲取等操作,如果是同一份數據需要多次使用,每次都重新生成會大大浪費時間。所以,如果將計算或者遠程請求等操作獲得的數據緩存下來,會加快後續的數據獲取需求。

為了實現這個需求,Python 3.2 中給我們提供了一個機制,可以很方便的實現,而不需要你去寫這樣的邏輯代碼。

這個機制實現於 functool 模塊中的 lru_cache 裝飾器。

@functools.lru_cache(maxsize=None, typed=False)

參數解讀:

maxsize:最多可以緩存多少個此函數的調用結果,如果為None,則無限制,設置為 2 的冪時,性能最佳;

typed:若為 True,則不同參數類型的調用將分別緩存。

舉個例子:

from functools import lru_cache@lru_cache(None)def add(x, y):print("calculating: %s %s" % (x, y))return x yprint(add(1, 2))print(add(1, 2))print(add(2, 3))

輸出如下,可以看到第二次調用並沒有真正的執行函數體,而是直接返回緩存裡的結果:

calculating: 1 233calculating: 2 35

下面這個是經典的斐波那契數列,當你指定的 n 較大時,會存在大量的重複計算:

def fib(n):if n < 2:return nreturn fib(n - 2) fib(n - 1)

第六點介紹的 timeit,現在可以用它來測試一下到底可以提高多少的效率。

不使用 lru_cache 的情況下,運行時間 31 秒。

import timeitdef fib(n):if n < 2:return nreturn fib(n - 2) fib(n - 1)print(timeit.timeit(lambda :fib(40), number=1))# output: 31.2725698948

由於使用了 lru_cache 後,運行速度實在太快了,所以我將 n 值由 30 調到 500,可即使是這樣,運行時間也才 0.0004 秒。提高速度非常顯著。

import timeitfrom functools import lru_cache@lru_cache(None)def fib(n):if n < 2:return nreturn fib(n - 2) fib(n - 1)print(timeit.timeit(lambda :fib(500), number=1))# output: 0.0004921059880871326

在程序退出前執行代碼的技巧

使用 atexit 這個內置模塊,可以很方便的註冊退出函數。

不管你在哪個地方導致程序崩潰,都會執行那些你註冊過的函數。

示例如下:

如果clean函數有參數,那麼你可以不用裝飾器,而是直接調用atexit.register(clean_1, 參數1, 參數2, 參數3='xxx')。

可能你有其他方法可以處理這種需求,但肯定比上不使用 atexit 來得優雅,來得方便,並且它很容易擴展。

但是使用atexit 仍然有一些局限性,比如:

如果程序是被你沒有處理過的系統信號殺死的,那麼註冊的函數無法正常執行。

如果發生了嚴重的 Python 內部錯誤,你註冊的函數無法正常執行。

如果你手動調用了os._exit,你註冊的函數無法正常執行。

實現類似 defer 的延遲調用

在 Golang 中有一種延遲調用的機制,關鍵字是 defer,例如下面的示例:

import "fmt"func myfunc {fmt.Println("B")}func main {defer myfuncfmt.Println("A")}

輸出如下,myfunc 的調用會在函數返回前一步完成,即使你將 myfunc 的調用寫在函數的第一行,這就是延遲調用。

AB

那麼在 Python 中否有這種機制呢?

當然也有,只不過並沒有 Golang 這種簡便。

在 Python 可以使用上下文管理器達到這種效果:

import contextlibdef callback:print('B')with contextlib.ExitStack as stack:stack.callback(callback)print('A')

輸出如下:

AB

如何流式讀取數G超大文件

使用 with...open... 可以從一個文件中讀取數據,這是所有 Python 開發者都非常熟悉的操作。

但是如果你使用不當,也會帶來很大的麻煩。

比如當你使用了 read 函數,其實 Python 會將文件的內容一次性的全部載入內存中,如果文件有 10 個G甚至更多,那麼你的電腦就要消耗的內存非常巨大。

# 一次性讀取with open("big_file.txt", "r") as fp:content = fp.read

對於這個問題,你也許會想到使用 readline 去做一個生成器來逐行返回。

def read_from_file(filename):with open(filename, "r") as fp:yield fp.readline

可如果這個文件內容就一行呢,一行就 10個G,其實你還是會一次性讀取全部內容。

最優雅的解決方法是,在使用 read 方法時,指定每次只讀取固定大小的內容,比如下面的代碼中,每次只讀取 8kb 返回。

def read_from_file(filename, block_size = 1024 * 8):with open(filename, "r") as fp:while True:chunk = fp.read(block_size)if not chunk:breakyield chunk

上面的代碼,功能上已經沒有問題了,但是代碼看起來代碼還是有些臃腫。

藉助偏函數和 iter 函數可以優化一下代碼:

from functools import partialdef read_from_file(filename, block_size = 1024 * 8):with open(filename, "r") as fp:for chunk in iter(partial(fp.read, block_size), ""):yield chunk

☞架構的腐化是必然的!

☞騰訊雲 AI 在新基建領域下一盤什麼大棋

☞張一鳴是如何練就字節跳動的

☞性能超越最新序列推薦模型,華為諾亞方舟提出記憶增強的圖神經網絡

☞DevOps 在行動應用程式開發中扮演什麼角色?

☞穩定幣經濟:十大穩定幣簡史

,
同类文章
葬禮的夢想

葬禮的夢想

夢見葬禮,我得到了這個夢想,五個要素的五個要素,水火只好,主要名字在外面,職業生涯良好,一切都應該對待他人治療誠意,由於小,吉利的冬天夢想,秋天的夢是不吉利的
找到手機是什麼意思?

找到手機是什麼意思?

找到手機是什麼意思?五次選舉的五個要素是兩名士兵的跡象。與他溝通很好。這是非常財富,它擅長運作,職業是仙人的標誌。單身男人有這個夢想,主要生活可以有人幫忙
我不怎麼想?

我不怎麼想?

我做了什麼意味著看到米飯烹飪?我得到了這個夢想,五線的主要土壤,但是Tu Ke水是錢的跡象,職業生涯更加真誠。他真誠地誠實。這是豐富的,這是夏瑞的巨星
夢想你的意思是什麼?

夢想你的意思是什麼?

你是什​​麼意思夢想的夢想?夢想,主要木材的五個要素,水的跡象,主營業務,主營業務,案子應該抓住魅力,不能疏忽,春天夢想的吉利夢想夏天的夢想不幸。詢問學者夢想
拯救夢想

拯救夢想

拯救夢想什麼意思?你夢想著拯救人嗎?拯救人們的夢想有一個現實,也有夢想的主觀想像力,請參閱週宮官方網站拯救人民夢想的詳細解釋。夢想著敵人被拯救出來
2022愛方向和生日是在[質量個性]中

2022愛方向和生日是在[質量個性]中

[救生員]有人說,在出生88天之前,胎兒已經知道哪天的出生,如何有優質的個性,將走在什麼樣的愛情之旅,將與生活生活有什么生活。今天
夢想切割剪裁

夢想切割剪裁

夢想切割剪裁什麼意思?你夢想切你的手是好的嗎?夢想切割手工切割手有一個真正的影響和反應,也有夢想的主觀想像力。請參閱官方網站夢想的細節,以削減手
夢想著親人死了

夢想著親人死了

夢想著親人死了什麼意思?你夢想夢想你的親人死嗎?夢想有一個現實的影響和反應,還有夢想的主觀想像力,請參閱夢想世界夢想死亡的親屬的詳細解釋
夢想搶劫

夢想搶劫

夢想搶劫什麼意思?你夢想搶劫嗎?夢想著搶劫有一個現實的影響和反應,也有夢想的主觀想像力,請參閱週恭吉夢官方網站的詳細解釋。夢想搶劫
夢想缺乏缺乏紊亂

夢想缺乏缺乏紊亂

夢想缺乏缺乏紊亂什麼意思?你夢想缺乏異常藥物嗎?夢想缺乏現實世界的影響和現實,還有夢想的主觀想像,請看官方網站的夢想組織缺乏異常藥物。我覺得有些東西缺失了