日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術文章
文章詳情頁

淺談優化Django ORM中的性能問題

瀏覽:297日期:2024-09-27 15:08:10

Django是個好工具,使用的很廣泛。 在應用比較小的時候,會覺得它很快,但是隨著應用復雜和壯大,就顯得沒那么高效了。當你了解所用的Web框架一些內部機制之后,才能寫成比較高效的代碼。

怎么查問題

Web系統是個挺復雜的玩意,有時候有點無從下手哈。可以采用 自底向上 的順序,從數據存儲一直到數據展現,按照這個順序一點一點查找性能問題。

數據庫 (缺少索引/數據模型)

數據存儲接口 (ORM/低效的查詢)

展現/數據使用 (Views/報表等)

Web應用的大部分問題都會跟 數據庫 扯上關系。除非你正在處理大量的數據并知道你在做什么,否則不要去考慮用Big-O表示法思考View的問題。 數據庫調用的開銷將使循環和模板渲染的開銷相形見絀。 不首先解決數據庫使用中的問題,您就不能繼續解決其他問題。

Django的文檔中有那么一節,詳細的描述了DB部分優化, ORM 從一開始就應該寫的比較高效一些(畢竟有那么多最佳實踐)

優化,很多時候意味著代碼可能變得不太清晰。當你遇到選擇清晰的代碼,還是犧牲清晰代碼來獲取性能上的一點點提高的時候,請優先考慮要代碼的清晰整潔

工具

解決問題的第一步是找到問題,面對 ORM,有時間事情可以做。

理解 django.db.connection, 這個對象可以用來記錄當前查詢花費的時間(知道了SQL語句查詢的時間,當然就知道那里慢了)

>>> from django.db import connection>>> connection.queries[]>>> Author.objects.all()<QuerySet [<Author: Author object>]>>>> connection.queries[{u’time’: u’0.002’, u’sql’: u’SELECT 'library_author'.'id', 'library_author'.'name' FROM 'library_author' LIMIT 21’}]

但是使用起來好像不是很方面。

在shell命令行的環境下,可以使用 django-exension’s shell_plus 命令并打開 --print-sql 選項。

python manage.py shell_plus --print-sql>>> Author.objects.all()SELECT 'library_author'.'id', 'library_author'.'name' FROM 'library_author' LIMIT 21Execution time: 0.001393s [Database: default]<QuerySet [<Author: Author object>]>

還有個更方面的方式, 使用 Django-debug-toolbar 工具,就可以在web端查看SQL查詢的詳細統計結果,其實它功能遠不止這個。

總結下3個方式

django.db.connection django自身提供,比較底層

django-extensions 可以在shell環境下方面調試

django-debug-toolbar 可以在web端直接看到debug結果

案例

下面是用個具體的例子來說明一些問題

model 定義

很經典的外鍵關系, Author 和 Book 一對多的關系

class Author(models.Model): name = models.TextField()class Book(models.Model): title = models.TextField() author = models.ForeignKey( Author, on_delete=models.PROTECT, related_name=’books’, null=True )

多余的查詢

當你檢查一個book是否有author或者想獲取這本書的author 的id的時候,可能更傾向于直接使用 author 對象。

if book.author: do_stuff()# Ordo_stuff_with_author_id(book.author.id)

這里 author對象 其實并不需要(主要指第一行代碼,其實只需要author_id),會導致一次多余的查詢。 如果后面需要 author對象,在獲取也不沖突。 比較好的習慣是,直接使用字段名, 見下面的寫法。

if book.author_id: do_stuff()do_stuff_with_author_id(book.author_id)

count 和 exists

對于初學者, 知道什么時候使用 count 和 exists 還是挺難的。 Django會緩存查詢結果, 所以如果后續的操作會用到這些查詢出來的數據 ,可以使用 Python的內置方法(指的是len,if判斷queryset,下面例子)。如果不用查詢出的數據,使用queryset提供的方法(count(), exists())

# Don’t waste a query if you are using the querysetbooks = Book.objects.filter(..)if books: do_stuff_with_books(books)# If you aren’t using the queryset use existbooks = Book.objects.filter(..)if books.exists(): do_some_stuff()# But neverif Book.objects.filter(..): do_some_stuff()

下面是關于count 和 len 的例子

# Don’t waste a query if you are using the querysetbooks = Book.objects.filter(..)if len(books) > 5: do_stuff_with_books(books)# If you aren’t using the queryset use countbooks = Book.objects.filter(..)if books.count() > 5: do_some_stuff()# But neverif len(Book.objects.filter(..)) > 5: do_some_stuff()

只獲取需要的數據

默認情況下,ORM 查詢的時候會把數據庫記錄對應的所有列取出來,然后轉換成 Python對象,這無疑是個很大的浪費嘛(有時候只想要一兩個列的,寶寶心理��)。當你只需要某些列的時候可以使用 values 或者 values_list, 它們不是把數據轉換成復雜的 python 對象,而是dicts, tuples等。

# Retrieve values as a dictionary>>> Book.objects.values(’title’, ’author__name’)<QuerySet [{’author__name’: u’Nikolai Gogol’, ’title’: u’The Overcoat’}, {’author__name’: u’Leo Tolstoy’, ’title’: u’War and Peace’}]># Retrieve values as a tuple>>> Book.objects.values_list(’title’, ’author__name’)<QuerySet [(u’The Overcoat’, u’Nikolai Gogol’),(u’War and Peace’, u’Leo Tolstoy’)]>>>> Book.objects.values_list(’title’)<QuerySet [(u’The Overcoat’,), (u’War and Peace’,)]># With one value, it is easier to flatten the list>>> Book.objects.values_list(’title’, flat=True)<QuerySet [u’The Overcoat’, u’War and Peace’]>

處理很多記錄

當你獲得一個 queryset 的時候,Django會緩存這些數據。 如果你需要對查詢結果進行好幾次循環,這種緩存是有意義的,但是對于 queryset 只循環一次的情況,緩存就沒什么意義了。

for book in Books.objects.all():

do_stuff(book)

上面的查詢,django會把books所有的數據歐載入內存,然后進行一次循環。其實我們更想要保持這個數據庫 connection, 每次循環的取出一條book數據,然后調用 do_stuff。iterator 就是我們的救星。

for book in Books.objects.all().iterator():

do_stuff(book)

有了 iterator,你就可以編寫線性數據表或者CSV流了。就能增量寫入文件或者發送給用戶。

特別是跟 values,values_list 結合在一起的時候,能盡可能少的使用內存。在需要對表中的每一行進行修改的遷移期間,使用iterator也非常方便。 不能因為遷移不是面向客戶的就可以降低對效率的要求。 長時間運行的遷移可能意味著事務鎖定或停機。

關聯查詢問題

Django ORM的API使得我們使用關系型數據庫的時候就像使用面向對象的 Python 語言那樣自然。

# Get the Author’s name of a Bookbook = Book.objects.first()book.author.name

上面的代碼相當的清晰和好理解。Django 使用 lazy loading(懶加載)的方式,只有用到了 author 對象時候才會加載。這樣做有好處,但是會造成爆炸��式的查詢。

>>> Author.objects.count()20>>> Book.objects.count()100# This block is 101 queries.# 1 for the books and 1 for each author that lazy-loaded books = Book.objects.all()for book in books: do_stuff(book.title, book.author.name)# This block is 20 queries.# 1 for the author and 1 for the books of each authorauthors = Author.objects.all()for author in authors: do_stuff_with_books(author.name, author.books.all())

Django 意識到了這種問題,并提供 select_related 和 prefetch_related 來解決。

# This block is 1 query# The authors of all the books are pre-fetched in one querybook = Book.objects.selected_related(’author’).all()for book in books: do_stuff(book.title, book.author)# This block is 1 query# The books of all the authors are pre-fetched in one queryauthors = Author.objects.prefetch_related(’books’).all()for author in authors: do_stuff_with_books(author.name, author.books.all())

在Django app中使用 prefetch_related 和 select_related 的時候要謹慎。

prefetch_related 有個坑,當你像要在related查詢中使用 filter時候author.books.filter(..), 之前在 prefetch_related 中的緩存就無法使用了,相對于 author.books.all() 來說的。有些事情會變的復雜了,你最好2次查詢來解決這種問題,上級對象和它的子對象各一次,然后在進行聚合。 如果 prefetch太復雜了,這時候就要在代碼的整潔清晰和應用性能之間做一個取舍了。

最好是了解下 prefetch_related 和 select_related 的區別,文檔在這

select_related 不好用的時候

某些情況下 select_related 會變得不好使。 看看下面的例子,id() 方法用來判斷 Python 對象實例的唯一性,如果 id結果相同,表示同一個 對象實例。

>>> [(id(book.author), book.author.pk) for book in Book.objects.select_related(’author’)]

[(4504798608, 1), (4504799824, 1)]

select_related 為查詢的每個row,創建了一個新對象,耗費了大量的內存(上面的結果中,對于數據庫中的同一個author對象創建了不同的python對象)。SQL一會為每行返回重復的信息。 如果你進行一個查詢,其中select_related 查詢的所有值都是相同的,你就需要使用別的東西。 使用相關查詢或翻轉(flip)查詢并使用prefetch_related。

使用 author.books.all() 結合對象相關查詢,Django會為每個已經查詢的book記錄保存相同的author對象

>> id(author)4504693520>>> [(id(book.author), book.author.pk) for book in author.books.all()][(4504693520, 1), (4504693520, 1)]

使用 select_related 還有一個隱含問題,當你修改一個author 對象的時候,如果其他book也關聯到這個author,這個改變不會傳播過去,因為它們在python內存中是不同的對象實例。如果使用 對象相關查詢,修改就能傳播。

簡單不一定更好

Django使得關系查詢太容易了,這也帶來了一些副作用。當你將一個對象傳入函數中,接著使用了 relationship (對象關系), 實際上無法知道這種關聯的數據是否已經從數據庫取出來。

def author_name_length(book): return len(book.author.name)def process_author_books(author): for book in author.books.all(): do_stuff(book)

上面的函數中 author_name_length 和 process_author_books, 誰將會查詢? 我們無從所知。 Django ORM中的關聯查詢非常好用,我們自然希望使用這種方式。在一個循環中,如果不使用 select_related 或者 prefetch_related,可能會導致幾百個查詢。Django只會知道查詢,而不會多看一眼。這種情況只能依靠SQL的logs,還有函數調用來監控,然后確定是否進行預查詢。

我們可以重寫函數,參數的傳遞采用扁平的數據結構,類似 namedtuple, 而不是 model,但這種別考慮這種方案。

怎么修復?

我們已經知道了這個問題,那么怎樣拓展Django能讓我們更明確的知道資源的消耗呢。很多數據庫的封裝已經通過不同的方式解決了這個問題。在Ecto中,Elixir的數據庫封裝,一個沒有獲取數據的關系調用會返回 Ecto.Association.NotLoaded 提示,而不是默默的查詢。

我們可以想象Django的某個版本使用 pythonic 的方式實現了這種功能。

>>> book.author.nameTraceback (most recent call last):File '<console>', line 1, in <module>File '/Users/kyle/orm_test/library/models.py', line 18, in __get__’Use `select_related` or `fetch_{rel}`’.format(rel=self.field.name)RelationNotLoaded: Relation `author` not loaded. Use `select_related` or `fetch_author`# We explicitly fetch the resource>>> book.fetch_author()<Author: Author object>>>> book.author.name'Fyodor Dostoevsky'# Select related works just as well>>> book = Book.objects.select_related(’author’).first()>>> book.author.name'Anton Chekhov'

總結

ORM 的使用并沒有固定的標準。對于小的應用來說,優化可能并沒有多么明顯的效果。應該以代碼清晰為優先,然后在考慮優化的事情。程序增長過程中,對 ORM 的使用一定要保持好的習慣。養成對資源消耗敏感的習慣,以后會有很多好處。

優化的方法很多,對于長遠來說了解一些原則更為實用

習慣隔離代碼并記錄產生的查詢

不要在循環中查詢

了解 ORM 是怎么緩存數據的

知道 Django 何時會做查詢

不要以犧牲清晰度為代價過度優化

以上這篇淺談優化Django ORM中的性能問題就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持好吧啦網。

標簽: Django
相關文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
精品三区视频| 欧美日韩在线精品一区二区三区激情综合 | 国产一区二区三区精品在线观看| 精品伊人久久久| 天堂√8在线中文| 国产国产精品| 天堂久久一区| 久久精品一区二区国产| 92国产精品| 青青国产精品| 色天使综合视频| 亚洲三级网址| 亚洲伦乱视频| 国产精品日本一区二区三区在线 | 99久久亚洲精品蜜臀| 日韩影院在线观看| 国产精品videossex久久发布| 日韩大片在线| 视频一区中文字幕精品| 亚洲免费福利| 91国内精品| 日韩一区电影| 视频一区二区中文字幕| 国产精品视频一区二区三区综合| 成人va天堂| 亚洲三级观看| 成人影视亚洲图片在线| 免费精品视频| 亚洲精品日韩久久| 宅男在线一区| 精品国产aⅴ| 日本不卡一区二区三区| 午夜国产精品视频免费体验区| 色狠狠一区二区三区| 韩国精品主播一区二区在线观看 | 国产欧美日韩亚洲一区二区三区| 中文字幕系列一区| 国产精品第一国产精品| 99在线精品免费视频九九视 | 日本午夜精品一区二区三区电影| 久久婷婷av| 久久精品伊人| 国产精品地址| 亚洲狼人精品一区二区三区| 久久蜜桃资源一区二区老牛| 欧美精品不卡| 国产欧美在线| 美腿丝袜在线亚洲一区| 麻豆精品99| 久久av综合| 欧美偷窥清纯综合图区| 一区二区三区四区在线观看国产日韩 | 日韩精品1区2区3区| 成人av二区| 伊人久久高清| 福利片在线一区二区| 久久久91麻豆精品国产一区| 日韩av不卡在线观看| 久久精品99国产国产精| 欧美亚洲一区二区三区| 亚洲精品影院在线观看| 久久精品999| 91综合网人人| 欧美日韩中文字幕一区二区三区| 欧美日韩视频网站| 桃色av一区二区| 成人精品天堂一区二区三区| 久久精品国产久精国产爱| 久久xxx视频| 国产aⅴ精品一区二区四区| 久久亚洲资源中文字| 9999国产精品| 亚洲a在线视频| 中文字幕日本一区二区| 国产日韩欧美一区| 国产一区丝袜| 日韩中文首页| 国产美女精品| 精品国产美女a久久9999| 免费久久久久久久久| 午夜在线视频观看日韩17c| 亚洲人成高清| 高清在线一区| 日本伊人午夜精品| 蜜桃视频在线网站| 欧美成人亚洲| 欧美日韩一区二区三区四区在线观看| 精品福利久久久| 美女精品一区| 久久精品系列| 日本亚洲不卡| 亚洲综合在线电影| 麻豆精品久久| 午夜国产欧美理论在线播放 | 日韩精品欧美大片| 欧美三级精品| 日韩在线一二三区| 久久婷婷久久| 国产理论在线| 亚洲人亚洲人色久| 国产传媒av在线| 亚洲91网站| 日韩在线观看一区| 7777精品| 亚洲免费成人av在线| 国产精品99久久免费观看| 亚洲精品午夜av福利久久蜜桃| 国产精品xxx在线观看| 亚洲精品在线影院| 精品国产乱码久久久| 蜜臀av一区二区在线免费观看| 日本少妇一区| 国产欧美日韩亚洲一区二区三区| 亚洲人妖在线| 美国三级日本三级久久99 | 欧洲激情综合| 精品资源在线| 国产精品chinese| 青草国产精品| 91久久久精品国产| 美女网站视频一区| 日韩av一级| 日韩电影免费网址| 福利精品在线| 国产粉嫩在线观看| 精品一区二区三区免费看| 精品亚洲精品| 最新中文字幕在线播放| 国内不卡的一区二区三区中文字幕| 国产美女精品视频免费播放软件| 色综合视频一区二区三区日韩| 亚洲综合不卡| 野花国产精品入口| 羞羞答答国产精品www一本| 精品国产乱码久久久久久1区2匹| 精品少妇一区| 久久中文视频| 性色一区二区| 亚洲日本三级| 国产精品一区毛片| 国产不卡精品在线| 尤物在线精品| 免费观看在线色综合| 蜜桃久久精品一区二区| 国产免费久久| 久久一区亚洲| 成人亚洲精品| 欧美日韩四区| 久久国产免费看| 成人在线超碰| 婷婷成人基地| 国产精品美女午夜爽爽| 久久国产直播| 日韩精品亚洲专区| 成人三级高清视频在线看| 久久一级电影| 免费一区二区三区在线视频| 午夜宅男久久久| 久久精品免视看国产成人| 欧美女激情福利| 国产精品xvideos88| 国产精品久久观看| 天堂网av成人| 日本少妇一区| 亚洲午夜91| 欧美 日韩 国产精品免费观看| 香蕉久久夜色精品国产| 国产精品草草| 亚洲精品女人| 亚洲高清久久| 久久精品国产免费| 日韩亚洲精品在线观看| 欧洲激情综合| 激情欧美日韩一区| 国产精品一区二区精品视频观看| 欧美www视频在线观看| 亚洲精品国产日韩| 亚洲一区欧美二区| 国产精品99久久免费| 日韩视频网站在线观看| 亚洲精品极品少妇16p| 欧洲av一区二区| 久久av导航| 日本欧美一区二区在线观看| 91高清一区| 国产精品久久免费视频| 一区二区三区四区在线观看国产日韩| 国产高清不卡| 国产 日韩 欧美一区| 欧美日韩a区| 蜜桃久久久久久| 狠狠干成人综合网| 黄页网站一区| 欧美久久精品一级c片| 国产中文欧美日韩在线| 国产日韩欧美一区二区三区| 日韩精品第一| 91精品国产自产精品男人的天堂| 在线看片日韩| 日韩av三区|