日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術文章
文章詳情頁

Java系統運行緩慢等問題的排查思路

瀏覽:175日期:2022-08-13 18:58:54
前言

處理過線上問題的同學基本上都會遇到系統突然運行緩慢,CPU 100%,以及Full GC次數過多的問題。當然,這些問題的最終導致的直觀現象就是系統運行緩慢,并且有大量的報警。

本文主要針對系統運行緩慢這一問題,提供該問題的排查思路,從而定位出問題的代碼點,進而提供解決該問題的思路。

對于線上系統突然產生的運行緩慢問題,如果該問題導致線上系統不可用,那么首先需要做的就是,導出jstack和內存信息,然后重啟系統,盡快保證系統的可用性。這種情況可能的原因主要有兩種:

代碼中某個位置讀取數據量較大,導致系統內存耗盡,從而導致Full GC次數過多,系統緩慢; 代碼中有比較耗CPU的操作,導致CPU過高,系統運行緩慢;

相對來說,這是出現頻率最高的兩種線上問題,而且它們會直接導致系統不可用。另外有幾種情況也會導致某個功能運行緩慢,但是不至于導致系統不可用:

代碼某個位置有阻塞性的操作,導致該功能調用整體比較耗時,但出現是比較隨機的; 某個線程由于某種原因而進入WAITING狀態,此時該功能整體不可用,但是無法復現; 由于鎖使用不當,導致多個線程進入死鎖狀態,從而導致系統整體比較緩慢。

對于這三種情況,通過查看CPU和系統內存情況是無法查看出具體問題的,因為它們相對來說都是具有一定阻塞性操作,CPU和系統內存使用情況都不高,但是功能卻很慢。下面我們就通過查看系統日志來一步一步甄別上述幾種問題。

Full GC次數過多

相對來說,這種情況是最容易出現的,尤其是新功能上線時。對于Full GC較多的情況,其主要有如下兩個特征:

線上多個線程的CPU都超過了100%,通過jstack命令可以看到這些線程主要是垃圾回收線程通過jstat命令監控GC情況,可以看到Full GC次數非常多,并且次數在不斷增加。

首先我們可以使用top命令查看系統CPU的占用情況,如下是系統CPU較高的一個示例:

top - 08:31:10 up 30 min,  0 users,  load average: 0.73, 0.58, 0.34

KiB Mem:   2046460 total,  1923864 used,   122596 free,    14388 buffers

KiB Swap:  1048572 total,        0 used,  1048572 free.  1192352 cached Mem

PID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND

可以看到,有一個Java程序此時CPU占用量達到了98.8%,此時我們可以復制該進程id9,并且使用如下命令查看呢該進程的各個線程運行情況:

top -Hp 9

該進程下的各個線程運行情況如下:

top - 08:31:16 up 30 min,  0 users,  load average: 0.75, 0.59, 0.35

Threads:  11 total,   1 running,  10 sleeping,   0 stopped,   0 zombie

%Cpu(s):  3.5 us,  0.6 sy,  0.0 ni, 95.9 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st

KiB Mem:   2046460 total,  1924856 used,   121604 free,    14396 buffers

KiB Swap:  1048572 total,        0 used,  1048572 free.  1192532 cached Mem

PID USER      PR  NI    VIRT    RES    SHR S %CPU %MEM     TIME+ COMMAND

10  root      20   0 2557160 289824  15872 R 79.3 14.2   0:41.49 java

可以看到,在進程為9的Java程序中各個線程的CPU占用情況,接下來我們可以通過jstack命令查看線程id為10的線程為什么耗費CPU最高。需要注意的是,在jsatck命令展示的結果中,線程id都轉換成了十六進制形式。可以用如下命令查看轉換結果,也可以找一個科學計算器進行轉換:

root@a39de7e7934b:/# printf '%xn' 10a

這里打印結果說明該線程在jstack中的展現形式為0xa,通過jstack命令我們可以看到如下信息:

'main' #1 prio=5 os_prio=0 tid=0x00007f8718009800 nid=0xb runnable [0x00007f871fe41000]

   java.lang.Thread.State: RUNNABLE

    at com.aibaobei.chapter2.eg2.UserDemo.main(UserDemo.java:9)

這里的VM Thread一行的最后顯示nid=0xa,這里nid的意思就是操作系統線程id的意思。而VM Thread指的就是垃圾回收的線程。這里我們基本上可以確定,當前系統緩慢的原因主要是垃圾回收過于頻繁,導致GC停頓時間較長。我們通過如下命令可以查看GC的情況:

root@8d36124607a0:/# jstat -gcutil 9 1000 10

  S0     S1     E      O      M     CCS    YGC     YGCT    FGC    FGCT     GCT

  0.00   0.00   0.00  75.07  59.09  59.60   3259    0.919  6517    7.715    8.635

  0.00   0.00   0.00   0.08  59.09  59.60   3306    0.930  6611    7.822    8.752

  0.00   0.00   0.00   0.08  59.09  59.60   3351    0.943  6701    7.924    8.867

可以看到,這里FGC指的是Full GC數量,這里高達6793,而且還在不斷增長。從而進一步證實了是由于內存溢出導致的系統緩慢。那么這里確認了內存溢出,但是如何查看你是哪些對象導致的內存溢出呢,這個可以dump出內存日志,然后通過eclipse的mat工具進行查看,如下是其展示的一個對象樹結構:

Java系統運行緩慢等問題的排查思路

經過mat工具分析之后,我們基本上就能確定內存中主要是哪個對象比較消耗內存,然后找到該對象的創建位置,進行處理即可。這里的主要是PrintStream最多,但是我們也可以看到,其內存消耗量只有12.2%。也就是說,其還不足以導致大量的Full GC,此時我們需要考慮另外一種情況,就是代碼或者第三方依賴的包中有顯示的System.gc()調用。這種情況我們查看dump內存得到的文件即可判斷,因為其會打印GC原因:

[Full GC (System.gc()) [Tenured: 262546K->262546K(349568K), 0.0014879 secs] 262546K->262546K(506816K), [Metaspace: 3109K->3109K(1056768K)], 0.0015151 secs] [Times: user=0.00 sys=0.00, real=0.01 secs] 

比如這里第一次GC是由于System.gc()的顯示調用導致的,而第二次GC則是JVM主動發起的。總結來說,對于Full GC次數過多,主要有以下兩種原因:

代碼中一次獲取了大量的對象,導致內存溢出,此時可以通過eclipse的mat工具查看內存中有哪些對象比較多; 內存占用不高,但是Full GC次數還是比較多,此時可能是顯示的System.gc()調用導致GC次數過多,這可以通過添加-XX:+DisableExplicitGC來禁用JVM對顯示GC的響應。CPU過高

在前面第一點中,我們講到,CPU過高可能是系統頻繁的進行Full GC,導致系統緩慢。而我們平常也肯能遇到比較耗時的計算,導致CPU過高的情況,此時查看方式其實與上面的非常類似。首先我們通過top命令查看當前CPU消耗過高的進程是哪個,從而得到進程id;然后通過top -Hp來查看該進程中有哪些線程CPU過高,一般超過80%就是比較高的,80%左右是合理情況。這樣我們就能得到CPU消耗比較高的線程id。接著通過該線程id的十六進制表示在jstack日志中查看當前線程具體的堆棧信息。

在這里我們就可以區分導致CPU過高的原因具體是Full GC次數過多還是代碼中有比較耗時的計算了。如果是Full GC次數過多,那么通過jstack得到的線程信息會是類似于VM Thread之類的線程,而如果是代碼中有比較耗時的計算,那么我們得到的就是一個線程的具體堆棧信息。如下是一個代碼中有比較耗時的計算,導致CPU過高的線程信息:

Java系統運行緩慢等問題的排查思路

這里可以看到,在請求UserController的時候,由于該Controller進行了一個比較耗時的調用,導致該線程的CPU一直處于100%。我們可以根據堆棧信息,直接定位到UserController的34行,查看代碼中具體是什么原因導致計算量如此之高。

不定期出現的接口耗時現象

對于這種情況,比較典型的例子就是,我們某個接口訪問經常需要2~3s才能返回。這是比較麻煩的一種情況,因為一般來說,其消耗的CPU不多,而且占用的內存也不高,也就是說,我們通過上述兩種方式進行排查是無法解決這種問題的。而且由于這樣的接口耗時比較大的問題是不定時出現的,這就導致了我們在通過jstack命令即使得到了線程訪問的堆棧信息,我們也沒法判斷具體哪個線程是正在執行比較耗時操作的線程。

對于不定時出現的接口耗時比較嚴重的問題,我們的定位思路基本如下:首先找到該接口,通過壓測工具不斷加大訪問力度,如果說該接口中有某個位置是比較耗時的,由于我們的訪問的頻率非常高,那么大多數的線程最終都將阻塞于該阻塞點,這樣通過多個線程具有相同的堆棧日志,我們基本上就可以定位到該接口中比較耗時的代碼的位置。如下是一個代碼中有比較耗時的阻塞操作通過壓測工具得到的線程堆棧日志:

'http-nio-8080-exec-2' #29 daemon prio=5 os_prio=31 tid=0x00007fd08cb26000 nid=0x9603 waiting on condition [0x00007000031d5000]

   java.lang.Thread.State: TIMED_WAITING (sleeping)

    at java.lang.Thread.sleep(Native Method)

    at java.lang.Thread.sleep(Thread.java:340)

    at java.util.concurrent.TimeUnit.sleep(TimeUnit.java:386)

    at com.aibaobei.user.controller.UserController.detail(UserController.java:18)

'http-nio-8080-exec-3' #30 daemon prio=5 os_prio=31 tid=0x00007fd08cb27000 nid=0x6203 waiting on condition [0x00007000032d8000]

   java.lang.Thread.State: TIMED_WAITING (sleeping)

    at java.lang.Thread.sleep(Native Method)

    at java.lang.Thread.sleep(Thread.java:340)

    at java.util.concurrent.TimeUnit.sleep(TimeUnit.java:386)

    at com.aibaobei.user.controller.UserController.detail(UserController.java:18)

'http-nio-8080-exec-4' #31 daemon prio=5 os_prio=31 tid=0x00007fd08d0fa000 nid=0x6403 waiting on condition [0x00007000033db000]

   java.lang.Thread.State: TIMED_WAITING (sleeping)

    at java.lang.Thread.sleep(Native Method)

    at java.lang.Thread.sleep(Thread.java:340)

    at java.util.concurrent.TimeUnit.sleep(TimeUnit.java:386)

從上面的日志可以看你出,這里有多個線程都阻塞在了UserController的第18行,說明這是一個阻塞點,也就是導致該接口比較緩慢的原因。

某個線程進入WAITING狀態

對于這種情況,這是比較罕見的一種情況,但是也是有可能出現的,而且由于其具有一定的“不可復現性”,因而我們在排查的時候是非常難以發現的。筆者曾經就遇到過類似的這種情況,具體的場景是,在使用CountDownLatch時,由于需要每一個并行的任務都執行完成之后才會喚醒主線程往下執行。而當時我們是通過CountDownLatch控制多個線程連接并導出用戶的gmail郵箱數據,這其中有一個線程連接上了用戶郵箱,但是連接被服務器掛起了,導致該線程一直在等待服務器的響應。最終導致我們的主線程和其余幾個線程都處于WAITING狀態。

對于這樣的問題,查看過jstack日志的讀者應該都知道,正常情況下,線上大多數線程都是處于TIMED_WAITING狀態,而我們這里出問題的線程所處的狀態與其是一模一樣的,這就非常容易混淆我們的判斷。解決這個問題的思路主要如下:

通過grep在jstack日志中找出所有的處于TIMED_WAITING狀態的線程,將其導出到某個文件中,如a1.log,如下是一個導出的日志文件示例:

'Attach Listener' #13 daemon prio=9 os_prio=31 tid=0x00007fe690064000 nid=0xd07 waiting on condition [0x0000000000000000]

'DestroyJavaVM' #12 prio=5 os_prio=31 tid=0x00007fe690066000 nid=0x2603 waiting on condition [0x0000000000000000]

'Thread-0' #11 prio=5 os_prio=31 tid=0x00007fe690065000 nid=0x5a03 waiting on condition [0x0000700003ad4000]

等待一段時間之后,比如10s,再次對jstack日志進行grep,將其導出到另一個文件,如a2.log,結果如下所示:

'DestroyJavaVM' #12 prio=5 os_prio=31 tid=0x00007fe690066000 nid=0x2603 waiting on condition [0x0000000000000000]

'Thread-0' #11 prio=5 os_prio=31 tid=0x00007fe690065000 nid=0x5a03 waiting on condition [0x0000700003ad4000]

重復步驟2,待導出34個文件之后,我們對導出的文件進行對比,找出其中在這幾個文件中一直都存在的用戶線程,這個線程基本上就可以確認是包含了處于等待狀態有問題的線程。因為正常的請求線程是不會在2030s之后還是處于等待狀態的。經過排查得到這些線程之后,我們可以繼續對其堆棧信息進行排查,如果該線程本身就應該處于等待狀態,比如用戶創建的線程池中處于空閑狀態的線程,那么這種線程的堆棧信息中是不會包含用戶自定義的類的。這些都可以排除掉,而剩下的線程基本上就可以確認是我們要找的有問題的線程。通過其堆棧信息,我們就可以得出具體是在哪個位置的代碼導致該線程處于等待狀態了。

這里需要說明的是,我們在判斷是否為用戶線程時,可以通過線程最前面的線程名來判斷,因為一般的框架的線程命名都是非常規范的,我們通過線程名就可以直接判斷得出該線程是某些框架中的線程,這種線程基本上可以排除掉。而剩余的,比如上面的Thread-0,以及我們可以辨別的自定義線程名,這些都是我們需要排查的對象。

經過上面的方式進行排查之后,我們基本上就可以得出這里的Thread-0就是我們要找的線程,通過查看其堆棧信息,我們就可以得到具體是在哪個位置導致其處于等待狀態了。如下示例中則是在SyncTask的第8行導致該線程進入等待了。

'Thread-0' #11 prio=5 os_prio=31 tid=0x00007f9de08c7000 nid=0x5603 waiting on condition [0x0000700001f89000]

   java.lang.Thread.State: WAITING (parking)

    at sun.misc.Unsafe.park(Native Method)

    at java.util.concurrent.locks.LockSupport.park(LockSupport.java:304)

    at com.aibaobei.chapter2.eg4.SyncTask.lambda$main$0(SyncTask.java:8)

    at com.aibaobei.chapter2.eg4.SyncTask$$Lambda$1/1791741888.run(Unknown Source)

死鎖

對于死鎖,這種情況基本上很容易發現,因為jstack可以幫助我們檢查死鎖,并且在日志中打印具體的死鎖線程信息。如下是一個產生死鎖的一個jstack日志示例:

Java系統運行緩慢等問題的排查思路

可以看到,在jstack日志的底部,其直接幫我們分析了日志中存在哪些死鎖,以及每個死鎖的線程堆棧信息。這里我們有兩個用戶線程分別在等待對方釋放鎖,而被阻塞的位置都是在ConnectTask的第5行,此時我們就可以直接定位到該位置,并且進行代碼分析,從而找到產生死鎖的原因。

小結

本文主要講解了線上可能出現的五種導致系統緩慢的情況,詳細分析了每種情況產生時的現象,已經根據現象我們可以通過哪些方式定位得到是這種原因導致的系統緩慢。簡要的說,我們進行線上日志分析時,主要可以分為如下步驟:

1.通過top命令查看CPU情況,如果CPU比較高,則通過top -Hp命令查看當前進程的各個線程運行情況,找出CPU過高的線程之后,將其線程id轉換為十六進制的表現形式,然后在jstack日志中查看該線程主要在進行的工作。這里又分為兩種情況:

如果是正常的用戶線程,則通過該線程的堆棧信息查看其具體是在哪處用戶代碼處運行比較消耗CPU; 如果該線程是VM Thread,則通過jstat -gcutil <pid> <period> <times>命令監控當前系統的GC狀況,然后通過jmap dump:format=b,file=<filepath> <pid>導出系統當前的內存數據。導出之后將內存情況放到eclipse的mat工具中進行分析即可得出內存中主要是什么對象比較消耗內存,進而可以處理相關代碼;

2.如果通過top命令看到CPU并不高,并且系統內存占用率也比較低。此時就可以考慮是否是由于另外三種情況導致的問題。具體的可以根據具體情況分析:

如果是接口調用比較耗時,并且是不定時出現,則可以通過壓測的方式加大阻塞點出現的頻率,從而通過jstack查看堆棧信息,找到阻塞點; 如果是某個功能突然出現停滯的狀況,這種情況也無法復現,此時可以通過多次導出jstack日志的方式對比哪些用戶線程是一直都處于等待狀態,這些線程就是可能存在問題的線程; 如果通過jstack可以查看到死鎖狀態,則可以檢查產生死鎖的兩個線程的具體阻塞點,從而處理相應的問題。

本文主要是提出了五種常見的導致線上功能緩慢的問題,以及排查思路。當然,線上的問題出現的形式是多種多樣的,也不一定局限于這幾種情況,如果我們能夠仔細分析這些問題出現的場景,就可以根據具體情況具體分析,從而解決相應的問題。

以上就是Java系統運行緩慢等問題的排查思路的詳細內容,更多關于Java系統運行緩慢問題的資料請關注好吧啦網其它相關文章!

標簽: Java
相關文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
精品国产亚洲一区二区三区大结局| 青青草精品视频| 久久男人av| 精品国产一级| 欧洲一区二区三区精品| 岛国av在线网站| 国内精品福利| 亚洲影视一区| 国产精久久一区二区| 久久久久久一区二区| 亚洲婷婷免费| 婷婷精品在线| 国产精品99视频| 欧美特黄视频| 欧美久久精品| 天堂网av成人| 亚洲精品在线a| 国产一区二区三区四区| 一区视频在线| 国产精品videossex| 欧美国产美女| 久久www成人_看片免费不卡| 日本成人手机在线| 热三久草你在线| 中文字幕亚洲精品乱码| 久久精品女人| 丝袜亚洲另类欧美| 久久91视频| 国产亚洲精品自拍| 欧美国产极品| 免费日韩视频| 精品一区二区三区在线观看视频| 久久蜜桃av| 国产精品亚洲综合在线观看| 亚洲午夜一级| 欧美亚洲自偷自偷| 欧美 日韩 国产一区二区在线视频| 日韩一区二区三免费高清在线观看| 成年男女免费视频网站不卡| 日韩**一区毛片| 久久九九精品| 欧美1区2区3| 只有精品亚洲| 蜜桃精品在线| 国产精品一区二区精品| 亚洲永久字幕| 国产精品专区免费| 国产欧美日本| 免费观看在线色综合| 另类专区亚洲| 国产探花一区| 亚洲一区二区免费在线观看| 久久久精品五月天| 久久精品国产亚洲aⅴ| 亚洲18在线| 日韩午夜一区| 久久久久久久久丰满| 久久免费精品| 日韩成人一级| 免费国产亚洲视频| 不卡在线一区| 中文字幕系列一区| 国产精品分类| 日韩免费精品| 人人爽香蕉精品| 久久精品高清| 久久精品三级| 国产精品网址| 五月国产精品| 美女久久网站| 黄色日韩精品| 91精品一区国产高清在线gif| 精品视频黄色| 久久的色偷偷| 国产精品一区二区免费福利视频| 视频一区二区三区中文字幕| 亚洲福利久久| 成人看片网站| 日韩精品一区二区三区免费观影| 成午夜精品一区二区三区软件| 91嫩草精品| 国产精品66| 尤物在线精品| 国产aⅴ精品一区二区四区| 日韩中文字幕1| 国产欧美日韩在线观看视频 | 99精品视频精品精品视频| 国产精品一在线观看| 日本麻豆一区二区三区视频| 亚洲最大av| 亚洲精品一级| 日本h片久久| 久久精品999| 亚洲三级网站| 一区二区三区国产盗摄| 亚洲精品激情| 日韩在线麻豆| 国产亚洲精品美女久久| 国产精品亚洲成在人线| 蜜桃久久久久| www.九色在线| 99久久夜色精品国产亚洲狼 | 婷婷成人在线| 亚洲一区二区动漫| 亚洲精品国模| 久久av免费看| 风间由美中文字幕在线看视频国产欧美| 久久久精品区| 久久久久一区| 中文精品电影| 国产精品久久久一区二区| 久久精品欧洲| 久久网站免费观看| 男女男精品视频网| 国产免费久久| 欧洲一级精品| 亚洲一二av| 久久免费视频66| 亚洲国产综合在线看不卡| 免费在线观看不卡| 国产乱码精品一区二区三区四区 | 欧美综合精品| 国产suv精品一区二区四区视频| 亚洲a一区二区三区| 国产模特精品视频久久久久| 日本亚洲不卡| 日本久久黄色| 老牛影视一区二区三区| 国产精品网址| 香蕉人人精品| 久久国产三级| 99久久亚洲精品| 欧美日韩一区自拍| 久久三级视频| 亚洲精品日韩久久| 国产伦久视频在线观看| 男人的天堂亚洲一区| 久久精品国产999大香线蕉| 国产在线不卡| 国产精品手机在线播放| 91精品高清| 老牛国内精品亚洲成av人片| 国产精品美女久久久| 精品一区二区三区的国产在线观看 | 国产精品亚洲一区二区在线观看| 91综合网人人| 少妇精品久久久一区二区| 日韩大片免费观看| 91麻豆精品激情在线观看最新| 麻豆精品蜜桃| 国产精品xxxav免费视频| 欧美午夜不卡影院在线观看完整版免费| 国产丝袜一区| 亚洲主播在线| 日韩高清欧美| 国产日韩免费| 亚洲激情av| 中文在线а√在线8| 日韩高清不卡一区| 91成人超碰| 国产99在线| 国产精品一级| 日日摸夜夜添夜夜添国产精品| 99久久九九| 精品国产乱码久久久| 亚州欧美在线| 乱人伦精品视频在线观看| 久久久久国产精品一区二区| 久久精品一区二区三区中文字幕| 另类av一区二区| 偷拍精品精品一区二区三区| 国产激情精品一区二区三区| 综合激情一区| 狠狠干综合网| 日韩一区三区| 国产aⅴ精品一区二区四区| 69堂免费精品视频在线播放| 蜜臀av在线播放一区二区三区| 日本欧美不卡| 国产91在线精品| 精品久久久中文字幕| 国产精东传媒成人av电影| 婷婷综合福利| 亚洲精品人人| 视频在线观看91| 99国产精品久久久久久久| 人人精品亚洲| 日韩精品免费一区二区在线观看| 国产一区二区三区免费在线| 国产九一精品| 91福利精品在线观看| 日韩和欧美一区二区三区| 亚洲最大av| 亚洲字幕久久| 日本不卡高清视频| 日韩av中文字幕一区| 欧美一区不卡| 国产乱码精品一区二区三区亚洲人 | 999国产精品视频| 日本久久综合|