日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術文章
文章詳情頁

利用Python計算KS的實例詳解

瀏覽:191日期:2022-08-04 15:15:57

在金融領域中,我們的y值和預測得到的違約概率剛好是兩個分布未知的兩個分布。好的信用風控模型一般從準確性、穩(wěn)定性和可解釋性來評估模型。

一般來說。好人樣本的分布同壞人樣本的分布應該是有很大不同的,KS正好是有效性指標中的區(qū)分能力指標:KS用于模型風險區(qū)分能力進行評估,KS指標衡量的是好壞樣本累計分布之間的差值。

好壞樣本累計差異越大,KS指標越大,那么模型的風險區(qū)分能力越強。

1、crosstab實現(xiàn),計算ks的核心就是好壞人的累積概率分布,我們采用pandas.crosstab函數(shù)來計算累積概率分布。

2、roc_curve實現(xiàn),sklearn庫中的roc_curve函數(shù)計算roc和auc時,計算過程中已經(jīng)得到好壞人的累積概率分布,同時我們利用sklearn.metrics.roc_curve來計算ks值

3、ks_2samp實現(xiàn),調(diào)用stats.ks_2samp()函數(shù)來計算。鏈接scipy.stats.ks_2samp¶為ks_2samp()實現(xiàn)源碼,這里實現(xiàn)了詳細過程

4、直接調(diào)用stats.ks_2samp()計算ks

import pandas as pd import numpy as npfrom sklearn.metrics import roc_curvefrom scipy.stats import ks_2samp def ks_calc_cross(data,pred,y_label): ’’’ 功能: 計算KS值,輸出對應分割點和累計分布函數(shù)曲線圖 輸入值: data: 二維數(shù)組或dataframe,包括模型得分和真實的標簽 pred: 一維數(shù)組或series,代表模型得分(一般為預測正類的概率) y_label: 一維數(shù)組或series,代表真實的標簽({0,1}或{-1,1}) 輸出值: ’ks’: KS值,’crossdens’: 好壞客戶累積概率分布以及其差值gap ’’’ crossfreq = pd.crosstab(data[pred[0]],data[y_label[0]]) crossdens = crossfreq.cumsum(axis=0) / crossfreq.sum() crossdens[’gap’] = abs(crossdens[0] - crossdens[1]) ks = crossdens[crossdens[’gap’] == crossdens[’gap’].max()] return ks,crossdens def ks_calc_auc(data,pred,y_label): ’’’ 功能: 計算KS值,輸出對應分割點和累計分布函數(shù)曲線圖 輸入值: data: 二維數(shù)組或dataframe,包括模型得分和真實的標簽 pred: 一維數(shù)組或series,代表模型得分(一般為預測正類的概率) y_label: 一維數(shù)組或series,代表真實的標簽({0,1}或{-1,1}) 輸出值: ’ks’: KS值 ’’’ fpr,tpr,thresholds= roc_curve(data[y_label[0]],data[pred[0]]) ks = max(tpr-fpr) return ks def ks_calc_2samp(data,pred,y_label): ’’’ 功能: 計算KS值,輸出對應分割點和累計分布函數(shù)曲線圖 輸入值: data: 二維數(shù)組或dataframe,包括模型得分和真實的標簽 pred: 一維數(shù)組或series,代表模型得分(一般為預測正類的概率) y_label: 一維數(shù)組或series,代表真實的標簽({0,1}或{-1,1}) 輸出值: ’ks’: KS值,’cdf_df’: 好壞客戶累積概率分布以及其差值gap ’’’ Bad = data.loc[data[y_label[0]]==1,pred[0]] Good = data.loc[data[y_label[0]]==0, pred[0]] data1 = Bad.values data2 = Good.values n1 = data1.shape[0] n2 = data2.shape[0] data1 = np.sort(data1) data2 = np.sort(data2) data_all = np.concatenate([data1,data2]) cdf1 = np.searchsorted(data1,data_all,side=’right’)/(1.0*n1) cdf2 = (np.searchsorted(data2,data_all,side=’right’))/(1.0*n2) ks = np.max(np.absolute(cdf1-cdf2)) cdf1_df = pd.DataFrame(cdf1) cdf2_df = pd.DataFrame(cdf2) cdf_df = pd.concat([cdf1_df,cdf2_df],axis = 1) cdf_df.columns = [’cdf_Bad’,’cdf_Good’] cdf_df[’gap’] = cdf_df[’cdf_Bad’]-cdf_df[’cdf_Good’] return ks,cdf_df data = {’y_label’:[1,1,1,1,1,1,0,0,0,0,0,0], ’pred’:[0.5,0.6,0.7,0.6,0.6,0.8,0.4,0.2,0.1,0.4,0.3,0.9]} data = pd.DataFrame(data)ks1,crossdens=ks_calc_cross(data,[’pred’], [’y_label’]) ks2=ks_calc_auc(data,[’pred’], [’y_label’]) ks3=ks_calc_2samp(data,[’pred’], [’y_label’]) get_ks = lambda y_pred,y_true: ks_2samp(y_pred[y_true==1], y_pred[y_true!=1]).statisticks4=get_ks(data[’pred’],data[’y_label’])print(’KS1:’,ks1[’gap’].values)print(’KS2:’,ks2)print(’KS3:’,ks3[0])print(’KS4:’,ks4)

輸出結(jié)果:

KS1: [ 0.83333333]KS2: 0.833333333333KS3: 0.833333333333KS4: 0.833333333333

當數(shù)據(jù)中存在NAN數(shù)據(jù)時,有一些問題需要注意!

例如,我們在原數(shù)據(jù)中增加了y_label=0,pred=np.nan這樣一組數(shù)據(jù)

data = {’y_label’:[1,1,1,1,1,1,0,0,0,0,0,0,0],’pred’:[0.5,0.6,0.7,0.6,0.6,0.8,0.4,0.2,0.1,0.4,0.3,0.9,np.nan]}

此時執(zhí)行

ks1,crossdens=ks_calc_cross(data,[’pred’], [’y_label’])

輸出結(jié)果

KS1: [ 0.83333333]

執(zhí)行

ks2=ks_calc_auc(data,[’pred’], [’y_label’])

將會報以下錯誤

ValueError: Input contains NaN, infinity or a value too large for dtype(’float64’).

執(zhí)行

ks3=ks_calc_2samp(data,[’pred’], [’y_label’])

輸出結(jié)果

KS3: 0.714285714286

執(zhí)行

ks4=get_ks(data[’pred’],data[’y_label’])

輸出結(jié)果

KS4: 0.714285714286

我們從上述結(jié)果中可以看出

三種方法計算得到的ks值均不相同。

ks_calc_cross計算時忽略了NAN,計算得到了數(shù)據(jù)正確的概率分布,計算的ks與我們手算的ks相同

ks_calc_auc函數(shù)由于內(nèi)置函數(shù)無法處理NAN值,直接報錯了,所以如果需要ks_calc_auc計算ks值時,需要提前去除NAN值。

ks_calc_2samp計算得到的ks因為searchsorted()函數(shù)(有興趣的同學可以自己模擬數(shù)據(jù)看下這個函數(shù)),會將Nan值默認排序為最大值,從而改變了數(shù)據(jù)的原始累積分布概率,導致計算得到的ks和真實的ks有誤差。

總結(jié)

在實際情況下,我們一般計算違約概率的ks值,這時是不存在NAN值的。所以以上三種方法計算ks值均可。但是當我們計算單變量的ks值時,有時數(shù)據(jù)質(zhì)量不好,存在NAN值時,繼續(xù)采用ks_calc_auc和ks_calc_2samp就會存在問題。

解決辦法有兩個

1. 提前去除數(shù)據(jù)中的NAN值

2. 直接采用ks_calc_cross計算。

以上這篇利用Python計算KS的實例詳解就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持好吧啦網(wǎng)。

標簽: Python 編程
相關文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
精品久久久网| 国产va在线视频| 激情婷婷久久| 中文字幕高清在线播放| 国产一区丝袜| 日韩国产欧美| 日韩中文在线播放| 激情偷拍久久| 先锋影音久久久| 美女少妇全过程你懂的久久| 亚洲午夜视频| 一区在线免费| 亚洲一区欧美激情| 亚洲一二av| 国产探花在线精品一区二区| 国产精品激情| 精品欧美日韩精品| 国产精品久久久久久久免费观看 | 尤物tv在线精品| 国产一区日韩一区| 视频在线观看一区二区三区| 日韩欧美美女在线观看| 国产精品一区二区三区av麻| 麻豆中文一区二区| 久久久人人人| 亚洲视频二区| 国产激情精品一区二区三区| 国产一区精品福利| 国产在线日韩| 亚洲美女91| 国产精品天天看天天狠| 老司机精品视频网| 99久久婷婷这里只有精品| 宅男噜噜噜66国产日韩在线观看| 亚洲毛片一区| 国产精品国产三级国产在线观看| 久久亚洲精品中文字幕蜜潮电影| 蜜桃av一区二区在线观看| 国产精品乱战久久久| 日韩欧美一区二区三区免费看| 国产亚洲精品v| 欧美精品1区| 中文字幕系列一区| 蜜臀久久99精品久久久画质超高清 | 久久久久亚洲精品中文字幕| 日韩精品dvd| 日av在线不卡| 精品中文字幕一区二区三区 | 免费看精品久久片| 精品高清久久| 亚洲综合日本| 国产精品久久久久久久久久妞妞| 播放一区二区| 欧美欧美黄在线二区| 三上悠亚国产精品一区二区三区 | 亚洲欧美日韩在线观看a三区| 国产亚洲高清在线观看| 日韩在线免费| 少妇高潮一区二区三区99| а√在线中文在线新版| 蜜桃视频免费观看一区| 精品久久视频| 日韩视频免费| 美女国产精品久久久| 欧美资源在线| 荡女精品导航| 最新国产精品| 都市激情国产精品| 亚洲精品系列| 色爱av综合网| 国产精品成人一区二区网站软件| 在线成人直播| 国产一区二区三区亚洲综合| 中文字幕亚洲在线观看| av资源中文在线| 日韩国产精品久久久久久亚洲| 国产亚洲一区二区手机在线观看| 亚洲人成毛片在线播放女女| 中文字幕在线免费观看视频| 日韩三级精品| 亚洲一区久久| 久久久久久久久99精品大| 欧美黄色精品| 日韩精品久久理论片| 国产真实久久| 精品国产鲁一鲁****| 日本在线不卡视频一二三区| 欧美日韩国产传媒| 国产69精品久久| 97成人在线| 亚洲一区二区三区在线免费| 99精品一区| 欧美国产专区| 日韩欧乱色一区二区三区在线| 欧美亚洲精品在线| 国产成年精品| 国产精品午夜av| 日本不卡视频一二三区| 久久99伊人| 欧美精品一区二区久久| 三级小说欧洲区亚洲区| 97精品国产一区二区三区| 国产精品极品国产中出| 日本三级亚洲精品| 热久久久久久久| 国产一区导航| 9国产精品视频| 蜜桃av.网站在线观看| 精品伊人久久久| 久久av免费看| 国产精品一区2区3区| 亚洲精品第一| 在线看片日韩| 亚洲一区二区三区久久久| 夜夜精品视频| 午夜精品婷婷| 亚洲精品va| 久久高清免费观看| 国产一区白浆| 久久亚洲国产精品一区二区| jiujiure精品视频播放| 欧美粗暴jizz性欧美20| 欧美日韩视频网站| 亚洲成a人片| 亚洲午夜黄色| 欧美日韩四区| 午夜亚洲精品| 亚洲欧洲美洲国产香蕉| 亚洲一区二区三区中文字幕在线观看| 免费在线观看一区二区三区| 蜜桃av一区二区| 日日摸夜夜添夜夜添国产精品| 午夜精品福利影院| 日韩成人精品一区二区三区| 欧美日韩亚洲一区在线观看| 国产精品videossex久久发布 | 精品视频国内| 国产精品不卡| 久久高清免费| 免费日韩精品中文字幕视频在线| 中文字幕一区二区精品区| 日韩不卡在线观看日韩不卡视频| 91成人小视频| 精品三级av| 欧美日韩精品免费观看视完整| 国产一区日韩欧美| 男女激情视频一区| 国产欧美一区二区精品久久久| 97久久超碰| 精品91福利视频| 亚洲午夜视频| 亚洲欧洲美洲国产香蕉| 国产精品中文| 在线中文字幕播放| 欧美日韩国产高清| 91精品尤物| 高清一区二区| 国产精品97| 日韩在线成人| 精品一区二区三区中文字幕 | 欧美一级鲁丝片| 在线一区电影| 69堂免费精品视频在线播放| 欧美xxxx中国| 午夜在线一区| 久久丁香四色| 久久精品主播| 日韩在线电影| av最新在线| 在线国产日韩| 麻豆成人91精品二区三区| 久久久久久久久久久妇女| 日韩中文字幕亚洲一区二区va在线| 欧美伊人久久| 在线看片福利| 一区二区三区国产在线| 精品国产麻豆| 综合干狼人综合首页| 国产成人精品一区二区三区免费| 亚洲精品小说| 久久精品国产亚洲aⅴ| 99tv成人| 国产亚洲一区| 久久久久国产精品一区三寸| 亚洲麻豆一区| 成人在线黄色| 亚洲三级国产| 日韩免费福利视频| 欧美三区不卡| 欧美日韩在线二区| 国产精品一区二区av交换| 亚洲欧美日韩高清在线| 美女久久久精品| 中文精品电影| 久久精品导航| 欧美a在线观看| 在线视频亚洲欧美中文| 欧美sss在线视频| 国产欧美日韩视频在线| 欧美日韩国产综合网|