一種銀行客戶信用計分的方法和系統的製作方法
2023-06-09 15:36:06 2
專利名稱:一種銀行客戶信用計分的方法和系統的製作方法
所屬領域本發明涉及一種信用計分的方法和系統,特別是銀行客戶信用計分的方法和系統,適用於商業銀行信貸和信用卡客戶的信用風險評估和管理。
背景技術:
我國商業銀行的信息化建設取得了巨大的成就,建成了功能齊全的銀行業務處理系統、會計核算系統和跨行的支付清算系統,但在信貸管理方面普遍比較落後,信貸申請和審批流程過於複雜,缺乏客觀的和有效的客戶信用評估機制,效率低下,這將使商業銀行在激烈的市場競爭中,特別是WTO後與外資銀行的競爭中,處於不利的境地。
就銀行客戶而言,特別是信貸和信用卡客戶,其中的許多申請者具有很高的信用值,而有些則不是,對商業銀行來說,其風險來自於不了解哪些申請者是信譽高的客戶,哪些是信譽低的客戶。因此,商業銀行迫切需要一套客戶信用評價系統,以幫助他們快速、高效、客觀地對客戶信用作出判斷和對客戶信用風險作出預測。
目前,國內商業銀行普遍採用人工設計的信用體系評價銀行客戶的信用,其有以下不足之處(1)人工設計的信用指標體系科學性不強,究竟應該包含那些指標缺乏足夠的依據;(2)人工設計的信用指標體系客觀性不夠,指標的權重是主觀設定的,更多體現的是設計者的主觀意念;(3)不夠公正,既然信用指標體系缺乏足夠的科學性和客觀性,當然就不能保證評價結果的公正性,影響信用評價的可操作性,因此,目前國內各商業銀行一般採用以專家或領導集中開會討論貸款是否應該發放為主,以計算機信用評估為輔的信貸處理策略。
發明內容
本發明的目的即在於克服國內商業銀行現有客戶信用風險管理技術的缺點,提供一種科學的、客觀的和公正的銀行客戶信用評估方法和系統,提高商業銀行客戶信用風險管理的能力和效率,提高商業銀行的客戶服務水平。
本發明的目的通過以下技術方案來實現一種銀行客戶信用計分的方法,用於計算銀行客戶信用得分的指標體系,是利用商業銀行大量的客戶歷史數據,經數據取樣、數據探索、數據調整和預處理後,建立客戶信用計分模型而形成的,客戶信用計分模型為多元線性回歸模型,依照該方法計算客戶信用得分的步驟為(1)對銀行提供的客戶數據進行預處理,包括數據取樣、數據探索、數據調整等過程;(2)將經過預處理的客戶樣本數據,帶入多元線性回歸方程Y=β0+β1X1+β2X2+,...+βp-1Xp-1+ε,採用最小二乘估計方法,估計係數β0,β1,β2,...βp-1的值,其中,Y代表客戶的信用計分,X1、X2、...、Xp-1代表信用指標,如文化程度、收入水平等,β0、β1、β2,...、βp-1代表對應指標的權重,ε表示誤差;(3)對建立的回歸模型進行回歸方程顯著性檢驗和回歸係數顯著性檢驗,並對模型進行優化,上述步驟(1)~(3)只適用於系統建模階段;(4)輸入客戶資料信息,根據上述信用計分模型計算客戶信用得分;一種銀行客戶信用計分系統,系統由前臺工作終端、後臺信用計算伺服器和到商業銀行業務系統的接口三部分組成,前臺終端與後臺信用計算伺服器之間可以通過10M/100M區域網、DDN線路或電話線路連接,信用伺服器與銀行業務系統接口以及接口與商業銀行業務系統的連接通常採用10M/100M區域網連接;前臺終端可以是本地終端,也可以是遠程終端,工作界面基於瀏覽器(Browser)模式;信用計分模型存儲在後臺信用計算伺服器中,伺服器根據前臺終端請求的客戶代碼,經銀行業務系統接口讀取客戶資料,計算客戶信用得分,然後將計算結果反饋到前臺工作終端,由前臺終端按要求顯示客戶信用得分。銀行業務系統接口按照預定的數據格式與商業銀行業務系統通訊,讀取客戶數據到信用計算伺服器。
通過上面的敘述可以看出,本發明具有以下優點(1)、可以本地計算銀行客戶信用,也可以通過公共通訊網絡(如Internet網)遠程計算客戶信用;(2)、銀行客戶信用計分系統實現了與銀行業務系統的無縫集成,共享銀行客戶資料資料庫;(3)前臺終端採用瀏覽器界面模式,系統更新和升級只在伺服器上進行,實現了前臺系統的免維護。
圖1為本發明系統結構圖。
具體實施例方式
下面結合附圖對本發明作進一步的描述,如圖1所示,信用計算伺服器是銀行客戶信用計分系統的核心組成部分,它主要完成建模、模型優化、模型存儲和模型應用(即計算客戶信用得分)功能。
建立客戶信用模型設Y是一個可觀察的隨機變量,它受p-1個非隨機因數X1,X2,...,Xp-1和隨機誤差ε的影響,若Y與有如下的線性關係Y=β0+β1X1+β2X2+...,+βp-1Xp-1+ε (1)其中,β0,β1,β2,...,βp-1是未知參數,ε∈N(0,σ2)p則稱該模型為線性回歸模型,Y為因變量,X1,X2,...,Xp-1為自變量。
要建立線性回歸模型,首先要估計未知參數β0,β1,β2,...,βp-1,為此,需要n組(n≥p)樣本數據(xi1,xi2,...,xip-1,yi)i=1,2,...,n
它們應滿足 解上述線性方程,即可得到β0,β1,β2,...,βp-1的估算值。
在實際應用中,我們可以把Y看作是客戶的信用計分,β0,β1,β2,...,βp-1是影響信用分值的指標,如文化程度、職位等。只要我們能夠從銀行拿到足夠多的客戶歷史資料,就可以得到β0,β1,β2,...,βp-1的值,進而利用式(1)計算銀行客戶的信用分值。
回歸關係的統計推斷利用實驗數據,可以給出Y與X1,X2,...,Xp-1之間的線性方程,但所求得的回歸方程是否有意義,也就是說,Y與X1,X2,...,Xp-1之間是否存在顯著的線性關係,還需要對回歸方程進行檢驗。
在一元線性回歸分析中,我們通常可以首先通過散點圖判斷變量X與Y之間是否存在線性關係。如果散點圖上的實驗數據接近於某一條直線,我們便可直觀地初步認為二者之間存在線性關係。但在多元線性回歸分析中情況略有不同。首先我們無法用直觀的方法幫助判斷Y與X1,X2,...,Xp-1之間是否有線性關係,為此必須對回歸方程進行顯著性檢驗。其次在p個自變量中,每個自變量對Y的影響程度是不同的,甚至有的自變量可有可無,這表現在回歸係數中有的絕對值很大,有的很小或接近於零,這就需要對回歸係數進行顯著性檢驗。
回歸方程的顯著性檢驗對回歸方程的顯著性檢驗是指檢驗假設H0β1,=β2=,...,=βp-1=0H1至少有某個βi≠0如果H0成立,說明不論X1,X2,...,Xp-1如何變化,Y並不隨之而改變,顯而易見,在這種情況下用式(1)來表示Y與自變量的關係是不和適的。
如果H0不成立,說明β1,β2,...,βp-1中至少有一個不等於零,從而Y至少隨X1,X2,...,Xp-1中之一的變化而線性變化。因此,對回歸方程顯著性檢驗是從整體上看Y與X1,X2,...,Xp-1是否存在線性關係。
為了建立對H0進行檢驗的統計量,將總離差平方和S總進行分解。
其中回歸平方和 殘差平方和 基於上述方差分析表,構造如下檢驗統計量 當H0成立時,可以證明F~F(p-1,n-p),這裡,F(p-1,n-p)表示自由度為p-1和n-p的F分布。若H0不真,F的值有偏大的趨勢。
因此,給定顯著性水平α,由F分布得臨界值Fα(p-1,n-p)(即F分布的上側α分數),計算F的觀測值F0,若F0≤Fα(p-1,n-p),則接受H0,即在顯著性水平α之下,認為線性回歸關係不顯著。若F0>Fα(p-1,n-p),則拒絕H0,即認為Y與X1,X2,...,Xp-1之間存在顯著的線性關係。
回歸係數的顯著性檢驗在處理多元回歸的實際問題時,我們往往並不滿足於判斷回歸方程的顯著性。因為當我們經過檢驗認為方程是顯著時,即拒絕了H0這一假設,並不意味著一切β1,β2,...,βp-1都不等於零,即並不意味著每一個自變量X1,X2,...,Xp-1對因變量Y的影響都是顯著的。若某一個βi等於零,這就意味著Xi的變化對Y無線性影響。我們稱變量Xi不顯著。為了保證對Y進行予報和控制的質量,我們必須對回歸方程中的每一個回歸係數作顯著性檢驗,剔除那些不顯著變量,重新建立更簡單更精確的線性回歸方程。
檢驗變量是否顯著,等價於檢驗假設H0βk=0H1βk≠0以下說明回歸係數顯著性檢驗的t檢驗方法。
ti=iSi~t(n-p),(i=1,2,,p)]]>式中Si=Sy12pcii]]>為偏回歸係數標準差Sy12p=(y-y^)2n-p-1]]>為離回歸標準差
cii為C=A-1的主對角線元素,A=x11-x11x12-x12x1m-x1mx21-x21x22-x22x2m-x2mxn1-xn1xn2-xn2xnm-xnm]]>對給定顯著性水平α,求出自由度為n-p的t分布的上側α/2分位數tα/2(n-p),記t的觀測值t0,檢驗準則為若 多元線性回歸方程的優化當對顯著的多元線性回歸方程中各個回歸係數進行顯著性檢驗都為顯著時,說明各個自變量對依變量的單純影響都是顯著的。若有一個或幾個回歸係數經顯著性檢驗為不顯著時,說明其對應的自變量對依變量的作用或影響不顯著,或者說這些自變量在回歸方程中是不重要的,此時應該從回歸方程中剔除一個不顯著的偏回歸係數對應的自變量,重新建立多元線性回歸方程,再對新的多元線性回歸方程或多元線性回歸關係以及各個新的偏回歸係數進行顯著性檢驗,直至多元線性回歸方程顯著,並且各個回歸係數都顯著為止。此時的多元線性回歸方程即為最優多元線性回歸方程。
(1)自變量的剔除當經顯著性檢驗有幾個不顯著的回歸係數時,我們一次只能剔除一個不顯著的偏回歸係數對應的自變量,被剔除的自變量的偏回歸係數,應該是所有不顯著的偏回歸係數中的F值(或|t|值、或回歸平方和)為最小者。這是因為自變量之間往往存在著相關性,當剔除某一個不顯著的自變量之後,其對依變量的影響很大部分可以轉加到另外不顯著的自變量對依變量的影響上。如果同時剔除兩個以上不顯著的自變量,那就會比較多地減少回歸平方和,從而影響利用回歸方程進行估測的可靠程度。
(2)新進行少一個自變量的多元線性回歸分析一次剔除一個不顯著的回歸係數對應的自變量,不能簡單地理解為只須把被剔除的自變量從多元線性回歸方程中去掉就行了,這是因為自變量間往往存在相關性,剔除一個自變量,其餘自變量的回歸係數的數值將發生改變,回歸方程的顯著性檢驗、偏回歸係數的顯著性檢驗也都須重新進行,也就是說應該重新進行少一個自變量的多元線性回歸分析,包括重新建立(m-1)元線性回歸方程,對m-1元線性回歸關係和回歸係數βj進行顯著性檢驗。
重複上述步驟,直至回歸方程顯著以及各偏回歸係數都顯著為止,即建立了最優多元線性回歸方程。
下面結合具體案例對本發明作進一步的描述。試驗採用的數據來自國內某大型商業銀行,數據結構如下所示
數據經過上述的數據取樣、數據探索、數據調整等預處理後,帶入多元線性回歸方程Y=β0+β1X1+β2X2+,...+βp-1Xp-1+ε,採用最小二乘估計方法,計算出係數β0,β1,β2,...βp-11的值,然後,對建立的模型進行回歸方程顯著性檢驗和回歸係數顯著性檢驗,並對模型進行優化,得到的模型為Y=1.0532+0.8223(A1)-0.0496(A2)-1.7504(B1)-0.8045(B2)-0.2131(B3)+0.6701(B4)+0.7824(C1)-0.1995(C2)-0.6558(C3)+0.4151(D1)+1.5644(D2)-0.7113(D3)+2.4610(E1)-0.6601(E2)-0.8546(E3)-0.7112(F1)+1.0208(F2)其中A、B、C、D、E、F分別表示hea、faminc、hab、edu_6ipc、age_pikw、kpos_hp6這六個變量,其後緊跟所對應變量的取值,如A1表示hea=1,E3表示age_pikw=03,如此類推。
銀行業務系統接口與銀行業務系統通訊,讀取客戶資料,數據格式為
其中控制快的結構為
域名稱 類型域寬(字節)備註morepkt 字符型1 是否還有更多的包,有1,無0pktype 字符型1 包類型1數據請求,2數據應答,3文件請求,4文件應答unitend 字符型1 結束標誌『1』結束,『0』沒結束save字符型1 保留位sequence短整型機器分配包序號從1開始,網絡字節序length 短整型機器分配包長度msgtype 長整型機器分配發起請求的進程ID號,每個請求是唯一的,網絡字節序包頭的結構為域名稱 類型 域寬(字節)備註code 字符型 6 交易類型d_add 字符型 9 交易目的地l_add 字符型 9 交易發起地交易類型碼100070帳戶餘額查詢100071流水查詢100072客戶信息查詢900071籤到交易900072籤退交易前臺終端從界面接收操作人員錄入的客戶代碼,請求信用計算伺服器計算客戶信用得分,信用伺服器接收到請求的客戶代碼後,通過銀行業務系統接口搜索該客戶的基本資料、交易記錄和以往信用記錄,根據查到的數據計算該客戶的信用得分,並將計算結果返回給前臺,前臺終端最後將客戶的信用得分顯示在屏幕上。
權利要求
1.一種銀行客戶信用計分的方法,其特徵在於用於計算銀行客戶信用得分的指標體系,是利用商業銀行大量的客戶歷史數據,經數據取樣、數據探索、數據調整和預處理後,建立客戶信用計分模型而形成的。
2.根據權利要求1所述的一種銀行客戶信用計分的方法,其特徵在於客戶信用計分模型為多元線性回歸模型。
3.根據權利要求1所述的一種銀行客戶信用計分的方法,其特徵在於依照該方法計算客戶信用得分的步驟為(1)對銀行提供的客戶數據進行預處理,包括數據取樣、數據探索、數據調整等過程;(2)將經過預處理的客戶樣本數據,帶入多元線性回歸方程Y=β0+β1X1+β2X2+,...+βp-1Xp-1+ε,採用最小二乘估計方法,估計係數β0,β1,β2,...βp-1的值,其中,Y代表客戶的信用計分,X1、X2、...、Xp-1代表信用指標,如文化程度、收入水平等,β0、β1、β2,...、βp-1代表對應指標的權重,ε表示誤差;(3)對建立的回歸模型進行回歸方程顯著性檢驗和回歸係數顯著性檢驗,並對模型進行優化,上述步驟(1)~(3)只適用於系統建模階段;(4)輸入客戶資料信息,根據上述信用計分模型計算客戶信用得分;
4.一種銀行客戶信用計分系統,其特徵在於系統由前臺工作終端、後臺信用計算伺服器和到商業銀行業務系統的接口三部分組成,前臺終端與後臺信用計算伺服器之間可以通過10M/100M區域網、DDN線路或電話線路連接,信用伺服器與銀行業務系統接口以及接口與商業銀行業務系統的連接通常採用10M/100M區域網連接。
5.根據權利要求4所述的一種銀行客戶信用計分系統,其特徵在於前臺終端可以是本地終端,也可以是遠程終端,工作界面基於瀏覽器(Browser)模式;
6.根據權利要求4所述的一種銀行客戶信用計分系統,其特徵在於上述信用計分模型存儲在後臺信用計算伺服器中,伺服器根據前臺終端請求的客戶代碼,經銀行業務系統接口讀取客戶資料,計算客戶信用得分,然後將計算結果反饋到前臺工作終端,由前臺終端按要求顯示客戶信用得分。
7.根據權利要求4所述的一種銀行客戶信用計分系統,其特徵在於銀行業務系統接口按照預定的數據格式與商業銀行業務系統通訊,讀取客戶數據到信用計算伺服器。
全文摘要
本發明公開了一種銀行客戶信用計分的方法和系統。銀行客戶信用計分的方法包括分析銀行客戶歷史數據,建立客戶信用計分模型,根據模型計算客戶的信用得分;銀行客戶信用計分的系統包括伺服器、銀行業務系統接口和前臺終端,前臺終端基於瀏覽器模式,可在本地或遠程向伺服器發起信用計算請求,並顯示結果,伺服器用於存儲計分模型和根據前臺請求計算客戶的信用得分,銀行業務系統接口根據給定的客戶代碼,與銀行業務系統通訊,讀取客戶信息交伺服器計算。該方法具有科學、客觀、公正的優點,克服了現有銀行客戶信用評估技術的缺點,同時,該系統還具有操作簡單、可本地和遠程使用、前臺免維護、與銀行業務系統數據共享的優點。
文檔編號G06F13/00GK1529260SQ20031011072
公開日2004年9月15日 申請日期2003年10月13日 優先權日2003年10月13日
發明者晏永勝, 周曉明, 封希德, 蒲果泉, 黃純國 申請人:四川西財高科技股份有限公司