利用參數估計的零售預估的製作方法
2024-03-02 06:02:15
利用參數估計的零售預估的製作方法
【專利摘要】一種系統生成多個變量的參數估計。所述系統接收包括用戶接受準則和用戶目標的輸入數據。所述系統將輸入數據編碼為矩陣並利用對偶線性規劃變換輸入數據。所述系統然後使用利用裝箱的變量的對偶單純型法求解對偶線性規劃,並恢復參數值以用於參數估計。參數估計可以用來提供零售預估。
【專利說明】利用參數估計的零售預估
【技術領域】
[0001]一個實施例一般針對計算機系統,並且具體針對使用參數估計的零售預估計算機系統。
【背景技術】
[0002]參數估計提供數據的有效利用和分析以幫助數學建模現象和出現在這些模型中的常量的估計。大部分參數估計可以涉及四個優化問題:(1)準則:用於優化(最小化或最大化)的最佳函數的選擇;(2)估計:選擇的函數的優化;(3)設計:獲得最佳參數估計的最優設計;以及(4)建模:最佳描述用來測量數據的系統的數學模型的確定。
[0003]參數估計方法通常使用線性回歸技術,也稱為「最小二乘法」(「0LS」)。但是,此類方法已知不「健壯」,因為他們易受到數據中孤立點(outlier)的損壞。單個孤立數據點的添加可以顯著地影響估計的參數的值。
【發明內容】
[0004]一個實施例是生成多個變量的參數估計的系統。系統接受包括用戶接受準則和用戶目標的輸入數據。系統將輸入數據編碼成矩陣並且利用對偶線性規劃變換輸入數據。然後系統利用對偶單純型法求解對偶線性規劃以得到裝箱的變量,並且恢復用於參數估計的參數值。參數估計可以用來提供零售預估。
【專利附圖】
【附圖說明】
[0005]圖1是可以實施本發明的實施例的計算機系統的方框圖。
[0006]圖2是根據一個實施例的在生成零售參數估計時圖1的零售參數估計模塊的功能的流程圖。
【具體實施方式】
[0007]—個實施例是用於零售建模和利用參數估計的預測的計算機系統。系統以諸如浮點陣列之類的密集矩陣格式存儲輸入數據,創建附加臨時陣列以表示適當的對偶公式,並且利用修正的對偶單純型法求解得到的特殊結構化的對偶線性規劃以獲得裝箱的變量以達到期望的優化級別。結果是用於零售建模和預測的參數值。
[0008]參數估計方法可以使用於零售預估。例如,方法可以用於確定對於消費者產品的需求的價格彈性,諸如如果襯衫的價格降低20%,則銷售將增加多少。如上所述的也稱為「最小二乘法(「0LS」)的諸如線性回歸之類的一些已知的參數估計方法,易受數據中孤立點的影響。其它已知方法包括「最大似然估計法」(「MLE」)。
[0009]此外,用戶接受約束的併入(例如,當校準零售模型以預測由於促銷的銷售時,用戶可以合理地預期模型將預測較高折扣導致較高銷售,或與在報紙內頁的廣告相比較頭版廣告將驅使更多的銷售)使得問題很難解決。一些現有技術解決方案僅僅丟棄不滿足用戶接受準則的此類模型。但是,這導致增加的預測誤差。
[0010]此外,商業解決者通常僅僅優化與「吻合度」有關的單個度量,即使用戶可以考慮多個準則。例如,用戶可以對最小化用於一組預測的預測誤差感興趣,同時確保沒有單個預測具有大於設置的閾值的誤差。
[0011]線性規劃(「LP」)已經用於參數估計問題,因為它已被顯示生成相對不受數據孤立點影響的健壯答案。LP也允許用戶接受約束的指定。但是,甚至最可擴展的已知LP實施方式也是太計算密集並且沒有證明是完全實際的,特別是當被應用於直接/自然LP時,此類參數估計問題的編碼涉及大量數據。
[0012]圖1是可以實施本發明的實施例的計算機系統10的方框圖。雖然顯示為單個系統,但是系統10的功能可以被實施為分布式系統。系統10包括總線12或用於通信信息的其它通信機制,和用於處理信息的被耦接到總線12的處理器22。處理器22可以是任何類型一般或特定目的的處理器。系統10還包括用於存儲信息和由處理器22運行的指令的存儲器14。存儲器14可以由隨機存取存儲器(「RAM」)、只讀存儲器(「ROM」)、諸如磁或光碟之類的靜態存儲器、或任何其它類型計算機可讀的介質的任何組合組成。系統10還包括諸如網絡接口卡之類的通信設備20以提供網絡訪問。因此,用戶可以與系統10直接、或經由網絡或任何其它方法遠程對接。
[0013]計算機可讀介質可以是可以由處理器22訪問的任何可用介質,並且包括易失性和非易失性介質、可移除和非可移除介質、以及通信介質。通信介質可以包括計算機可讀指令、數據結構、程序模塊或諸如載波或其它傳輸機制之類的調製的數據信號中的其它數據,並且包括任何信息傳輸介質。
[0014]處理器22還經由總線12被耦接到諸如液晶顯示器(「IXD」)之類的用於向用戶顯示信息的顯示器24。鍵盤26和諸如電腦滑鼠之類的光標控制設備28還被耦接到總線12以使得用戶能夠與系統10對接。
[0015]在一個實施例中,存儲器14存儲當由處理器22運行時提供功能的軟體模塊。模塊包括提供用於系統10的作業系統功能的作業系統15。模塊還包括使用參數估計來對零售進行定價、預測和建模的零售參數估計模塊16,如下面更詳細公開的。系統10可以屬於諸如企業資源計劃(「ERP」)系統之類的更大的系統。因此,系統10將通常包括一個或多個附加的功能模塊18以包括附加的功能。資料庫17被耦接到總線12以便為模塊16和18提供集中的存儲並且存儲定價信息、庫存信息,等等。
[0016]輸入數據
[0017]一個實施例使用以下輸入數據/標記:
[0018]m=要被同時估計預測模型(i=l,…,m)的參數的數目,其中m通常不多於30 ;
[0019]η=用於這些m個參數的每個的係數的歷史觀察量的數目(j=l,…,η),其中η通常非常大(I, 000, 000個觀察量或更多);
[0020]a』 ^.=在觀察量j中的參數i的觀察係數;
[0021]Si=用於參數i的用戶可接受的符號約束(這需要參數i取非負的或者非正的值);
[0022](Ii, Ui) =參數i的值的上界和下界;
[0023]Wj=觀察量j的相對權重(重要性);
[0024]bf在觀察量j中的因變量(目標)的RHS值,例如,銷售提升、周銷售率,等等;[0025]a i=對參數值i的懲罰,(保證將幾乎沒有預測力的參數截止);
[0026]Uack=對大於一個參數值的加權和施加聯合(組合)限制的第k個用戶接受約束。此約束如下表示:
[0027]XiClik^vali≥ek,其中,導出以下輸出數據:
[0028](輸出數據)Vali=參數i的值(其值將要被分析確定的決策變量),其跨所有觀察量滿足所有用戶接受約束,同時最小化因變量的預測的值與觀察的值之間的絕對誤差和。
[0029]求解上述的傳統方法是使用最小化由Min SjOvSiaij^vali)2給出的均方誤差和的普通最小二乘法(「0LS」)。但是,在符號約束和其它用戶接受約束的情況下,OLS失敗。準規劃(「QP」)問題不得不被求解,其往往在實際的性能和對於大η的響應需要方面失敗,並且在其中誤差的分布不類似鐘形曲線的許多情況中可能不是健壯的估計器,並且因變量(或目標)的幾個顯著但畸變的觀察量的存在可以幹擾結果模型的實際預測力。
[0030]在傾向於避免這些上述問題的此類情況中的可替換方式是線性規劃(「LP」)方法。具體地,最小化絕對偏差的和的LP方法可以是採樣中間值的健壯的估計器。但是,此方法具有各種缺點,諸如:
[0031]?在LP中的誤差最小化函數形式是不可微分且非平滑的,並且因此影響性能要求。
[0032].求解大型LP通常需要對所謂稀疏商業LP解決者(例如,來自於IBM公司的IBMILOG CPLEX優化器,或來自於 Gurobi公司的Gurobi優化)的投資。
[0033].即使諸如如上所述那些良好的商業解決者,如果沒有提供正確的數學模型作為輸入(存在幾個可替換),則性能可以是不良的。
[0034]本發明的實施例利用高效LP公式用於經由三級變換序列導出的參數估計。實施例還使用以各種用戶接受約束和誤差最小化目標的形式的新穎度量和用戶接受要求。實施例採用結果LP形成的特殊結構以顯著地改善實際收斂。此外,實施例與加速解方法的經驗收斂的快速排序子例程結合使用三態數據結構。
[0035]圖2是根據一個實施例的在生成零售參數估計時圖1的零售參數估計模塊16的功能的流程圖。在一個實施例中,由存儲在存儲器或其它計算機可讀或有形介質中的軟體執行、並由處理器運行圖2的流程圖的功能。在其它實施例中,可以由硬體(例如,通過使用特定用途集成電路(「ASIC」)、可編程門陣列(「PGA」)、現場可編程門陣列(「FPGA」)等等)、或硬體和軟體的任何組合執行功能。
[0036]在202處,接收包括用戶接受準則、用戶目標和所考慮的觀察量和變量的輸入數據。用戶接受準則可以包括用戶關於模型應當如何表現的直覺、和硬約束(例如,降價將永不會導致減少銷售)和軟約束(例如,頭版廣告傾向於劣於後頁廣告)。
[0037]在一個實施例中,在202處的輸入數據可以是以下形式:
[0038]?回歸器係數矩陣(即,其元素表示元素a』 [][]的浮點二維陣列)。此輸入通常是稀疏形式(即,沒有非零的元素並且它們的位置被提供)。
[0039].以稀疏或密集形式的因變量的觀察的值(b[])。
[0040]?利用布爾值、整數和浮點數值數據(符號約束,參數間約束、期望的偏離值以減少實際參數的數目)的組合以參數化形成提供的用戶接受約束、和數值容差參數。
[0041].期望的誤差最小化目標:最小化絕對偏差的和、最小化最大偏差、或最小化兩個目標的組合。
[0042]在204處,以密集矩陣格式(即,利用標準的浮點陣列)編碼輸入數據。
[0043]在206處,創建並填充附加臨時陣列以表示適當的對偶變量LP公式(下面詳細公開的DP,DP2,或DP3),其最佳匹配在202處接收到的用戶目標。
[0044]在208處,利用下面公開的用於裝箱的變量的修正的對偶單純型法求解得到的特殊結構化的對偶線性規劃以達到期望的優化級別。在一個實施例中,也布置了分類方法以導出用於此結構的快速收斂。
[0045]在210處,基於求解的參數確定用戶接受約束是否是可行的。如果用戶接受約束在210處可行,則在212處從在206處確定的最優解中的最優對偶值恢復參數值。否則,沒有解被返回,並且在214處生成不可實行的狀態。
[0046]數學變換
[0047]在一個實施例中,經由三級變換變換標準的LP公式以生成三個新穎的對偶LP公式(被稱為「DP」、「DP2」或「DP3」)中的一個。如結合在以上圖2中公開的,輸入數據應用於LP公式以生成輸出。
[0048]變換步驟1:原始LP公式(最小化最小絕對偏差的加權和):
[0049]定義Vali=決策變量Yi
[0050]LAD:最小化
【權利要求】
1.一種在其上存儲有指令的計算機可讀介質,所述指令在由處理器執行時使得處理器執行多個變量的參數估計,所述指令包括: 接收輸入數據,所述輸入數據包括用戶接受準則和用戶目標; 將輸入數據編碼為矩陣; 使用對偶線性規劃變換輸入數據; 使用利用裝箱的變量的對偶單純型法求解對偶線性規劃;以及 恢復參數值以用於參數估計。
2.如權利要求1所述的計算機可讀介質,其中對偶線性規劃包括:
dp:最大化
3.如權利要求1所述的計算機可讀介質,其中對偶線性規劃包括:
DP2:最大化.
4.如權利要求1所述的計算機可讀介質,其中對偶線性規劃包括:
DP3:最大化
5.如權利要求1所述的計算機可讀介質,其中所述矩陣是密集形式。
6.如權利要求1所述的計算機可讀介質,還包括: 對於能夠從下界翻轉到上界或從上界翻轉到下界的每個變量,生成三態係數的陣列;以及 以比率的遞增順序對三態係數分類。
7.如權利要求1所述的計算機可讀介質,其中求解對偶線性規劃生成初步變量值和對偶變量值。
8.如權利要求1所述的計算機可讀介質,其中參數估計提供零售預估。
9.一種多個變量的參數估計的計算機執行的方法,所述方法包括: 接收輸入數據,所述輸入數據包括用戶接受要求和用戶目標; 將輸入數據編碼為矩陣; 使用對偶線性規劃變換輸入數據; 使用利用裝箱的變量的對偶單純型法求解對偶線性規劃;以及 恢復參數值以用於參數估計。
10.如權利要求9所述的計算機執行的方法,其中對偶線性規劃包括:
sM DP:最大化 經歷:
11.如權利要求9所述的計算機執行的方法,其中對偶線性規劃包括: DP2:最大化念¥<
jIA-1 經歷:
12.如權利要求9所述的計算機執行的方法,其中對偶線性規劃包括: BK DP3:最大化ΣΜ.Τ;
/ IA.1 經歷:
13.如權利要求9所述的計算機執行的方法,其中所述矩陣是密集形式。
14.如權利要求9所述的計算機執行的方法,還包括: 對於能夠從下界翻轉到上界或從上界翻轉到下界的每個變量,生成三態係數的陣列;以及 以比率的遞增順序對三態係數分類。
15.如權利要求9所述的計算機執行的方法,其中求解對偶線性規劃生成初步變量值和對偶變量值。
16.如權利要求9所述的計算機執行的方法,其中參數估計提供零售預估。
17.一種零售預估系統,包括: 處理器; 耦接到處理器並且存儲指令的計算機可讀介質; 其中指令在由處理器運行時,包括: 接收輸入數據,所述輸入數據包括用戶接受準則和用戶目標; 將輸入數據編碼為矩陣; 使用對偶線性規劃變換輸入數據; 使用利用裝箱的變量的對偶單純型法求解對偶線性規劃;以及 恢復參數值以用於參數估計,所述參數值包括零售預估。
18.如權利要求17所述的系統,其中對偶線性規劃包括: dp:最大化
19.如權利要求17所述的系統,其中對偶線性規劃包括: DP2:最大化
20.如權利要求17所述的系統,其中對偶線性規劃包括: DP3:最大化
【文檔編號】G06F17/10GK103649942SQ201280031078
【公開日】2014年3月19日 申請日期:2012年5月30日 優先權日:2011年6月24日
【發明者】S·蘇布拉馬尼安, B·K·克利什南 申請人:甲骨文國際公司