新四季網

基於選擇題型調查問卷的結果可視化實現方法

2023-10-09 16:33:59


專利名稱::基於選擇題型調查問卷的結果可視化實現方法
技術領域:
:本發明屬於信息
技術領域:
,涉及高維數據可視化的實現方法,具體地說涉及如何將大於3維的高維數據轉化為3維以下的低維數據並進行可視化的實現方法。
背景技術:
:選擇題型調查問巻是目前市場調查中一種常用的調查問巻,它通過設計選擇題,直接調查單位或個人。由於它簡明、通俗、客觀、真實、反饋快、保密性好,已被越來越多的企業、公司和諮詢機構所採用。現在常用的調查問巻結果分析方法是,由人對問巻中每個選項的總選擇次數逐個統計,然後用該統計次數除以調査問巻的份數,就得到在這次調查中持該種意見的人所佔被調查人群的百分比,將這些百分比數值列寫成表格形式來表示問巻調查結果。但這種結果分析方法只能從總體上顯示調查結果,難以區分被調査對象之間的差異,更無法對被調查對象進行直觀地分類和聚類。
發明內容常規的調查問巻結果分析技術不能區分被調查對象之間的差異,而且分析結果也不夠直觀,為了解決現有技術的缺陷和不足,本發明的目的在於提供一種能夠實現調査問巻結果可視化顯示,並能直觀反映被調查對象之間差異的基於非線性降維技術選擇題型調查問巻的結果可視化實現方法。為達到上述目的,本發明提供的基於選擇題型調査問巻的結果可視化實現方法技術方案如下步驟S1:對調查問巻結果進行處理,獲取高維向量調査問巻結果;步驟S2:在保持高維向量調查問巻結果間距離基本不變的前提下,將高維向量調查問巻結果降為3維以下的低維向量調查問巻結果;步驟S3:根據降維後的低維向量調查問巻結果,在選定的坐標系中標示出坐標點,獲得調查問巻結果顯示圖。根據本發明的實施例,步驟S1所述高維向量調査問巻結果獲取,還包括步驟如下步驟S11:獲取調查問巻結果;步驟S12:用高維向量量化調査問巻結果;步驟S13:計算高維向量調查問巻結果之間的歐式距離;步驟S14:根據歐式距離建立高維向量調查問巻結果的高維向量連線步驟S15:計算高維向量連線圖中任意兩點最短高維向量連線距離。根據本發明的實施例,步驟S2所述低維向量調査問巻結果獲取,還包括步驟如下將最短高維向量連線距離降為低於三維向量,獲得低維向量調查問巻結果。根據本發明的實施例,步驟S3所述調查問巻結果顯示圖獲取,還包括步驟如下步驟S3h設定某個低維向量調査問巻結果為中心對所有低維向量調査問巻結果作坐標變換;步驟S32:在坐標系中標示出坐標點,用於獲取調査問巻結果顯示圖。根據本發明的實施例,在步驟Sll為每份調査問巻設定一個維數等於總選項數的高維向量,高維向量中的每個分量對應一個選項,如果該選項被選擇,則該分量的值設為l,否則設為0。根據本發明的實施例,在步驟S13所述的歐式距離是(公式1)Y二(乂,y2,,凡)X表示一個高維向量調査問巻結果,X中的每一個分量:c,對應調査問巻中一個選項的選擇狀態,如果該選項被選中,則x,值設為l,反之設為0。Y的含義與X相同,i=l,2,3……n。根據本發明的實施例,在步驟S21所述最短高維向量連線距離,如果兩個高維向量間的歐式距離不大於預設值"則連接高維向量的兩個節點,形成連線圖G。根據本發明的實施例,計算高維向量各節點間最短距離的矩陣步驟如下在連線圖G中,計算高維向量所有節點i通過連線連接到其它所有節點j的最短距離,組成最短距離矩陣A:formulaseeoriginaldocumentpage8其中n為高維向量維數;^(U)表示節點1與節點1之間的最短連線距離,A(l,2)表示節點l與節點2之間的最短連線距離,其它符號表示的含義依此類推;每條連線的距離是它所連接兩點的歐式距離,同一個節點間的連線距離為0;如果無法通過連線連接兩點,則將該距離設為一個遠遠大於其它距離的極大值;根據本發明的實施例,構造降維向量步驟如下利用上述最短距離矩陣A計算平方距離矩陣S為formulaseeoriginaldocumentpage8再選取輔助矩陣H為:formulaseeoriginaldocumentpage9計算最短距離矩陣A的特徵矩陣r(Z^)為formulaseeoriginaldocumentpage9然後計算r(Z^)的特徵值,選取其中最大的3個值順序排列為A、A和^,並分別計算它們對應的特徵向如果要將高維向量調査結果降為3維或者2維、1維,則第量調查問巻結果^所對應的3維或2維、1維向量分別為formulaseeoriginaldocumentpage9其中^、^和]^分別表示特徵向量K、^和^的第i個分(公式2)按從大到小的^J2和^;第i個高維向(公式3)(公式4)(公式5)根據本發明的實施例,在步驟S2中任取一個三維向量(Z,/,?),對包括該向量在內的所有向量按下面公式作相應的坐標變換formulaseeoriginaldocumentpage9(公式6)其中(x,少,z)為向量的原始坐標,(;c',/,?)為其它向量變換後的坐標。本發明的優點或積極效果:由於本發明使用向量表示問巻的調査結果,所以能使調查問巻結果以向量形式表達,利用非線性的降維技術,可以在保證向量間距基本不變的條件下,將高維向量轉化為低維向量用於坐標顯示,使研究人員能清晰明了地比較被調查人員之間的差異,並基於視覺對被調查人員進行分類和聚類。圖l是本發明所述方法的流程圖;圖2是本發明實施例的流程圖;圖3是本發明的連線圖;圖4是本發明的實例演示圖。具體實施例方式下面將結合附圖對本發明加以詳細說明,應指出的是,所描述的實施例僅旨在便於對本發明的理解,而對其不起任何限定作用。人們期待能用一種更直接的方式來顯示調査問巻結果,例如可視化方式等。所述的可視化顯示方法是先將調査問巻結果用高維向量表示,然後用向量間距表示被調査對象之間的差異,在保證向量間距不變的前提下將高維向量降為三維向量,最後在三維坐標系中標出各個坐標點,坐標點之間的距離就表示被調査對象之間的差異。非線性降維技術(IS0MAP)能在保持數據內在屬性不變的前提下實現數據的降維。它基於高維變換技術(MDS),通過濾除高維數據中的非本質維數,將本質維數較低的高維數據投影到低維空間,從而能直接觀察高維數據。但目前對於非線性降維技術(IS0MAP)的研究,理論研究偏多,應用研究還不很完善。對調查問巻結果實現三維可視化,可以直觀地顯示問巻的統計結果,並根據圖形對被調查者進行分類和聚類。為可視化顯示調查問巻結果,先將調査問巻結果用高維向量表示,然後將高維向量降為三維以下向量,最後在坐標系中標出坐標點。在具體實施中要用到一臺個人計算機和一套數學軟體MATLAB編制算法程序,具體的算法程序編制技術屬於已公開技術,所以不予介紹。以圖2為例,首先統計調査問巻結果,然後用高維向量表示調査結果。接著利用降維技術,將高維向量轉化為低維向量。最後在坐標系中標示出低維向量,構成顯示圖。圖1是本發明所述方法的流程圖。按照圖1,本發明包括三個主要部分,一是用向量表示調查問巻結果、二是將高維向量降為低維向量、三是在坐標系中標示低維向量。圖1所示的可視化方法在實際應用中不僅限於三維顯示,還可以用於二維或一維顯示。如圖2所示本發明具體的實施例如下所述首先在步驟1統計調查問巻的總選項數和每份調查問巻的選擇結果。在步驟2用高維向量量化調查問巻結果;為每份調查問巻設定一個維數等於總選項數的高維向量。高維向量中的每個分量對應一個選項,如果該選項被選擇了,則該分量的值設為l,否則設為o。在步驟3對每一個高維向量計算它與其他所有高維向量之間的歐式距離,計算公式如下Y二(為,y2,......,_y)x表示一個高維向量調查問巻結果,X中的每一個分量^對應調查問巻中一個選項的選擇狀態,如果該選項被選中,則、值設為1,反之設為0;Y的含義與X相同,其中1=1,2,3,......n。低維向量調査問巻結果獲取步驟是將高維向量調査問巻結果降為低於三維向量,獲得低維向量調査問巻結果。所述調査問巻結果顯示圖獲取包括如下設定某個低維向量調查問巻結果為中心對所有低維向量調查問巻結果作坐標變換;在坐標系中標示出坐標點,用於獲取調查問巻結果顯示圖。在步驟4建立一張連線圖G。建立連線圖的方法是,將每個高維向量用一個節點表示,如果兩個高維向量間的歐式距離不大於預設值e,(公式l)則連接這兩個節點。對所有節點都重複上面的步驟,就形成了一張連線圖。預設值e選取所計算出歐式距離中最大三個值的任一個,一般取最大值。在步驟5計算表示各節點間最短距離的矩陣;計算方法為,在連線圖G中,計算所有節點i通過連線連接到其它所有節點j的最短距離,組成最短距離矩陣"formulaseeoriginaldocumentpage12…其中n為高維向量的維數,A(l,l)表示節點l與節點l之間的最短連線距離,A(l,2)表示節點l與節點2之間的最短連線距離,其它符號表示的含義依此類推。每條連線的距離是它所連接兩點的歐式距離,同一個節點間的連線距離為0。如果無法通過連線連接兩點,則將該距離設為一個遠遠大於其它距離的極大值;在步驟6構造降維向量1.利用上述最短距離矩陣^計算平方距離矩陣S為5=《(l,l)《(1,2)《(2,1)《(2,2)、《(",1)^0,2)2.再選取輔助矩陣H為1formulaseeoriginaldocumentpage123.計算最短距離矩陣^的特徵矩陣r(Z^)為:<Z^)=-HSH/2(公式2)4.然後計算r(Z^)的特徵值,選取其中最大的3個值,按從大到小的順序排列為A、A和^3,並分別計算它們對應的特徵向量^、K和^。如果要將高維向量調查結果降為3維或者2維、1維,則第i個高維向量調查問巻結果y,所對應的3維或2維、1維向量分別為其中Fj'、^和F/分別表示特徵向量F;、K和F3的第i個分量。在步驟7中任取一個三維向量(x*,/,?),對包括該向量在內的所有向量按下面公式作相應的坐標變換其中(x,;;,Z)為向量的原始坐標,(;c',/,z')為其它向量變換後的坐標。在步驟8根據各個向量的坐標點和他們的連線關係在MATLAB中編制繪圖程序生成三維坐標圖形。下面是另一個具體實施例假設有甲、乙、丙、丁四個人填寫了一份關於手機消費的調查問巻。調查問巻內容如下①手機費用中主要費用來自哪項?A市話費用B長途話費②所選用的手機卡是下列哪項?A移動動感地帶卡B聯通cdma卡③選擇該手機卡的理由?A長途話費便宜B市話費用便宜C月租費用便宜甲、乙、丙、丁四人的填寫結果如下tableseeoriginaldocumentpage14接下來我們用可視化方法來分析調查結果。首先將調查結果用向量表示。因為整個問巻共有7個選項,所以每份調查問巻的填寫結果用一個7維向量來表示。根據步驟2所述的方法,用A、B、C、D四個向量表示甲、乙、丙、丁四人的調查結果,它們分別為A二(l,O,O,l,O,1,1)T;B二(O,1,1,0,l,O,O";C二(l,l,O,l,O,O,IK;D二(l,O,1,1,0,l,0)r。然後計算向量間的歐式距離。formulaseeoriginaldocumentpage14選定e值為最大連線距離2.646,按照步驟4所述方法建立連線圖如圖3所示。接下來計算連線圖中每兩個節點之間的最短連線距離。從A到B有兩條連線,分別是3s、gcs和gx^,分別計算這兩條連線的距離formulaseeoriginaldocumentpage14所以從A到B的最短連線距離為2.6。同理,我們可以計算出從A到C的最短距離為1.4,從A到D的最短距離為1.4,從B到C的最短距離為2.2,從B到D的最短距離為2.2,從C到D的最短距離為2。並且容易看出,從節點i到節點j的最短距離與從節點j到節點i的最短距離是相同的。這樣計算得到最短距離矩陣為'02.6461.4141.414、2.64602.2362.23661.4142.23602、1.4142.23620^根據上述步驟6的計算方法,計算變換矩陣為卿=1,188-1.5630.1880.188-1.5632.688-0.563-0.5630.188-0.5631.188-0.8130.188-0.563-0,8131.188編制MATLAB算法程序計算特徵矩陣r(化)的特徵值為^=3.862,^=2,4=0.388,A4=0,與各特徵值相對應的特徵向量Fj二(O.508,0.831,-0.161,—0.161)r;F2=(0,0,-0.707,0.707)r;K3=(0.701,0.245,—0.473,—0.473)r;r4=(-0.5,-0.5,-0.5,-0.5)r。根據步驟6中的公式,將A、B、C、D降為3維坐標向i1=(-0.998,0,0.437)r;5*=(1.632,0,0.153)r;C*=(—0.317,—1,—0.295)r;=(-0.317,1,-0.295)r;以爿*為坐標原點,變換爿+、^*、c*、zr坐標為乂=(0,0,0)r;5'=(2.6304,0,—0.284)r;C*=(0.681,-1,-0.732)r;二(O.681,1,-0.732)r;最後利用MATLAB編寫繪圖程序在三維坐標系中標出各個坐標點,繪製三維坐標圖形,然後使用windows作業系統自帶的"畫圖"程序加工生成三維坐標圖形,得到圖4。使用圖4分析被調查人員之間的差異,圖中每個黑點代表一位被調查對象,任意兩個黑點間的直線連接距離表示這兩個黑點所代表被調査對象之間的差異。如圖4所示,發現乙距其它三人較遠,這說明乙與其它三人的手機使用狀況差別較大,所以就手機使用狀況而言,可以把其它三人分為一類,而將乙分為單獨分為一類。對比調査問巻結果,發現乙的手機話費主要是長途話費,而另外三人的手機話費則以市話費用為主,這說明圖4能夠直觀有效地反映被調查對象之間的差異,從而能對被調査對象進行正確地分類和聚類。總之,採用本發明可以將調查問巻的調查結果用圖形的方式表示出來,為研究人員區分被調查對象之間的差異提供幫助。以上所述,僅為本發明中的具體實施方式,但本發明的保護範圍並不局限於此,任何熟悉該技術的人在本發明所揭露的技術範圍內,可理解想到的變換或替換,都應涵蓋在本發明的包含範圍之內,因此,本發明的保護範圍應該以權利要求書的保護範圍為準。權利要求1、一種基於選擇題型調查問卷的結果可視化實現方法,其特徵在於實現步驟如下步驟S1對調查問卷結果進行處理,獲取高維向量調查問卷結果;步驟S2在保持高維向量調查問卷結果間距離基本不變的前提下,將高維向量調查問卷結果降為3維以下的低維向量調查問卷結果;步驟S3根據降維後的低維向量調查問卷結果,在選定的坐標系中標示出坐標點,獲得調查問卷結果顯示圖。2、根據權利要求1所述可視化實現方法,其特徵在於所述高維向量調查問巻結果獲取,還包括步驟如下步驟S11:獲取調査問巻結果;.步驟S12:用高維向量量化調査問巻結果;步驟S13:計算高維向量調查問巻結果之間的歐式距離;步驟S14:根據歐式距離建立高維向量調査問巻結果的高維向量連線圖;步驟S15:計算高維向量連線圖中任意兩點最短高維向量連線距離。3、根據權利要求1所述可視化實現方法,其特徵在於所述低維向量調查問巻結果獲取,還包括將最短高維向量連線距離降為低於三維向量,獲得低維向量調査問巻結果。4、根據權利要求1所述可視化實現方法,其特徵在於所述調查問巻結果顯示圖獲取,還包括步驟如下步驟S31:設定某個低維向量調查問巻結果為中心對所有低維向量調查問巻結果作坐標變換;步驟S32:在坐標系中標示出坐標點,用於獲取調査問巻結果顯示圖。5、根據權利要求2所述可視化實現方法,其特徵在於為每份調査問巻設定一個維數等於總選項數的高維向量,高維向量中的每個分量對應一個選項,如果該選項被選擇,則該分量的值設為i,否則設為o。6、根據權利要求2所述可視化實現方法,其特徵在於所述的歐式距離是y:(乃,力,,凡)X表示一個高維向量調査問巻結果,X中的每一個分量x,對應調査問巻中一個選項的選擇狀態,如果該選項被選中,則x,值設為l,反之設為O,Y的含義與X相同。7、根據權利要求3所述可視化實現方法,其特徵在於所述最短高維向量連線距離,如果兩個高維向量間的歐式距離不大於預設值e,則連接高維向量的兩個節點,形成連線圖G。8、根據權利要求3所述可視化實現方法,其特徵在於計算所述高維向量各節點間最短距離的矩陣步驟如下在連線圖G中,計算所有高維向量節點i通過連線連接到其它所有節點j的最短距離,組成最短距離矩陣"為g(U)4(1,2)…4(1,")、^4(2,1)^(2,2)…4(2,")其中n為高維向量的維數;^(1,1)表示節點1與節點1之間的最短連線距離,^(1,2)表示節點l與節點2之間的最短連線距離,其它符號表示的含義依此類推;每條連線的距離是它所連接兩點的歐式距離,同一個節點間的連線距離為0;如果無法通過連線連接兩點,則將該距離設為一個遠遠大於其它距離的極大值。(公式l)cg(",2)9、根據權利要求1所述可視化實現方法,其特徵在於構造降維向:步驟如下利用步驟8的最短距離矩陣A計算平方距離矩陣S為formulaseeoriginaldocumentpage4再選取輔助矩陣H為:formulaseeoriginaldocumentpage4計算最短距離矩陣^的特徵矩陣r(DJ為r(Lg=-HSH/2(公式2)然後計算r(/^)的特徵值,選取其中最大的3個值,按從大到小的順序排列為^、^和^,並分別計算它們對應的特徵向量Fi、^和^;如果要將高維向量調查結果降為3維或者2維、l維,則第i個高維向量調查問巻結果y,所對應的3維或2維、1維向量分別為formulaseeoriginaldocumentpage4和^分別表示特徵向量^、^和G的第i個分量。10、根據權利要求3所述可視化實現方法,其特徵在於在上述降維向量中任取一個三維向量(X',/,?),對包括該向量在內的所有向量按下面公式作相應的坐標變換'/二y—/(公式6)z,=z-其中(x,少,z)為向量的原始坐標,(x',/,?)為其它向量變換後的坐標。全文摘要本發明公開一種基於選擇題型調查問卷的結果可視化實現方法,解決常規的調查問卷結果分析技術不能區分被調查對象之間的差異,而且分析結果也不夠直觀,本發明的方法對調查問卷結果進行處理,獲取高維向量調查問卷結果;在保持高維向量調查問卷結果間距離基本不變的前提下,將高維向量調查問卷結果降為3維以下的低維向量調查問卷結果;根據降維後的低維向量調查問卷結果,在選定的坐標系中標示出坐標點,獲得調查問卷結果顯示圖。本發明利用非線性的降維技術,將高維向量轉化為低維向量用於坐標顯示,並能直觀反映被調查對象之間差異,並基於視覺對被調查人員進行分類和聚類。實現調查問卷結果可視化顯示。文檔編號G06F17/30GK101315691SQ20071009987公開日2008年12月3日申請日期2007年5月31日優先權日2007年5月31日發明者吳龍庭,霞崔,戴汝為,李耀東,王春恆申請人:中國科學院自動化研究所

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀