一種對電視節目評估調研樣本數據的處理方法
2023-08-06 07:40:11 1
專利名稱:一種對電視節目評估調研樣本數據的處理方法
技術領域:
本發明涉及一種數據的處理方法,尤其是涉及一種對電視節目評估調研樣本數據的處理方法。
背景技術:
在對電視節目評估的調研中,合理精確地對整體樣本群進行樣本篩選及管理是完成科學調研的基礎和前提,也是實現調研數據有效的根本保障。電視節目評估調研樣本篩選及管理技術是一種可以實現多條件、多定義樣本篩選;手動標籤增設與軟體自動篩選相結合;樣本多級管理的技術應用,實現便捷、快速、高效的樣本抽取工作。近年來,隨著各類調研工作對分層樣本精確管理需求的發展,樣本篩選及管理技術的應用領域不斷擴大,廣泛應用於媒介調研、商業調研及各專業科研調研當中。·從電視節目評估樣本抽取效果來看,樣本篩選及管理技術經歷了人工抽取、計算機輔助篩選抽取等發展階段。人工抽取樣本通過對樣本人工排序和編號,形成樣本抽樣框,再按照一定規律及比例抽取樣本,該方式耗時長、費人力,當對符合分層要求的樣本進行篩選時核算樣本在各分層中所佔比例存在一定困難,對樣本變動、調整及替補時難以進行適時跟蹤,容易造成誤差及疏漏;計算機輔助抽取,通常採用EXCEL電子表格軟體設定公式及篩選條件對樣本進行篩選及管理,輔助完成抽樣工作,一般都提供固定個數的條件篩選,而且當條件取值發生變化或條件發生變化時都需要重新進行數據篩選的程序設計,若要從2000個有20個以上屬性的樣本數據,篩選出各種屬性以及屬性值相交的樣本,並且還要考慮屬性的變化,這樣的篩選條件是無法窮盡的;雖然該技術相對於人工抽取樣本更為簡易、快捷,但無法實現對分層樣本各元素的多重定義抽取,無法對樣本進行跟蹤、篩選、推送,從而達到有效管理。
發明內容
本發明的目的就是為了克服上述現有技術存在的不足而提供一種能夠實現任意多條件的樣本任意組合的篩選功能,具有較好的完全性、易擴展性和可移植性的對電視節目評估調研樣本數據的處理方法。本發明的目的可以通過以下技術方案來實現一種對電視節目評估調研樣本數據的處理方法,該方法包括以下步驟(I)DSL生成器輪詢設置在控制端的界面控制項狀態,生成條件序列,並將其發送給解析器;(2)解析器將第一個謂詞表達式設為「真」 ;(3)解析器判斷當前DSL條件是否為「空」,如果為是,則執行步驟(4);如果為否,則執行步驟(8) ;(4)解析器判斷當前條件序列的連接符是否為「與」;如果為是,執行步驟(5);否則執行步驟
(6);(5)解析器將當前條件序列轉換為謂詞表達式,和前一個謂詞表達式「與」連接,生成表達式樹,然後轉到步驟(7) ;(6)解析器將當前條件序列轉換為謂詞表達式,和前一個謂詞表達式「或」連接,生成謂詞表達式樹,然後轉到步驟(7) ;(7)重複步驟(I) (6),如果界面控制項狀態沒有變化,解析器將最後生成的謂詞表達式樹發送給執行器;(8)執行器將謂詞表達式樹應用到限制運算的條件子句;(9)執行器輸出源數據的相應子集,並通過呈現端顯示出來。所述的步驟(I)中的生成條件序列的每個條件都是一個四分量的元組t = (C,P,V,O),C是連接符,支持AND、0R ;P是屬性,取自被篩選對象的篩選指標,V是值域,支持單值和多值,視運算符決定;O是運算符,支持 = ,,>,> = ,<,< = , in, not in。當使用in和not in時,值域V可以包含多個值,並以謂詞OR連接,其他情況都只能使用單值。與現有技術相比,本發明對電視節目評估調研樣本數據採用電腦程式設定抽取技術進行處理,可根據不同分層元素設定樣本取值,實現多條件多定義樣本篩選,具有較好的完全性、易擴展性和可移植性,為樣本選取工作提供了很大的自由度。對於樣本調研,其查詢需求無法窮盡,故採用DSL定義用戶的查詢需求,所謂DSL即本領域專用語言(DomainSpecific Language/DSL),是採用結構化數據描述無歧義需求方法的通稱,可讓用戶定義任意需求。本發明通過電腦程式設定抽取技術進行處理,可根據不同分層元素設定樣本取 值,實現多條件多定義樣本篩選、手動標籤增設與電腦程式自動篩選相結合、樣本多級管理等功能,依據科學人口數據進行分層比例數據計算,並根據調研需要設定樣本規模,設置不同組別抽樣數額,統計抽取人數及差額樣本值。電腦程式抽取樣本技術直觀、科學地實現了對樣本的抽取及管理工作,為確定、調整、替換樣本創造了精確手段,具有更加廣泛的適用性,可對於每個特定的項目,按照樣本屬性進行符合調查需求的抽樣處理。
圖I為本發明的處理方法流程圖;圖2為本發明處理方法中表達式樹I的示意圖;圖3為本發明處理方法中表達式樹II的示意圖;圖4為本發明的系統結構示意圖。
具體實施例方式下面結合附圖和具體實施例對本發明進行詳細說明。實施例本實施例先做如下設定設有任意數量和屬性的樣本集合——例如有2000條樣本數據,每條數據均有編號、名稱、學歷、收入、聯繫方式等任意多個屬性。調查人員希望找到其中居住在盧灣/徐匯兩區且受過碩士教育的樣本。類似這樣的查詢條件無法一一窮盡,因此採用DSL方法。原始數據的前7條如下
權利要求
1.一種對電視節目評估調研樣本數據的處理方法,該方法包括以下步驟 (1)DSL生成器輪詢設置在控制端的界面控制項狀態,生成條件序列,並將其發送給解析器; (2)解析器將第一個謂詞表達式設為「真」; (3)解析器判斷當前DSL條件是否為「空」,如果為是,則執行步驟(4);如果為否,則執行步驟⑶; (4)解析器判斷當前條件序列的連接符是否為「與」;如果為是,執行步驟(5);否則執行步驟⑶; (5)解析器將當前條件序列轉換為謂詞表達式,和前一個謂詞表達式「與」連接,生成表達式樹,然後轉到步驟(7); (6)解析器將當前條件序列轉換為謂詞表達式,和前一個謂詞表達式「或」連接,生成謂詞表達式樹,然後轉到步驟(7); (7)重複步驟(I) ¢),如果界面控制項狀態沒有變化,解析器將最後生成的謂詞表達式樹發送給執行器; (8)執行器將謂詞表達式樹應用到限制運算的條件子句; (9)執行器輸出源數據的相應子集,並通過呈現端顯示出來。
2.根據權利要求I所述的一種對電視節目評估調研樣本數據的處理方法,其特徵在於,所述的步驟(I)中的生成條件序列的每個條件都是一個四分量的元組t= (C,P,V,0),C是連接符,支持AND、OR ;P是屬性,取自被篩選對象的篩選指標,V是值域,支持單值和多值,視運算符決定;O是運算符,支持 = ,,>,> = ,<,< = , in, not in。當使用in和not in時,值域V可以包含多個值,並以謂詞OR連接,其他情況都只能使用單值。
全文摘要
本發明涉及一種對電視節目評估調研樣本數據的處理方法,該方法採用DSL領域語言描述樣本篩選的條件,然後通過解析器將條件序列轉換為複合謂詞表達式樹,接著將表達式樹和原數據加載到執行器中進行限制運算,最後輸出相應的關係數據子集。與現有技術相比,本發明能夠實現根據任意多個條件篩選樣本的功能,以及具有較好的完全性、易擴展性和可移植性等優點。
文檔編號G06F17/30GK102955823SQ20111025340
公開日2013年3月6日 申請日期2011年8月30日 優先權日2011年8月30日
發明者方方, 雷雯, 黃昊天, 季雋, 葉海松, 沙揚 申請人:方方