新四季網

一種法律資料庫構建方法及法律檢索服務方法

2023-06-03 04:41:11 2

一種法律資料庫構建方法及法律檢索服務方法
【專利摘要】本發明提供一種法律資料庫構建方法,包括:1)對於一個新的法律文本,按條目拆分所接收的法律文本,得到相應的法律條目文檔並創建相應的唯一標識;2)對每個法律條目文檔進行分詞,對於分詞所得的每個詞項,在基於內容的倒排索引中建立或更新該詞項所對應的唯一一條記錄,所述基於內容的倒排索引的每條記錄均包括:內容中出現該條記錄所對應詞項的每個法律條目文檔及相應的索引信息;3)回到步驟1)處理下一個法律文本直至所有法律文本均處理完畢。本發明還提供了相應的檢索服務方法。本發明使得一次檢索即可獲得精確到法律條目的檢索結果。
【專利說明】一種法律資料庫構建方法及法律檢索服務方法
【技術領域】
[0001]本發明涉及計算機文本信息檢索,具體地說,本發明涉及一種法律資料庫構建方法及法律檢索服務方法。
【背景技術】
[0002]信息檢索是指將記錄信息的資料按一定的方式組織和存儲起來,並根據用戶的需要找出有關信息的過程。利用信息檢索技術,人們可以更加容易的從海量的資料中尋找到需要的知識,提高了知識獲取的效率。
[0003]法律檢索系統是將信息檢索技術作用於法律法規文本的一種應用,可以幫助各級人大機關、黨政機關,法院、檢察院、律師事務所等法律從業機構的工作人員,快速找到所需的法律法規信息。同時,法律檢索系統也向社會大眾提供法律檢索服務。
[0004]目前的法律檢索系統,如全國人大的「中國法律法規檢索系統」,北京大學的「北大法寶」等,都是針對法律法規全文及其標題、日期、發布部門、法規分類、效力級別、時效性等元數據組合信息進行檢索,返回的檢索結果以法律法規全文為基本單位。然而用戶往往需要找到案情可能適用的法條,所以在獲得檢索結果後,用戶還需要進一步地自行查找相關法條。
[0005]另一方面,用戶往往期望找到與案情相關的所有相關法條,目前的法律檢索都是對關鍵字的精確匹配,如果關鍵字不夠準確,檢索出的結果就可能存在遺漏,有的相關法條可能不在檢索結果範圍之內。因此為找到更多的相關法條,用戶往往需要嘗試使用多種關鍵字或關鍵字組合,進行多次、反覆檢索,才能最終找到所需的多個相關法律條目。因此,現有法律檢索的便捷性亟待提高。
[0006]因此,當前迫切需要一種能夠幫助用戶更快速地找到所需的法律法規信息的法律檢索服務方案。

【發明內容】

[0007]因此,本發明的任務是克服現有技術的不足,提供一種能夠幫助用戶更快速地找到所需的法律法規信息的法律檢索服務方案。
[0008]本發明提供了一種法律資料庫構建方法,包括下列步驟:
[0009]I)法律資料庫接收一個新的法律文本,按條目拆分所接收的法律文本,得到相應的法律條目文檔並創建相應的唯一標識;
[0010]2)對每個法律條目文檔進行分詞,對於分詞所得的每個詞項,在基於內容的倒排索引中建立或更新該詞項所對應的唯一一條記錄,所述基於內容的倒排索引的每條記錄均包括:內容中出現該條記錄所對應詞項的每個法律條目文檔及相應的索引信息;
[0011]3)回到步驟I)接收下一個法律文本並進行相應的處理,直至所有法律文本均處
理完畢。
[0012]其中,所述步驟2)中,所述索引信息包括:所對應詞項的逆文檔頻率,以及所對應詞項出現在每個法律條目文檔的詞頻;其中,所述逆文檔頻率是基於法律資料庫中的法律條目文檔的逆文檔頻率。
[0013]其中,所述步驟2)包括下列子步驟:
[0014]21)遍歷拆分得到的每個法律條目文檔,對於當前法律條目文檔,對其進行分詞;
[0015]22)遍歷分詞得到的所有詞項,對每一個詞項,計算當前詞項出現在所述當前法律條目文檔中的詞頻,在基於內容的倒排索引中查找對應於所述當前詞項的記錄,如果查找到已存的所述當前詞項的記錄,在記錄中增加所述當前法律條目文檔的標識,以及所述當前詞項在所述當前法律條目文檔中出現的詞頻,並更新所述當前詞項的逆文檔頻率;如果未查找到已存的所述當前詞項的記錄,則在所述基於內容的倒排索引的詞典中增加所述當前詞項,同時增加一條新的記錄,所述新的記錄包括所述當前詞項的逆文檔頻率,所述當前法律條目文檔的標識,以及所述當前詞項在所述當前法律條目文檔中出現的詞頻。
[0016]本發明還提供了一種基於上述法律資料庫的法律檢索服務方法,包括下列步驟:
[0017]4)獲取作用於內容域的檢索向量;
[0018]5)對於檢索向量中的每個關鍵詞,根據基於內容的倒排索引,找到內容中出現該關鍵詞的每個法律條目文檔及相應的索引信息;
[0019]6)根據相應的索引信息對命中的法律條目文檔進行排序。
[0020]其中,所述步驟5)中,所述索引信息包括:所對應詞項的逆文檔頻率,以及所對應詞項出現在每個法律條目文檔的詞頻;其中,所述逆文檔頻率是基於法律資料庫中的法律條目文檔的逆文檔頻率。
[0021]其中,所述步驟6)包括下列子步驟:
[0022]61)對於步驟5)中命中的每個法律條目文檔,得到維度與所述檢索向量一致的法律條目文檔向量,所述法律條目文檔向量的每個元素對應於一個關鍵詞,每個元素的值根據步驟5)所找到的該關鍵詞的逆文檔頻率,以及該法律條目文檔的內容中出現該關鍵詞的詞頻得出;
[0023]62)將法律條目文檔向量和檢索向量的相似度作為相應法律條目文檔的檢索相似度,根據所述檢索相似度對各個命中的法律條目文檔進行排序。
[0024]其中,所述步驟62)中,所述的法律條目文檔向量和檢索向量的相似度為法律條目文檔向量和檢索向量的餘弦相似度。
[0025]其中,所述步驟6)中,所述法律條目文檔向量中,每個元素的值為步驟5)所找到的該元素所對應的關鍵詞的逆文檔頻率,和該法律條目文檔的內容中出現該元素所對應的關鍵詞的詞頻的乘積。
[0026]其中,所述法律條目文檔包括元信息和內容,所述元信息包括法律條目所屬法律文本的標題,以及法律條目在所屬法律文本中的所屬章節和編號。
[0027]其中,所述步驟6)還包括:將命中的法律條目文檔的所屬法律作為命中法律,根據各個命中的法律條目文檔的所述檢索相似度,得出每個命中法律的檢索相似度對各個命中法律進行排序,然後依排序顯示每個命中法律中的命中的各個法律條目文檔的內容和元信息。
[0028]其中,所述法律檢索服務方法還包括步驟:
[0029]7)對於每個命中法律,根據該命中法律與所述法律資料庫中其它法律的相似度,查找並顯示該命中法律的相關法律;
[0030]所述相關法律根據法律之間的相似度確定,其中,兩個法律之間的相似度按下述方法得出:對所有法律標題進行分詞獲得一系列詞項,並根據詞性提取出標題中的屬於主語結構、謂語結構和賓語結構的詞項,用所提取出的詞項構成特徵子空間,將所有法律標題都轉換為所述特徵子空間上的詞項向量的表述形式,將兩個法律標題所對應的兩個詞項向量的在所述特徵子空間的相似度作為所述兩個法律之間的相似度。
[0031]其中,所述步驟7)中,對於每個命中法律,顯示該命中法律與其相關法律的關聯關係圖,所述關聯關係圖包括:一系列點和連接各點的邊,每個點代表所述命中法律或者一個該命中法律的一個相關法律,每條邊上顯示其兩個端點所對應的兩個法律之間的相似度。
[0032]與現有技術相比,本發明具有下列技術效果:
[0033]1、一次檢索即可獲得精確到法律條目的檢索結果。
[0034]2、不僅能獲得與檢索語句匹配的法律條目,還可以進一步獲得所有相關法律,從而幫助用戶更全面地找到與案情相關的所有法條,降低了法律法規信息的檢索難度。
【專利附圖】

【附圖說明】
[0035]以下,結合附圖來詳細說明本發明的實施例,其中:
[0036]圖1示出了本發明一個實施例的整體流程示意圖;
[0037]圖2示出了本發明一個實施例中建立以法律條目文檔為存儲單元的法律資料庫的流程示意圖;
[0038]圖3示出了本發明一個實施例中的倒排索引中詞典與索引記錄表的結構實例;
[0039]圖4示出了本發明一個實施例中的檢索服務的流程示意圖;
[0040]圖5示出了本發明一個實施例中的關聯檢索服務的流程示意圖;
[0041]圖6示出了本發明一個實施例中的命中法律及其相關法律的關聯關係圖示例。
【具體實施方式】
[0042]根據本發明的一個實施例提供了一種法律檢索服務方法,如圖1所示,它包括三個部分。第一部分是:建立以法律條目文檔為存儲單元的法律資料庫,以及相應的倒排索弓I。第二部分是:接收檢索語句,基於法律資料庫及相應的倒排索引,返回精確到法律條目的檢索結果。第三部分是:基於第二部分的檢索結果,進一步查找檢索結果所屬法律的相關法律,並將所找到的相關法律加入檢索結果。下面對這三個部分分別進行詳細描述。
[0043]一、建立以法律條目文檔為存儲單元的法律資料庫,以及相應的倒排索引。現有技術中,通常由整部法律構成一個法律文檔,法律資料庫通常以法律文檔為單位存儲法律數據。而本實施例中,法律資料庫中以法律條目文檔為基本存儲單元。即每個法律條目各自構成一個文檔。為便於理解,下面以《中華人民共和國全國人民代表大會及地方各級人民代表大會選舉法》這一法律文檔為例進行說明。該法律文檔中,其文本主要包括:標題,題注,目錄,正文。
[0044]圖2示出了本發明一個實施例中建立以法律條目文檔為存儲單元的法律資料庫的流程示意圖,參考圖2,將法律文檔依次輸入法律資料庫,對於每個法律文檔,執行下列步驟11至14。
[0045]步驟11:對法律文檔結構進行識別及拆分。通過預先定義的規則,識別法律文檔的結構信息,如篇、章、節;進一步識別並定位法律文本中的每一條目,並將其按條目一一拆分。其中,將正文按條目拆分為N個子文檔,以《中華人民共和國全國人民代表大會及地方各級人民代表大會選舉法》的法律文檔為例,其條目共有66條,所以,將其拆分為66個子文檔。其中,每個子文檔均包括:法律條文內容,所屬法律標題及其在所屬法律中的層次結構。例如:《中華人民共和國全國人民代表大會及地方各級人民代表大會選舉法》第一條所對應的子文檔存儲有法律條文內容:根據中國人民政治協商會議共同綱領第十二條,中華人民共和國全國人民代表大會及地方各級人民代表大會由各民族人民用普選方法產生之;所屬法律標題:中華人民共和國全國人民代表大會及地方各級人民代表大會選舉法;在所屬法律中的層次結構:第一章第一條。
[0046]步驟12:對拆分好的子文檔(即法律條目文檔)建立索引。經過拆分後,將每一個條目作為一個子文檔,在內容域上進行分詞(即對子文檔的內容部分進行分詞),對於分詞得到的每個詞項(重複出現的詞彙被視作同一詞項),統計其詞頻(tf)及逆文檔頻率(idf),並在此基礎建立倒排索引。倒排索引分為詞典和倒排記錄表兩部分。圖3示出了一個倒排索引中詞典與索引記錄表的結構實例。如圖3所示,對於一條記錄,由一個詞項作為其唯一標識,存儲在倒排索引的詞典中。同時,詞典中還存儲倒排記錄表中對應記錄的連結以及該條記錄的詞項在法律資料庫中的逆文檔頻率,需注意的是該逆文檔頻率是基於法律資料庫中的所有法律條目文檔所計算的逆文檔頻率,而非常見的基於法律文檔所計算的逆文檔頻率。在倒排記錄表中,每條記錄以鍊表的形式存儲,包含了所有出現該詞項的法律條目,如圖3的倒排記錄表中對應於詞項I的記錄,其四個節點分別代表法律條目文檔1,2,3,4,這表示法律條目文檔1,2,3,4中都出現了詞項I,對應於詞項2的記錄,其兩個節點分別代表法律條目文檔5,6表示法律條目文檔5,6中都出現了詞項2。其中,每個代表法律條目文檔的節點均記錄法律條目的id,詞項出現在該法律條目子文檔中的頻率,以及詞項出現在該法律條目子文檔中的位置等其他信息。
[0047]步驟13:對法律的標題,以及發布時間,發布機構等其它信息域建立索引。其中,對標題進行分詞而後建立相應的倒排索引,其它各域不進行分詞,而是將每一個域的整體內容作為一個詞項。例如:發布機構為中央人民政府委員會時,在該倒排索引中,「中央人民政府委員會」整體作為一個詞項。
[0048]步驟14:將內容域、標題域以及發布時間,發布機構等其它元數據信息域的多個倒排索引以文件的形式存儲在系統中。
[0049]二、接收檢索語句,基於法律資料庫及相應的倒排索引,返回精確到法律條目的檢索結果。本實施例可以提供多域組合檢索服務。同時,它可以將屬於同一部法律法規的多條相關條目歸為一類,並組合顯示。通常來說,檢索服務分可為簡單和高級兩種模式。簡單模式是在標題和內容域上檢索相同的檢索語句,該模式下用戶直接輸入檢索語句即可。高級模式則可以通過元數據信息域支持對於元數據的枚舉篩選,該模式下用戶需要指定需要檢索的域以及在該域上輸入檢索語句或選擇枚舉值。例如「內容:消費權益保障&標題:保護法&發布機構(枚舉值):全國人民代表大會」。檢索服務返回檢索相關的條目內容與其元數據信息。檢索語句可以是詞彙(如「經濟」)、詞彙集合(如「經濟政策」)或短語(如「經濟政策」)。針對不同的信息域,通常會有不同的檢索服務方式,例如,對內容域和標題域,檢索語句通常需要進行分詞,而其它元信息域的檢索語句則不做分詞處理,直接把檢索語句作為相應元信息域的關鍵詞即可。本實施例的精確到法律條目的檢索主要是指作用於內容域的檢索服務上,因此下文中主要對作用於內容域的檢索服務進行描述,其餘與本發明主旨無關的部分,本文中不再贅述。
[0050]圖4示出了本發明一個實施例中的檢索服務的流程示意圖,參考圖4,檢索服務包括下列步驟21至24。
[0051]步驟21:接收作用於內容域的檢索語句。如前文所述,檢索語句可以是詞彙(如「經濟」)、詞彙集合(如「經濟政策」)或短語(如「經濟政策」)。
[0052]步驟22:對檢索語句進行分詞,獲得相應的一個或多個檢索關鍵詞,組成檢索向量。
[0053]步驟23:在內容域上,對於每個關鍵詞,基於該域的倒排索引,找到該關鍵詞的逆文檔頻率,出現該關鍵詞的每個法律條目文檔,以及該關鍵詞在相應法律條目文檔中的詞頻。倒排索引中存儲了法律資料庫中屬於該域的所有詞項的索引記錄,查找到關鍵詞對應的詞項的索引,就可得到所需的信息。例如關鍵詞為「經濟」和「政策」時,在倒排索引分別查找到詞項「經濟」的索引記錄以及「政策」的索引記錄,這樣就可以從「經濟」的索引記錄中得到詞項「經濟」的逆文檔頻率,含有「經濟」的每個法律條目文檔,以及「經濟」在每個法律條目文檔中出現的詞頻。同樣地,從「政策」的索引記錄中,獲取詞項「政策」的逆文檔頻率,含有「政策」的每個法律條目文檔,以及「政策」在每個法律條目文檔中出現的詞頻。此時,對詞項「經濟」和「政策」的法律條目文檔列表取併集,就獲得了該域上所有的與檢索相關的文檔。如果所選擇的是高級檢索模式,則在所有域上基於對應的一個或多個關鍵詞進行檢索。
[0054]步驟24:計算查找到的每個法律條目文檔的檢索相關度,根據檢索相關度對查找到的各法律條目文檔進行排序,其中檢索相關度越大,排序越靠前。然後將排序後的所述查找到的各法律條目文檔的信息作為檢索結果。其中,對於僅作用於內容域的檢索,基於步驟23得到維度與所述檢索向量一致的法律條目文檔向量,所述法律條目文檔向量的每個元素對應於一個關鍵詞,每個元素的值根據步驟23所找到的該關鍵詞的逆文檔頻率,以及該法律條目文檔的內容中出現該關鍵詞的詞頻得出。可以直接將法律條目文檔向量和檢索向量的相似度作為相應法律條目文檔的在內容域的檢索相似度,根據所述檢索相似度對各個命中的法律條目文檔進行排序。這樣就能呈現出檢索語句在內容域上的綜合檢索結果。所述的法律條目文檔向量和檢索向量的相似度為法律條目文檔向量和檢索向量的餘弦相似度。所述法律條目文檔向量中,每個元素的值為步驟23所找到的該元素所對應的關鍵詞的逆文檔頻率和該法律條目文檔的內容中出現該元素所對應的關鍵詞的詞頻的乘積。
[0055]而對於高級模式的檢索,一個法律條目文檔的檢索相關度是該法律條目文檔對應於各個域的相關度的線性加權和,一個法律條目文檔對應於一個域的相關度等於在文本的向量空間模型下,該域上的條目文檔的向量表示和檢索內容的向量表示(即檢索向量)的餘弦相似度。條目文檔的向量表示中,用詞項的逆文檔頻率與該詞項在該法律條目文檔中的詞頻的乘積作為每一維的數值,檢索內容的向量表示中,則只用詞項的詞頻作為每一維的數值。這樣就能呈現出檢索語句的綜合檢索結果,並且其排序考慮了各個域,及各域上多個關鍵詞的不同影響。
[0056]進一步地,在一個實施例中,根據步驟24中查找到的法律條目文檔(即命中的法律條目文檔)的所屬法律,以法律為基礎的對法律條目文檔進行整合歸類。計算整個法律文本的檢索相關度並基於整個法律文本的檢索相關度參與檢索相關度排序,整個法律文本的檢索相關度等於所查找到的屬於它的各個法律條目文檔的檢索相關度之和。這樣就將檢索獲得的條目列表按照法律進行整合歸類,並在原有的條目相關度的基礎上,重新計算法律的相關度值,重新排序,達到以法律為單位集中顯示,並僅列出該部法律中相關條目而非全文,且法律中的條目按相關度有序的呈現效果。這種方案能夠使得檢索結果更有邏輯性,更加美觀且便於用戶瀏覽。
[0057]三、基於第二部分的檢索結果,進一步查找檢索結果所屬法律的相關法律,並將所找到的相關法律加入檢索結果。這一部分實質上是一種關聯檢索服務,它針對法律法規這種具有一定規範化結構的文本,進行關聯度的計算,並提取出關聯的圖形化描述,從而更加直觀地展示法律法規直接的關聯,以便於用戶查閱與檢索結果相關聯的信息。
[0058]圖5示出了本發明一個實施例中的關聯檢索服務的流程示意圖,參考圖5,關聯檢索服務包括下列步驟31至34。
[0059]步驟31:法律特徵提取。由於法律文本具有一定的規範化結構,特別是其命名,很大程度上表明了法律法規所關心的領域和主題。因此,可以通過對其標題進行分析,獲取法律主題,並將其用特徵向量子空間下的向量表示。其中,根據對法律法規標題的分析,其標題的語法結構相對簡單,標題中的主語、賓語(名詞部分)和謂語(動詞部分)基本涵蓋了法律法規主要表達的內容。通過分詞以及詞性分析,能夠容易的找到標題中的主、謂、賓語成分,並將其提取為代表標題的特徵。
[0060]下面結合具體三篇法律標題的具體例子進行說明。首先經過中文分詞,將法律的標題拆分成一個個詞項。其中,對於法律I的標題:中華人民共和國外商投資企業和外國企業所得稅法,其分詞結果為:
[0061]中華人民共和國外商投資企業和外國企業所得稅法
[0062]對於法律2的標題:關於外國投資者併購境內企業的規定,其分詞結果
[0063]為:
[0064]關於外國投資者併購境內企業的規定
[0065]對於法律3的標題:關於電子專利申請的規定,其分詞結果為:
[0066]關於電子專利申請的規定
[0067]這三篇法律標題組成的向量空間為所有詞項所構成的集合,具體如下:{併購,的,電子,法,關於,規定,和,境內,企業,申請,所得稅,投資,投資者,外國,外商,中華人民共和國,專利}。
[0068]將每篇法律標題均用屬於上述向量空間的向量表示,向量中每個元素代表一個詞項,該元素的值代表相應的詞頻。
[0069]具體地三篇法律標題的向量表示如下:
[0070]
【權利要求】
1.一種法律資料庫構建方法,包括下列步驟: 1)對於一個新的法律文本,按條目拆分所接收的法律文本,得到相應的法律條目文檔並創建相應的唯一標識; 2)對每個法律條目文檔進行分詞,對於分詞所得的每個詞項,在基於內容的倒排索引中建立或更新該詞項所對應的唯一一條記錄,所述基於內容的倒排索引的每條記錄均包括:內容中出現該條記錄所對應詞項的每個法律條目文檔及相應的索引信息; 3)回到步驟I)處理下一個法律文本直至所有法律文本均處理完畢。
2.根據權利要求1所述的法律資料庫構建方法,其特徵在於,所述步驟2)中,所述索引信息包括:所對應詞項的逆文檔頻率,以及所對應詞項出現在每個法律條目文檔的詞頻;其中,所述逆文檔頻率是基於法律資料庫中的法律條目文檔的逆文檔頻率。
3.根據權利要求2所述的法律資料庫構建方法,其特徵在於,所述步驟2)包括下列子步驟: 21)遍歷拆分得到的每個法律條目文檔,對於當前法律條目文檔,對其進行分詞; 22)遍歷分詞得到的所有詞項,對每一個詞項,計算當前詞項出現在所述當前法律條目文檔中的詞頻,在基於內容的倒排索引中查找對應於所述當前詞項的記錄,如果查找到已存的所述當前詞項的記錄, 在記錄中增加所述當前法律條目文檔的標識,以及所述當前詞項在所述當前法律條目文檔中出現的詞頻,並更新所述當前詞項的逆文檔頻率;如果未查找到已存的所述當前詞項的記錄,則在所述基於內容的倒排索引的詞典中增加所述當前詞項,同時增加一條新的記錄,所述新的記錄包括所述當前詞項的逆文檔頻率,所述當前法律條目文檔的標識,以及所述當前詞項在所述當前法律條目文檔中出現的詞頻。
4.一種基於權利要求1所述法律資料庫構建方法的法律檢索服務方法,包括下列步驟: 4)獲取作用於內容域的檢索向量; 5)對於檢索向量中的每個關鍵詞,根據基於內容的倒排索引,找到內容中出現該關鍵詞的每個法律條目文檔及相應的索引信息; 6)根據相應的索引信息對命中的法律條目文檔進行排序。
5.根據權利要求4所述的法律檢索服務方法,其特徵在於,所述步驟5)中,所述索引信息包括:所對應詞項的逆文檔頻率,以及所對應詞項出現在每個法律條目文檔的詞頻;其中,所述逆文檔頻率是基於法律資料庫中的法律條目文檔的逆文檔頻率。
6.根據權利要求5所述的法律檢索服務方法,其特徵在於,所述步驟6)包括下列子步驟: 61)對於步驟5)中命中的每個法律條目文檔,得到維度與所述檢索向量一致的法律條目文檔向量,所述法律條目文檔向量的每個元素對應於一個關鍵詞,每個元素的值根據步驟5)所找到的該關鍵詞的逆文檔頻率,以及該法律條目文檔的內容中出現該關鍵詞的詞頻得出; 62)將法律條目文檔向量和檢索向量的相似度作為相應法律條目文檔在內容域的檢索相似度,根據所述檢索相似度對各個命中的法律條目文檔進行排序。
7.根據權利要求6所述的法律檢索服務方法,其特徵在於,所述步驟62)中,所述的法律條目文檔向量和檢索向量的相似度為法律條目文檔向量和檢索向量的餘弦相似度。
8.根據權利要求7所述的法律檢索服務方法,其特徵在於,所述步驟6)中,所述法律條目文檔向量中,每個元素的值為步驟5)所找到的該元素所對應的關鍵詞的逆文檔頻率,和該法律條目文檔的內容中出現該元素所對應的關鍵詞的詞頻的乘積。
9.根據權利要求6所述的法律檢索服務方法,其特徵在於,所述法律條目文檔包括元信息和內容,所述元信息包括法律條目所屬法律文本的標題,以及法律條目在所屬法律文本中的所屬章節和編號。
10.根據權利要求9所述的法律檢索服務方法,其特徵在於,所述步驟6)還包括:將命中的法律條目文檔的所屬法律作為命中法律,根據各個命中的法律條目文檔的所述檢索相似度,得出每個命中法律的檢索相似度對各個命中法律進行排序,然後依排序顯示每個命中法律中的命中的各個法律條目文檔的內容和元信息。
11.根據權利要求10所述的法律檢索服務方法,其特徵在於,所述法律檢索服務方法還包括步驟: 7)對於每個命中法律,根據該命中法律與所述法律資料庫中其它法律的相似度,查找並顯示該命中法律的相關法律; 所述相關法律根據法律之間的相似度確定,其中,兩個法律之間的相似度按下述方法得出:對所有法律標題進行分詞獲得一系列詞項,並根據詞性提取出標題中的屬於主語結構、謂語結構和賓語結構的詞項,用所提取出的詞項構成特徵子空間,將所有法律標題都轉換為所述特徵子空間上的詞項向量的表述形式,將兩個法律標題所對應的兩個詞項向量的在所述特徵子空間的相似度作為所述兩個法律之間的相似度。
12.根據權利要求11 所述的法律檢索服務方法,其特徵在於,所述步驟7)中,對於每個命中法律,顯示該命中法律與其相關法律的關聯關係圖,所述關聯關係圖包括:一系列點和連接各點的邊,每個點代表所述命中法律或者一個該命中法律的一個相關法律,每條邊上顯示其兩個端點所對應的兩個法律之間的相似度。
【文檔編號】G06F17/30GK104008171SQ201410242810
【公開日】2014年8月27日 申請日期:2014年6月3日 優先權日:2014年6月3日
【發明者】劉婕, 張程, 趙曉芳 申請人:中國科學院計算技術研究所

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀