新四季網

文檔檢索方法和裝置的製作方法

2023-05-27 03:15:16

專利名稱:文檔檢索方法和裝置的製作方法
技術領域:
本發明涉及計算機信息處理領域,尤其涉及ー種文檔檢索方法和裝置。
背景技術:
全文檢索是指全文檢索系統通過掃描文檔中的每ー個詞,對每ー個詞建立ー個索引項,指明該詞在文檔中出現的次數和位置,當用戶提交檢索請求吋,全文檢索系統就根據事先建立的索引文件進行查找,將查找的結果按照某種排序方式返回給用戶的檢索方式。 實際應用中,全文檢索系統處理的一個文檔可能包含多個欄位,如標題、作者、正文等。具體的,在用戶提交檢索請求後,全文檢索系統分析確定檢索請求中的檢索關鍵詞包含的檢索分詞,檢索分詞是指對檢索關鍵詞進行字符劃分後形成的分詞,具體如何將檢索關鍵詞進行字符劃分,根據不同的算法具有不同的劃分方式,例如,可以將檢索關鍵詞中的每個字符劃分為ー個檢索分詞,也可以將檢索關鍵詞中的每兩個字符劃分為ー個檢索分詞,等等;然後,在索引文件中查找包含所有檢索分詞的文檔,並將該文檔的信息作為檢索結果提供給用戶。在短語檢索即檢索關鍵詞中包含多個檢索分詞的情況下,在查找包含所有檢索分詞的文檔後,還需要進ー步對該文檔中的多個檢索分詞的位置關係進行匹配, 以確定該多個檢索分詞的位置關係是否與檢索請求中包含的多個檢索分詞的位置關係ー 致,若匹配一致,則將該文檔的信息作為檢索結果提供給用戶,否則,不將該文檔作為檢索結果。例如,檢索關鍵詞中包含的檢索分詞包括「分詞」和「規則」,並且這兩個檢索分詞的位置關係為相鄰,即這兩個檢索分詞之間不包含其它字符,在查找到包含「分詞」和「規則」 的文檔後,對該文檔中「分詞」和「規則」的位置關係進行匹配,若該文檔中「分詞」和「規則」 相鄰,即該文檔中包含「分詞規則」,則將該文檔的信息作為檢索結果提供給用戶,否則,不將該文檔作為檢索結果。在查找得到多個檢索結果後,需要將多個檢索結果按照一定規則進行排序,最後按照排序順序將多個檢索結果提供給用戶。對於各種全文檢索系統,檢索結果的排序是否符合用戶的需求是評價其優劣的關鍵因素。目前,全文檢索系統普遍使用向量空間模型對檢索結果進行排序,具體的,該模型根據詞頻(Team Frequency,TF) /倒排文檔頻率Qnvert Document Frequency, IDF),計算檢索分詞在文檔中的量化權重值,根據計算得到的每個文檔的量化權重值對各文檔進行排序。TF是指ー個檢索分詞在文檔中出現的頻率,它描述該檢索分詞在ー篇特定文檔中的重要性;IDF是倒排文檔頻率,它描述的是檢索分詞在所有文檔中出現的頻率,即該檢索分詞的普遍重要性,如「我」,「什麼」這些詞幾乎在所有的文檔中都會出現,所以這些詞即使在ー篇特定的文檔中出現的頻率很高,也不是很重要。總的來說就是,ー篇特定文檔的優先級,與檢索分詞的TF成正比,與IDF成反比。在實現本發明的過程中,發明人發現現有技術中存在以下技術問題現有的檢索方式中,只能檢索到包含所有檢索分詞並且檢索分詞的位置關係與檢索關鍵詞中包含的檢索分詞的位置關係一致的文檔,如何檢索到檢索分詞在設定位置出現的文檔,目前還沒有具體的實現方案。

發明內容
本發明實施例提供ー種文檔檢索方法和裝置,用於解決無法檢索到檢索分詞在設定位置出現的文檔的問題。ー種文檔檢索方法,該方法包括接收包含檢索關鍵詞的檢索請求;確定所述檢索關鍵詞所包含的檢索分詞以及該檢索分詞中的特定檢索分詞在目標文檔中所處的位置需要滿足的條件;查找包含確定的全部檢索分詞並且特定檢索分詞所在的位置滿足所述條件的文檔;將查找到的文檔的信息作為檢索結果返回。ー種文檔檢索裝置,該裝置包括請求接收單元,用於接收包含檢索關鍵詞的檢索請求;條件分析単元,用於確定所述檢索關鍵詞所包含的檢索分詞以及該檢索分詞中的特定檢索分詞在目標文檔中所處的位置需要滿足的條件;文檔查找単元,用於查找包含確定的全部檢索分詞並且特定檢索分詞所在的位置滿足所述條件的文檔;結果返回単元,用於將查找到的文檔的信息作為檢索結果返回。本方案中,接收到包含檢索關鍵詞的檢索請求後,確定所述檢索關鍵詞所包含的檢索分詞以及該檢索分詞中的特定檢索分詞在目標文檔中所處的位置需要滿足的條件,查找包含確定的全部檢索分詞並且特定檢索分詞所在的位置滿足所述條件的文檔,並將查找到的文檔的信息作為檢索結果返回。可見,採用本發明能夠檢索到檢索分詞的位置滿足ー 定條件的文檔,也即能夠檢索到檢索分詞在一定位置出現的文檔,進而使得檢索結果更加精確,更好的滿足用戶需求。


圖1為本發明實施例提供的方法流程示意圖;圖2為本發明實施例提供的另一方法流程示意圖;圖3為本發明實施例提供的文檔檢索裝置結構示意圖;圖4為本發明實施例提供的另一文檔檢索裝置結構示意圖。
具體實施例方式為了能夠檢索到檢索分詞在設定位置出現的文檔,本發明實施例提供ー種文檔檢索方法,本方法中,在接收到檢索請求後,需要確定檢索請求中的檢索關鍵詞所包含的ー個或多個檢索分詞(即特定檢索分詞)在目標文檔中所處的位置需要滿足的條件,然後查找包含確定的全部檢索分詞並且特定檢索分詞所在的位置滿足該條件的文檔,最後將查找到的文檔的信息作為檢索結果返回。參見圖1,本發明實施例提供的文檔檢索方法,具體包括以下步驟步驟10 接收包含檢索關鍵詞的檢索請求;
這裡,檢索關鍵詞是指外界(例如用戶)輸入的用於檢索的關鍵詞;步驟11 確定所述檢索關鍵詞所包含的檢索分詞以及該檢索分詞中的特定檢索分詞在目標文檔中所處的位置需要滿足的條件;步驟12 查找包含確定的全部檢索分詞並且特定檢索分詞所在的位置滿足所述條件的文檔;步驟13 將查找到的文檔的信息作為檢索結果返回。步驟11中,在所述特定檢索分詞包括檢索關鍵詞所包含的第一個檢索分詞時,確定該第一個檢索分詞在目標文檔中所處的位置需要滿足的條件,其具體實現可以如下根據檢索關鍵詞的格式,確定檢索關鍵詞所包含的第一個檢索分詞在目標文檔中的位置與目標文檔的起始位置所需要滿足的第一位置關係,將該第一位置關係作為檢索關鍵詞所包含的第一個檢索分詞在目標文檔中所處的位置需要滿足的條件。具體的,上述確定第一位置關係的具體實現可以如下首先,確定在檢索關鍵詞中第一個檢索分詞之前是否具有通配符;在確定為是吋, 根據預先設定的通配符類型與距離值範圍的對應關係,確定第一個檢索分詞之前的通配符對應的位置距離值,並確定所述第一位置關係為在目標文檔中所述第一個檢索分詞與目標文檔的起始字符之間的距離值在所述距離值範圍內;在確定為否時,確定所述第一位置關係為第一個檢索分詞位於目標文檔的起始位置。當然,上述根據檢索關鍵詞的格式確定第一位置關係的實現並不局限於上述通配符的方式,任何其他根據檢索關鍵詞的格式確定第一位置關係的方式均在本發明的保護範圍內。步驟11中,在所述特定檢索分詞包括檢索關鍵詞所包含的最後ー個檢索分詞時, 確定該最後ー個檢索分詞在目標文檔中所處的位置需要滿足的條件,其具體實現可以如下根據檢索關鍵詞的格式,確定檢索關鍵詞所包含的最後ー個檢索分詞在目標文檔中的位置與目標文檔的結束位置所需要滿足的第二位置關係,將該第二位置關係作為檢索關鍵詞所包含的最後ー個檢索分詞在目標文檔中所處的位置需要滿足的條件。具體的,上述確定第二位置關係的具體實現可以如下確定在檢索關鍵詞中最後ー個檢索分詞之後是否具有通配符;在確定為是吋,根據預先設定的通配符類型與位置距離值的對應關係,確定最後一個檢索分詞之後的通配符對應的距離值範圍,並確定所述第二位置關係為在目標文檔中所述最後一個檢索分詞與目標文檔的結尾字符之間的距離值在所述距離值範圍內;在確定為否時,確定所述第二位置關係為最後ー個檢索分詞位於目標文檔的結束位置。當然,上述根據檢索關鍵詞的格式確定第二位置關係的實現並不局限於上述通配符的方式,任何其他根據檢索關鍵詞的格式確定第二位置關係的方式均在本發明的保護範圍內。舉例說明,在所述通配符為星號吋,所述距離值範圍為不小於0的整數;在所述通配符為問號吋,所述問號對應的距離值範圍為0或1。在步驟10中接收包含檢索關鍵詞的檢索請求之前,可以針對一個或多個文檔建立索引文件,該索引文件中包含各文檔所包含的檢索分詞以及該檢索分詞在對應文檔中的位置信息;相應的,步驟12的具體實現可以分為如下三種情況第一種,對應於特定檢索分詞包括檢索關鍵詞中的第一個檢索分詞的情況,具體如下首先,根據所述索引文件確定包含檢索關鍵詞中的全部檢索分詞的文檔;然後,從所述索引文件中讀取檢索關鍵詞中的第一個檢索分詞在該文檔中的位置信息,根據該位置信息確定該第一個檢索分詞在該文檔中的位置與該文檔的起始位置是否滿足所述第一位置關係;若是,則將該文檔確定為查找到的包含確定的全部檢索分詞並且特定檢索分詞所在的位置滿足所述條件的文檔,否則,不將該文檔確定為查找到的包含確定的全部檢索分詞並且特定檢索分詞所在的位置滿足所述條件的文檔。第二種,對應於特定檢索分詞包括檢索關鍵詞中的最後ー個檢索分詞的情況,具體如下首先,根據所述索引文件確定包含檢索關鍵詞中的全部檢索分詞的文檔;然後,從所述索引文件中讀取所述檢索關鍵詞中的最後ー個檢索分詞在該文檔中的位置信息,根據該位置信息確定該最後ー個檢索分詞在該文檔中的位置與該文檔的起始位置是否滿足所述第二位置關係;若是,則將該文檔確定為查找到的包含確定的全部檢索分詞並且特定檢索分詞所在的位置滿足所述條件的文檔,否則,不將該文檔確定為查找到的包含確定的全部檢索分詞並且特定檢索分詞所在的位置滿足所述條件的文檔。第三種,對應於特定檢索分詞包括檢索關鍵詞中的第一個和最後一個檢索分詞的情況,具體如下首先,根據所述索引文件確定包含檢索關鍵詞中的全部檢索分詞的文檔;然後,從所述索引文件中讀取檢索關鍵詞中的第一個檢索分詞和最後一個檢索分詞在該文檔中的位置信息,根據讀取到的位置信息確定該第一個檢索分詞在該文檔中的位置與該文檔的起始位置是否滿足所述第一位置關係,以及該最後ー個檢索分詞在該文檔中的位置與該文檔的結束位置是否滿足所述第二位置關係;若是,則將該文檔確定為查找到的包含確定的全部檢索分詞並且特定檢索分詞所在的位置滿足所述條件的文檔,否則,不將該文檔確定為查找到的包含確定的全部檢索分詞並且特定檢索分詞所在的位置滿足所述條件的文檔。當然,特定檢索分詞除了可以包括檢索關鍵詞中的第一個和最後ー個檢索分詞外,也可以包括檢索關鍵詞中的任何其他檢索分詞,在這種情況下,步驟11中確定該特定檢索分詞在目標文檔中所處的位置需要滿足的條件的具體實現可以如下根據檢索關鍵詞的格式,確定該特定檢索分詞在目標文檔中的位置與目標文檔的起始位置和/或結束位置所需要滿足的位置關係,將該位置關係作為該特定檢索分詞在目標文檔中所處的位置需要滿足的條件。相應的,步驟12的具體實現可以如下首先,根據索引文件確定包含檢索關鍵詞中的全部檢索分詞的文檔;然後,從索引文件中讀取該特定檢索分詞在該文檔中的位置信息,根據該位置信息確定該特定檢索分詞在該文檔中的位置與該文檔的起始位置和/或結束位置是否滿足相應的位置關係;若是,則將該文檔確定為查找到的包含確定的全部檢索分詞並且特定檢索分詞所在的位置滿足所述條件的文檔,否則,不將該文檔確定為查找到的包含確定的全部檢索分詞並且特定檢索分詞所在的位置滿足所述條件的文檔。較佳的,在步驟12與步驟13之間,該方法進ー步包括
確定所述檢索關鍵詞所包含的各檢索分詞在查找到的文檔中的位置關係與在所述檢索關鍵詞中的位置關係是否一致;相應的,步驟13中,在確定所述檢索關鍵詞所包含的各檢索分詞在查找到的文檔中的位置關係與在所述檢索關鍵詞中的位置關係一致吋,將查找到的文檔的信息作為檢索結果返回。較佳的,在步驟12與步驟13之間,可以根據檢索關鍵詞所包含的檢索分詞在查找到的各文檔中的位置和查找到的各文檔的數據長度,對查找到的各文檔進行排序;相應的, 步驟13中,按照對查找到的各文檔進行排序的排序結果,將查找到的各文檔作為檢索結果返回。上述根據所述檢索關鍵詞所包含的檢索分詞在查找到的各文檔中的位置和查找到的各文檔的數據長度,對查找到的各文檔進行排序,其具體實現可以如下首先,根據預先設定的文檔相關度值計算公式,分別計算查找到的各文檔的相關度值;所述文檔相關度值計算公式滿足以下條件所述檢索關鍵詞所包含的檢索分詞在文檔中的位置越靠前,根據該文檔相關度值計算公式計算得到的相關度值越大,文檔的數據長度越小,根據該文檔相關度值計算公式計算得到的相關度值越大;然後,按照計算得到的各文檔的相關度值的大小順序,將各文檔進行排序。所述文檔相關度值計算公式可以包括
權利要求
1.ー種文檔檢索方法,其特徵在於,該方法包括 接收包含檢索關鍵詞的檢索請求;確定所述檢索關鍵詞所包含的檢索分詞,並確定該檢索分詞中的特定檢索分詞在目標文檔中所處的位置需要滿足的條件;查找包含確定的檢索分詞並且特定檢索分詞所在的位置滿足所述條件的文檔; 將查找到的文檔的信息作為檢索結果返回。
2.如權利要求1所述的方法,其特徵在幹,在所述特定檢索分詞包括所述檢索關鍵詞所包含的第一個檢索分詞時,所述確定該檢索分詞中的特定檢索分詞在目標文檔中所處的位置需要滿足的條件包括根據所述檢索關鍵詞的格式,確定所述檢索關鍵詞所包含的第一個檢索分詞在目標文檔中的位置與目標文檔的起始位置所需要滿足的第一位置關係;所述查找包含確定的檢索分詞並且特定檢索分詞所在的位置滿足所述條件的文檔包括查找包含確定的檢索分詞並且所述第一個檢索分詞滿足所述第一位置關係的文檔。
3.如權利要求1所述的方法,其特徵在幹,在所述特定檢索分詞包括所述檢索關鍵詞所包含的最後ー個檢索分詞時,所述確定該檢索分詞中的特定檢索分詞在目標文檔中所處的位置需要滿足的條件包括根據所述檢索關鍵詞的格式,確定所述檢索關鍵詞所包含的最後ー個檢索分詞在目標文檔中的位置與目標文檔的結束位置所需要滿足的第二位置關係;所述查找包含確定的檢索分詞並且特定檢索分詞所在的位置滿足所述條件的文檔包括查找包含確定的檢索分詞並且所述最後一個檢索分詞滿足所述第二位置關係的文檔。
4.如權利要求1所述的方法,其特徵在幹,在所述特定檢索分詞包括所述檢索關鍵詞所包含的第一個檢索分詞和最後一個檢索分詞時,所述確定該檢索分詞中的特定檢索分詞在目標文檔中所處的位置需要滿足的條件包括根據所述檢索關鍵詞的格式,確定所述檢索關鍵詞所包含的第一個檢索分詞在目標文檔中的位置與目標文檔的起始位置所需要滿足的第一位置關係,以及所述檢索關鍵詞所包含的最後ー個檢索分詞在目標文檔中的位置與目標文檔的結束位置所需要滿足的第二位J大爾;所述查找包含確定的檢索分詞並且特定檢索分詞所在的位置滿足所述條件的文檔包括查找包含確定的檢索分詞並且所述第一個檢索分詞滿足所述第一位置關係、以及所述最後ー個檢索分詞滿足所述第二位置關係的文檔。
5.如權利要求2或4所述的方法,其特徵在幹,所述根據所述檢索關鍵詞的格式,確定所述檢索關鍵詞所包含的第一個檢索分詞在目標文檔中的位置與目標文檔的起始位置所需要滿足的第一位置關係包括確定在所述檢索關鍵詞中第一個檢索分詞之前是否具有通配符; 在確定為是時,根據預先設定的通配符類型與距離值範圍的對應關係,確定所述通配符對應的位置距離值,並確定所述第一位置關係為在目標文檔中所述第一個檢索分詞與目標文檔的起始字符之間的距離值在所述距離值範圍內;在確定為否時,確定所述第一位置關係為第一個檢索分詞位於目標文檔的起始位置。
6.如權利要求3或4所述的方法,其特徵在幹,所述根據所述檢索關鍵詞的格式,確定所述檢索關鍵詞所包含的最後ー個檢索分詞在目標文檔中的位置與目標文檔的結束位置所需要滿足的第二位置關係包括確定在所述檢索關鍵詞中最後ー個檢索分詞之後是否具有通配符;在確定為是時,根據預先設定的通配符類型與位置距離值的對應關係,確定所述通配符對應的距離值範圍,並確定所述第二位置關係為在目標文檔中所述最後ー個檢索分詞與目標文檔的結尾字符之間的距離值在所述距離值範圍內;在確定為否時,確定所述第二位置關係為最後ー個檢索分詞位於目標文檔的結束位置。
7.如權利要求1所述的方法,其特徵在幹,在查找包含確定的檢索分詞並且特定檢索分詞所在的位置滿足所述條件的文檔之後、並且將查找到的文檔的信息作為檢索結果返回之前,該方法進ー步包括確定所述檢索關鍵詞所包含的各檢索分詞在查找到的文檔中的位置關係與在所述檢索關鍵詞中的位置關係是否一致;所述將查找到的文檔的信息作為檢索結果返回包括在確定所述檢索關鍵詞所包含的各檢索分詞在查找到的文檔中的位置關係與在所述檢索關鍵詞中的位置關係一致吋,將查找到的文檔的信息作為檢索結果返回。
8.如權利要求1所述的方法,其特徵在幹,在查找到包含確定的檢索分詞並且檢索分詞所在的位置滿足所述條件的文檔之後,並且將查找到的文檔的信息作為檢索結果返回之前,該方法進ー步包括根據所述檢索關鍵詞所包含的檢索分詞在查找到的各文檔中的位置和查找到的各文檔的數據長度,對查找到的各文檔進行排序;所述將查找到的文檔的信息作為檢索結果返回包括按照對查找到的各文檔進行排序的排序結果,將查找到的各文檔作為檢索結果返回。
9.如權利要求8所述的方法,其特徵在幹,所述根據所述檢索關鍵詞所包含的檢索分詞在查找到的各文檔中的位置和查找到的各文檔的數據長度,對查找到的各文檔進行排序包括根據預先設定的文檔相關度值計算公式,分別計算查找到的各文檔的相關度值;所述文檔相關度值計算公式滿足以下條件所述檢索關鍵詞所包含的檢索分詞在文檔中的位置越靠前,根據該文檔相關度值計算公式計算得到的相關度值越大,文檔的數據長度越小,根據該文檔相關度值計算公式計算得到的相關度值越大;按照計算得到的各文檔的相關度值的大小順序,將各文檔進行排序。
10.如權利要求9所述的方法,其特徵在幹,所述文檔相關度值計算公式為
11.ー種文檔檢索裝置,其特徵在於,該裝置包括 請求接收單元,用於接收包含檢索關鍵詞的檢索請求;條件分析単元,用於確定所述檢索關鍵詞所包含的檢索分詞以及該檢索分詞中的特定檢索分詞在目標文檔中所處的位置需要滿足的條件;文檔查找単元,用於查找包含確定的全部檢索分詞並且特定檢索分詞所在的位置滿足所述條件的文檔;結果返回単元,用於將查找到的文檔的信息作為檢索結果返回。
12.如權利要求11所述的裝置,其特徵在幹,所述條件分析単元用於在所述特定檢索分詞包括所述檢索關鍵詞所包含的第一個檢索分詞時,根據所述檢索關鍵詞的格式,確定所述檢索關鍵詞所包含的第一個檢索分詞在目標文檔中的位置與目標文檔的起始位置所需要滿足的第一位置關係; 所述文檔查找單元用於查找包含確定的檢索分詞並且所述第一個檢索分詞滿足所述第一位置關係的文檔。
13.如權利要求11所述的裝置,其特徵在幹,所述條件分析単元用於在所述特定檢索分詞包括所述檢索關鍵詞所包含的最後ー個檢索分詞時,根據所述檢索關鍵詞的格式,確定所述檢索關鍵詞所包含的最後ー個檢索分詞在目標文檔中的位置與目標文檔的結束位置所需要滿足的第二位置關係; 所述文檔查找單元用於查找包含確定的檢索分詞並且所述最後一個檢索分詞滿足所述第二位置關係的文檔。
14.如權利要求11所述的裝置,其特徵在幹,所述條件分析単元用於根據所述檢索關鍵詞的格式,確定所述檢索關鍵詞所包含的第一個檢索分詞在目標文檔中的位置與目標文檔的起始位置所需要滿足的第一位置關係,以及所述檢索關鍵詞所包含的最後ー個檢索分詞在目標文檔中的位置與目標文檔的結束位置所需要滿足的第二位 ゼ大糸;所述文檔查找單元用於查找包含確定的檢索分詞並且所述第一個檢索分詞滿足所述第一位置關係、以及所述最後ー個檢索分詞滿足所述第二位置關係的文檔。
15.如權利要求12或14所述的裝置,其特徵在幹,所述條件分析単元用於 確定在所述檢索關鍵詞中第一個檢索分詞之前是否具有通配符;在確定為是時,根據預先設定的通配符類型與距離值範圍的對應關係,確定所述通配符對應的位置距離值,並確定所述第一位置關係為在目標文檔中所述第一個檢索分詞與目標文檔的起始字符之間的距離值在所述距離值範圍內;在確定為否時,確定所述第一位置關係為第一個檢索分詞位於目標文檔的起始位置。
16.如權利要求13或14所述的裝置,其特徵在幹,所述條件分析単元用於 確定在所述檢索關鍵詞中最後ー個檢索分詞之後是否具有通配符;在確定為是時,根據預先設定的通配符類型與位置距離值的對應關係,確定所述通配符對應的距離值範圍,並確定所述第二位置關係為在目標文檔中所述最後ー個檢索分詞與目標文檔的結尾字符之間的距離值在所述距離值範圍內;在確定為否時,確定所述第二位置關係為最後ー個檢索分詞位於目標文檔的結束位置。
17.如權利要求11所述的裝置,其特徵在幹,所述文檔查找單元還用於確定所述檢索關鍵詞所包含的各檢索分詞在查找到的文檔中的位置關係與在所述檢索關鍵詞中的位置關係是否一致; 所述結果返回単元用於在確定所述檢索關鍵詞所包含的各檢索分詞在查找到的文檔中的位置關係與在所述檢索關鍵詞中的位置關係一致吋,將查找到的文檔的信息作為檢索結果返回。
18.如權利要求11所述的裝置,其特徵在於,該裝置還包括結果排序単元,用於根據所述檢索關鍵詞所包含的檢索分詞在查找到的各文檔中的位置和查找到的各文檔的數據長度,對查找到的各文檔進行排序; 所述結果返回単元用於按照對查找到的各文檔進行排序的排序結果,將查找到的各文檔作為檢索結果返回。
19.如權利要求18所述的裝置,其特徵在幹,所述結果排序單元用於根據預先設定的文檔相關度值計算公式,分別計算查找到的各文檔的相關度值;所述文檔相關度值計算公式滿足以下條件所述檢索關鍵詞所包含的檢索分詞在文檔中的位置越靠前,根據該文檔相關度值計算公式計算得到的相關度值越大,文檔的數據長度越小,根據該文檔相關度值計算公式計算得到的相關度值越大;按照計算得到的各文檔的相關度值的大小順序,將各文檔進行排序。
20.如權利要求19所述的裝置,其特徵在幹,所述文檔相關度值計算公式為
全文摘要
本發明實施例公開了一種文檔檢索方法和裝置,涉及計算機信息處理領域,用於解決無法檢索到檢索分詞在設定位置出現的文檔的問題。本發明中,接收到包含檢索關鍵詞的檢索請求後,確定所述檢索關鍵詞所包含的檢索分詞及檢索分詞中的特定檢索分詞在目標文檔中所處的位置需要滿足的條件,查找包含確定的檢索分詞並且特定檢索分詞所在的位置滿足所述條件的文檔,對查找到的文檔進行排序,並按照排序結果將查找到的文檔的信息作為檢索結果返回。可見,採用本發明,能夠檢索到檢索分詞在一定位置出現的文檔。
文檔編號G06F17/30GK102567421SQ201010621839
公開日2012年7月11日 申請日期2010年12月27日 優先權日2010年12月27日
發明者徐劍波, 童徵宇 申請人:北京方正阿帕比技術有限公司, 北大方正集團有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀