新四季網

一種保存網頁中多個連結對象的系統及方法

2023-05-03 19:36:11

專利名稱:一種保存網頁中多個連結對象的系統及方法
技術領域:
本發明涉及網頁下載技術領域,更具體地說,涉及一種保存網頁中多個連結對象的系統及方法。
背景技術:
目前用戶在瀏覽網頁時,主要通過網頁瀏覽器,例如美國微軟公司的網際網路瀏覽器(Internet Explorer)。在瀏覽網頁時,網頁瀏覽器與全球資訊網(WWW)伺服器的數據交互採用超文本傳輸協議(HTTP)。WWW伺服器向網絡終端發送的網頁數據包括超文本標記語言(HTML)等格式的文本文件以及相關媒體資源。終端網頁瀏覽器在獲取上述文件和資源後,進一步解析這些文件,並將其繪製到網頁瀏覽器的窗口中,以供友好交互。
在用戶瀏覽網頁時,往往需要將某些網頁中的連結對象保存到本地存儲設備,供以後瀏覽或使用。但現有的網頁瀏覽器每次只能保存一個連結對象,因此當用戶試圖保存頁面中的多個連結對象時,需要對每個連結逐一操作。
目前某些軟體,例如著名的離線瀏覽器(Offline Explorer),可以將網頁及其所包含的多層連結全部抓取下載。這類軟體在下載頁面的同時,對其HTML等網頁文件內容解析,從而獲得頁面連結的統一資源定位(URL)並下載。如果連結指向的又是HTML等格式的網頁,那麼軟體可以按照用戶要求的層數,繼續嵌套迭代解析、下載,直到達到用戶要求的層數深度。此類離線下載軟體主要目的是完成網站內容的完整抓取和複製,從而便於用戶在離線狀態下直接瀏覽。雖然它也可用作下載網頁上的批量連結,但是其只能下載全部連結,而不能針對性的下載需要的網頁內容,必然造成不必要的網絡帶寬消耗和硬碟存儲開銷。
此外,現有的某些下載類軟體,例如FlashGet、迅雷等,通過在網頁瀏覽器中使用彈出式菜單,提供「下載全部連結」的功能,從而列出當前網頁中包括的所有連結及其對應文本提示,用戶可選擇其中需要下載的連接,從而下載對應內容,實現批量下載。
上述下載軟體在一定程度上實現了用戶的批量定製下載,但這種方法存在局限性。將網頁包含的所有的連結展現在新開啟的對話框中,往往使用戶定製下載內容不夠直觀。尤其在以下兩種情況下,定製下載內容的操作比較繁瑣(1)當網頁中包含的連結數目很多時,彈出式對話框中顯示的條目繁多。用戶不僅需要遍歷搜索每個連結,而且逐個選擇連結時容易混淆、遺漏或者多選。
(2)當存在相同的文本而其代表的連結對象不同時(例如網頁中包括多處「點擊此處下載」字樣,但對應的實際連結對象不同),用戶將受到幹擾,難以定製下載條目。

發明內容
本發明要解決的技術問題在於,針對上述的瀏覽網頁時網頁內容存儲操作繁瑣的問題,提供一種保存網頁中多個連結對象的系統及方法。
本發明解決上述技術問題的技術方案是,提供一種保存網頁中多個連結對象的系統,包括選取單元,用於在網頁中選取待保存的多個連結;解析單元,用於解析所述網頁的腳本,並獲取所述選取的連結對應的統一資源定位;下載引擎,用於根據選定的統一資源定位下載連結對象。
在本發明所述的一種保存網頁中多個連結對象的系統中,所述解析單元進一步包括定位子單元,所述選取單元進一步包括初選子單元、預覽子單元和調整子單元,其中所述初選子單元,用於從瀏覽器顯示的網頁中通過滑鼠拖動方式選取一個或多個連結;所述定位子單元,用於解析所述網頁的腳本,並獲取所述初選子單元選取的連結對象對應的統一資源定位;所述預覽子單元,用於顯示所述定位子單元獲得的統一資源定位;所述調整子單元,用於調整並確認預覽子單元中顯示的統一資源定位,並將確認後的統一資源定位傳送到下載引擎下載連結對象。
在本發明所述的一種保存網頁中多個連結對象的系統中,所述解析單元進一步包括校驗子單元,用於刪除解析單元獲取的統一資源定位中的重複項。
在本發明所述的一種保存網頁中多個連結對象的系統中,還包括保存單元,用於將下載引擎下載的連結對象保存到指定位置。
在本發明所述的一種保存網頁中多個連結對象的系統中,所述解析單元獲取的統一資源定位是腳本片段中每一a標籤中href屬性內容。
本發明還提供一種保存網頁中多個連結對象的方法,包括以下步驟(a)在網頁中選取待保存的多個連結,並解析所述網頁的腳本,獲取所述選定的連結對應的統一資源定位;(b)根據所述選定的統一資源定位下載連結對象。
在本發明所述的一種保存網頁中多個連結對象的方法中,所述步驟(a)進一步包括(a1)從瀏覽器顯示的網頁中以滑鼠拖動方式選取一個或多個連結;(a2)解析所述網頁獲得選取連結對應的腳本片段,並從所述腳本片段中獲取統一資源定位。
在本發明所述的一種保存網頁中多個連結對象的方法中,所述步驟(a)進一步包括(a3)顯示步驟(a2)獲得的統一資源定位;(a4)調整並確認步驟(a3)顯示的統一資源定位;(a5)將步驟(a4)中確認的統一資源定位傳送到下載引擎。
在本發明所述的一種保存網頁中多個連結對象的方法中,所述步驟(a2)中所述獲取的統一資源定位是腳本片段中每一a標籤中href屬性內容。
在本發明所述的一種保存網頁中多個連結對象的方法中,所述步驟(a)中進一步包括刪除重複的統一資源定位。
本發明一種保存網頁中多個連結對象的系統及方法,通過解析網頁腳本獲取在網頁中選取的多個連結對象的對應的統一資源定位,並根據統一資源定位下載相關內容,實現了直觀的多個連結對象下載,簡化了多連結對象的下載操作。


下面將結合附圖及實施例對本發明作進一步說明,附圖中圖1是本發明一種保存網頁中多個連結對象的系統實施例的結構示意圖;圖2是圖1中選取單元和解析單元的一個實施例的結構示意圖;圖3是本發明一種保存網頁中多個連結對象的方法實施例的流程圖;圖4是圖3中選取連結對象並獲取統一資源定位步驟一個實施例的詳細流程圖。
具體實施例方式
本實施例中的連結是指網頁中指向特定文件的文字或圖片等;而連結對象則是指上述連結所指向的文件,例如網頁、圖片或多媒體文件等。在連結被點擊時,網頁瀏覽器下載連結所指向的連結對象,並播放或顯示連結對象。
如圖1所示,是本發明一種保存網頁中多個連結對象的系統實施例的結構示意圖。該系統包括選取單元11、解析單元12以及下載引擎13。該系統可以捆綁到網頁瀏覽器並使用網頁瀏覽器提供的部分功能,例如下載引擎;該系統也可以是獨立的工具。
選取單元11用於在網頁中選取待保存的多個連結。該選取單元11可使用現有網頁瀏覽器中的方式實現選取多個連結的操作。例如通過滑鼠在網頁瀏覽器中顯示的網頁上左鍵點擊拖動,選中目標連結所對應的文本、圖像等區域。此外,還可通過相關快捷鍵,例如Alt鍵等,配合滑鼠選取,從而實現選取區域的累加或者去除,定製下載對象。
解析單元12用於解析所述網頁的腳本,並獲取所述選取的連結對應的統一資源定位(URL)。
目前大多數的網頁文件採取HTML編碼格式,它使用戶可以通過統一的入口(網頁瀏覽器)訪問各種不同格式的計算機文檔,消除了不同計算機系統之間的信息交流問題。HTML通過在文本文件中加入一系列的標籤(tag)實現瀏覽器的網頁顯示。標籤是HTML語法的基本元素,由「」和「」成對組成,兩者之間是標籤的內容。例如a href=」http://www.sina.com.cn」新浪網/a,表示在網頁上用滑鼠左鍵點擊「新浪網」時,網頁瀏覽器會自動打開http://www.sina.com.cn/指向的網頁。此外,可擴展超文本標記語言(XHTML)也被用於進行網頁編碼,其格式與HTML編碼格式類似。
在本實施例中,解析單元12在獲取選取的連結對應的腳本片段後,將腳本片段中每一a標籤中href屬性內容作為統一資源定位。
下載引擎13用於根據解析單元12獲取的統一資源定位下載連結對象。該下載引擎的實現類似現有網頁瀏覽器或其它網頁下載軟體。
如圖2所示,為圖1中選取單元11和解析單元12的一個實施例的結構示意圖。在本實施例中,解析單元12進一步包括定位子單元121,選取單元11進一步包括初選子單元111、預覽子單元112和調整子單元113,其中初選子單元111用於從瀏覽器顯示的網頁中選取一個或多個連結。初選子單元111可使用現有網頁瀏覽器中的方式實現選取多個連結的操作。例如通過滑鼠在網頁瀏覽器中顯示的網頁上左鍵點擊拖動,選中目標連結所對應的文本、圖像等區域。此外,還可通過相關快捷鍵,例如Alt鍵等,配合滑鼠選取,從而實現選取區域的累加或者去除,定製下載對象。
定位子單元121用於解析選取的連結所在網頁的腳本,並獲取初選子單元111選取的連結對象對應的統一資源定位。定位子單元121將腳本中每一a標籤中href屬性內容作為統一資源定位。
預覽子單元112用於顯示定位子單元111獲得的統一資源定位。
調整子單元113用於調整並確認預覽子單元中顯示的統一資源定位,並將確認後的統一資源定位傳送到下載引擎13下載連結對象。
此外,解析單元12還可包括一個校驗子單元122,用於刪除定位子單元121解析獲得的統一資源定位中的重複項。
在上述系統中,還可包括保存單元,用於設置連結對象的保存位置,並將下載引擎下載的連結對象保存到上述指定位置。
如圖3所示,是本發明一種保存網頁中多個連結對象的方法實施例的流程圖。該方法包括以下步驟步驟S31在網頁中選取待保存的多個連結對象,並解析所述網頁的腳本,獲取所述選取的連結對象對應的統一資源定位。
在選取連結對象時,可使用現有網頁瀏覽器中的選取方式。例如通過滑鼠在網頁瀏覽器中顯示的網頁上左鍵點擊拖動,選中目標連結所對應的文本、圖像等區域。
在解析網頁腳本時,首先獲取選取的連結對應的腳本片段,然後將腳本片段中每一a標籤中href屬性內容作為統一資源定位。
步驟S32根據上述獲取的統一資源定位下載連結對象。該下載步驟採用現有網頁瀏覽器或其它網頁下載軟體類似的方式下載。
如圖4所示,是圖3中選取連結對象並獲取統一資源定位步驟的其中一種實施例的詳細流程圖。該步驟具體包括步驟S41從瀏覽器顯示的網頁中選取一個或多個連結。在選取連結對象時,可使用現有網頁瀏覽器中的選取方式。
步驟S42解析所述網頁的腳本,並獲取步驟S41中選取的連結對象對應的統一資源定位。在本實施例中,首先獲取選取的連結對應的腳本片段,然後將腳本片段中每一a標籤中href屬性內容作為需選定的統一資源定位。
步驟S43顯示獲得的統一資源定位。上述統一資源定位可通過彈出式窗口進行顯示。
步驟S44調整並確認步驟S43中顯示的統一資源定位。該調整可通過在彈出式窗口中的複選框實現,即每一統一資源定位對應一個複選框,被選中的複選框對應的統一資源定位即為被確認的統一資源定位。
步驟S45將確認後的統一資源定位傳送到下載引擎下載連結對象。
在上述方法中,還可包括刪除重複的統一資源定位的步驟,從而保證每一統一資源定位僅下載一次,避免重複下載。
此外,還可包括一個保存下載的連結對象的步驟。在具體實現時,可將所有下載的連結對象存放於指定的文件夾中,並在出現文件同名時按次序為同名文件自動命名;也可按照統一資源定位自動生成子目錄,並按子目錄保存文件。
以上所述,僅為本發明較佳的具體實施方式
,但本發明的保護範圍並不局限於此,任何熟悉本技術領域的技術人員在本發明揭露的技術範圍內,可輕易想到的變化或替換,都應涵蓋在本發明的保護範圍之內。因此,本發明的保護範圍應該以權利要求的保護範圍為準。
權利要求
1.一種保存網頁中多個連結對象的系統,其特徵在於,包括選取單元,用於在網頁中選取待保存的多個連結;解析單元,用於解析所述網頁的腳本,並獲取所述選取的連結對應的統一資源定位;下載引擎,用於根據選定的統一資源定位下載連結對象。
2.根據權利要求1所述的一種保存網頁中多個連結對象的系統,其特徵在於,所述解析單元進一步包括定位子單元,所述選取單元進一步包括初選子單元、預覽子單元和調整子單元,其中所述初選子單元,用於從瀏覽器顯示的網頁中通過滑鼠拖動方式選取一個或多個連結;所述定位子單元,用於解析所述網頁的腳本,並獲取所述初選子單元選取的連結對象對應的統一資源定位;所述預覽子單元,用於顯示所述定位子單元獲得的統一資源定位;所述調整子單元,用於調整並確認預覽子單元中顯示的統一資源定位,並將確認後的統一資源定位傳送到下載引擎下載連結對象。
3.根據權利要求1或2所述的一種保存網頁中多個連結對象的系統,其特徵在於,所述解析單元進一步包括校驗子單元,用於刪除解析單元獲取的統一資源定位中的重複項。
4.根據權利要求1或2所述的一種保存網頁中多個連結對象的系統,其特徵在於,還包括保存單元,用於將下載引擎下載的連結對象保存到指定位置。
5.根據權利要求1所述的一種保存網頁中多個連結對象的系統,其特徵在於,所述解析單元獲取的統一資源定位是腳本片段中每一a標籤中href屬性內容。
6.一種保存網頁中多個連結對象的方法,其特徵在於,包括以下步驟(a)在網頁中選取待保存的多個連結,並解析所述網頁的腳本,獲取所述選定的連結對應的統一資源定位;(b)根據所述選定的統一資源定位下載連結對象。
7.根據權利要求6所述的一種保存網頁中多個連結對象的方法,其特徵在於,所述步驟(a)進一步包括(a1)從瀏覽器顯示的網頁中以滑鼠拖動方式選取一個或多個連結;(a2)解析所述網頁獲得選取連結對應的腳本片段,並從所述腳本片段中獲取統一資源定位。
8.根據權利要求7所述的一種保存網頁中多個連結對象的方法,其特徵在於,所述步驟(a)進一步包括(a3)顯示步驟(a2)獲得的統一資源定位;(a4)調整並確認步驟(a3)顯示的統一資源定位;(a5)將步驟(a4)中確認的統一資源定位傳送到下載引擎。
9.根據權利要求7所述的一種保存網頁中多個連結對象的方法,其特徵在於,所述步驟(a2)中所述獲取的統一資源定位是腳本片段中每一a標籤中href屬性內容。
10.根據權利要求6所述的一種保存網頁中多個連結對象的方法,其特徵在於,所述步驟(a)中進一步包括刪除重複的統一資源定位。
全文摘要
本發明公開了一種保存網頁中多個連結對象的系統,包括選取單元,用於在網頁中選取待保存的多個連結;解析單元,用於解析所述網頁的腳本,並獲取所述選取的連結對應的統一資源定位;下載引擎,用於根據選定的統一資源定位下載連結對象。本發明還提供一種對應的方法。本發明通過解析網頁腳本獲取在網頁中選取的多個連結對象的對應的統一資源定位,並根據統一資源定位下載相關內容,實現了直觀的多個連結對象下載,簡化了多連結對象的下載操作。
文檔編號G06F17/30GK101079057SQ20071007351
公開日2007年11月28日 申請日期2007年3月14日 優先權日2007年3月14日
發明者胡鵬 申請人:騰訊科技(深圳)有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀