文字提取方法及裝置與流程
2023-05-13 05:12:36 3
本公開涉及信息處理
技術領域:
:,尤其涉及一種文字提取方法及裝置。
背景技術:
::目前,大部分手機都具有拍照功能。用戶在日常生活中遇到需要記錄的重要信息時,往往來不及採用備忘錄進行記錄,此時用戶可以打開照相機拍攝圖片,之後在按照所拍攝的圖片整理出所需信息,提高了用戶記錄信息的便捷性。技術實現要素:為克服相關技術中存在的問題,本公開實施例提供一種文字提取方法及裝置。所述技術方案如下:根據本公開實施例的第一方面,提供一種文字提取方法,包括:提取多張圖片中每張圖片的文字,生成多組文字信息,其中,所述多組文字信息與所述多張圖片一一對應;按照預設順序排列所述多組文字信息;根據排列後的所述多組文字信息,生成文檔。本公開的實施例提供的技術方案可以包括以下有益效果:若相冊中存儲大量課件圖片,可以將課件圖片中的文字提取為文字信息,並將該文字信息整理成邏輯清晰的文檔,用戶可以保留生成的文檔,刪除相冊中的課件圖片,這樣一來,用戶可以較為便捷的查閱課件信息,同時節約了相冊的存儲空間,提高了用戶體驗。在一個實施例中,所述生成多組文字信息包括:根據提取到的每張圖片的文字和每張圖片的文字排版,生成每張圖片對應的一組文字信息,每組文字信息的文字排版和與其對應的圖片的文字排版相同。本公開的實施例提供的技術方案可以包括以下有益效果:按照每張課件圖片中的文字排版,提取並生成的每張課件圖片對應的一組文字信息,使得每組文字信息的文字排版和與其對應的圖片的文字排版相同,避免了因為改變了文字排版導致用戶無法分辨課件中重點內容的情況,提高了用戶體驗。在一個實施例中,所述按照預設順序排列所述多組文字信息包括:按照所述多張圖片的排列順序排列所述多組文字信息。本公開的實施例提供的技術方案可以包括以下有益效果:由於圖片的排列順序反映了課件的先後順序,因此根據圖片的排列順序排列多組文字信息,可以保證文字信息的連貫性,使得生成的文檔邏輯清晰,便於用戶查閱。在一個實施例中,所述方法還包括:根據用戶操作,調整所述文檔中所述多組文字信息的組與組之間的先後順序。本公開的實施例提供的技術方案可以包括以下有益效果:在提取到多張圖片的文字信息之後,用戶可以根據邏輯順序調整多組文字信息的排列順序,使得生成的文檔邏輯清晰,便於用戶查閱。在一個實施例中,所述根據排列後的所述多組文字信息,生成文檔包括:根據所述排列後的多組文字信息,生成可編輯文檔。本公開的實施例提供的技術方案可以包括以下有益效果:生成可編輯文檔,使得用戶可以根據需要在已生成的可編輯文檔中添加新的內容,提高了用戶使用文檔的靈活性,進一步提高了用戶體驗。在一個實施例中,所述可編輯文檔中相鄰兩組文字信息之間設置有分隔標識。本公開的實施例提供的技術方案可以包括以下有益效果:生成可編輯文檔中相鄰兩組文字信息之間設置有分隔標識,便於用戶區分不同的文字信息,確定查閱的位置。根據本公開實施例的第二方面,提供一種文字提取裝置,包括:提取模塊,用於提取多張圖片中每張圖片的文字,生成多組文字信息,其中,所述多組文字信息與所述多張圖片一一對應;排列模塊,用於按照預設順序排列所述多組文字信息;生成模塊,用於根據所述排列後的所述多組文字信息,生成文檔。在一個實施例中,所述生成模塊包括:生成子模塊,用於根據提取到的每張圖片的文字和每張圖片的文字排版,生成每張圖片對應的一組文字信息,每組文字信息的文字排版和與其對應的圖片的文字排版相同。在一個實施例中,所述排列模塊包括:排列子模塊,用於按照所述多張圖片的排列順序排列所述多組文字信息。在一個實施例中,所述裝置還包括:調整模塊,用於根據用戶操作,調整所述文檔中所述多組文字信息的組與組之間的先後順序。在一個實施例中,所述生成模塊根據所述排列後的多組文字信息,生成可編輯文檔。在一個實施例中,所述可編輯文檔中相鄰兩組文字信息之間設置有分隔標識。根據本公開實施例的第三方面,提供一種文字提取裝置,包括:處理器;用於存儲處理器可執行指令的存儲器;其中,所述處理器被配置為:提取多張圖片中每張圖片的文字,生成多組文字信息,其中,所述多組文字信息與所述多張圖片一一對應;按照預設順序排列所述多組文字信息;根據排列後的所述多組文字信息,生成文檔。應當理解的是,以上的一般描述和後文的細節描述僅是示例性和解釋性的,並不能限制本公開。附圖說明此處的附圖被併入說明書中並構成本說明書的一部分,示出了符合本公開的實施例,並與說明書一起用於解釋本公開的原理。圖1a是根據一示例性實施例示出的文字提取方法的流程圖1。圖1b是根據一示例性實施例示出的文字提取方法的流程圖2。圖1c是根據一示例性實施例示出的文字提取方法的流程圖3。圖1d是根據一示例性實施例示出的文字提取方法的流程圖4。圖1e是根據一示例性實施例示出的文字提取方法的流程圖5。圖2是根據一示例性實施例示出的文字提取方法的流程圖6。圖3是根據一示例性實施例示出的文字提取方法的流程圖7。圖4a是根據一示例性實施例示出的文字提取裝置的結構示意圖1。圖4b是根據一示例性實施例示出的文字提取裝置的結構示意圖2。圖4c是根據一示例性實施例示出的文字提取裝置的結構示意圖3。圖4d是根據一示例性實施例示出的文字提取裝置的結構示意圖4。圖5是根據一示例性實施例示出的文字提取裝置的結構框圖1。圖6是根據一示例性實施例示出的文字提取裝置的結構框圖2。具體實施方式這裡將詳細地對示例性實施例進行說明,其示例表示在附圖中。下面的描述涉及附圖時,除非另有表示,不同附圖中的相同數字表示相同或相似的要素。以下示例性實施例中所描述的實施方式並不代表與本公開相一致的所有實施方式。相反,它們僅是與如所附權利要求書中所詳述的、本公開的一些方面相一致的裝置和方法的例子。本公開實施例提供的技術方案用於終端,所述終端包括手機,平板電腦,以及其他能夠拍攝並保存圖片的設備。實際應用中,若用戶正在接受培訓,講師在講解的過程中為了便於用戶理解講解內容,可以使用投影儀播放課件。用戶為了更好的記錄講解的重點,可以使用手機的照相功能將播放的課件拍攝下來。但是一般的課件頁數較多,用戶可能需要拍攝多張圖片才能記錄完整,這些課件圖片會佔用大量的存儲空間,導致終端可用的存儲空間減小。並且用戶在查看圖片格式的課件時,需要來回翻頁以便於銜接相鄰兩頁課件之間的內容,較為不便。本公開實施例中,終端可以提取課件圖片中的文字,獲取每張課件圖片對應的文字信息,然後根據這些文字信息生成文檔供用戶查閱,因此用戶可以較為便捷的查閱課件信息,同時節約了終端相冊的存儲空間,提高了用戶體驗。圖1a是根據一示例性實施例示出的一種文字提取方法的流程圖,所述文字提取方法用於終端,所述終端包括手機,平板電腦,以及其他能夠拍攝並保存圖片的設備,本公開實施例在此不做限定。如圖1a所示,所述文字提取方法包括以下步驟101至步驟103:在步驟101中,提取多張圖片中每張圖片的文字,生成多組文字信息。通常的,講師的課件除小部分示意圖之外,其他大部分內容都以文字的形式體現。這些文字以圖片的形式進行存儲,佔用了大量的存儲空間,因此在終端中存儲有大量課件圖片時,用戶可以根據需要選擇其中的多張圖片,依次提取每張圖片的文字,組成每張圖片對應的文字信息,即生成多組文字信息,其中,多組文字信息與多張圖片一一對應。示例的,終端中可以存儲多種文字的模板,在提取圖片上的文字時,可以通過圖像識別,確定圖片上的圖像與終端中存儲的某個文字是否匹配,若圖片上的圖像與終端中存儲的第一文字匹配,說明該圖像對應的文字即為第一文字。在步驟102中,按照預設順序排列所述多組文字信息。示例的,用戶在拍攝課件圖片的時候,可能是按照課件的先後順序拍攝的,也可能是用戶隨機拍攝的,因此在獲取到每張圖片的文字信息之前,可以預先設置文字信息的排列順序。例如,可以按照所述多張圖片的排列順序排列,也可以按照多張圖片的存儲順序排列,或者還可以按照用戶選擇多張圖片的選擇順序進行排列,本公開實施例在此不做限定。在步驟103中,根據所述排列後的多組文字信息,生成文檔。示例的,所述文檔的格式可以為Word(MicrosoftofficeWord,文字處理軟體),TXT(TextFile,文本文件),PDF(PortableDocumentFormat,可攜式文檔格式)或者其他文本格式,本公開實施例對此不作限定。以文檔的格式為Word為例,在按照預設順序排列多組文字信息的順序之後,可以按照排列後的先後順序依次將多組文字信息寫入新建的Word文檔,並可以按照當前時間為該Word文檔設置標題或命名,最終生成以當前時間命名或以當前時間為標題的Word文檔。實際應用中,終端也可以接收用戶輸入的標題或名稱,終端在將文字信息寫入新建的Word文檔之後,根據用戶的輸入信息為文檔設置標題,或者為文檔命名。本公開的實施例提供的技術方案中,若相冊中存儲大量課件圖片,可以將課件圖片中的文字提取為文字信息,並將該文字信息整理成邏輯清晰的文檔,用戶可以保留生成的文檔,刪除相冊中的課件圖片,這樣一來,用戶可以較為便捷的查閱課件信息,同時節約了相冊的存儲空間,提高了用戶體驗。在一個實施例中,如圖1b所示,在步驟103中,生成多組文字信息,可以通過步驟1031實現:在步驟1031中,根據提取到的每張圖片的文字和每張圖片的文字排版,生成每張圖片對應的一組文字信息,每組文字信息的文字排版和與其對應的圖片的文字排版相同。示例的,講師在編寫課件時,為了區分不同的內容以及突出重點內容,課件上文字的位置,大小以及顏色等會有區別,為了避免轉化成文檔之後,出現邏輯不清的情況,終端可以按照每張圖片的文字排版,提取每張圖片的文字信息,使得生成每張圖片對應的文字信息的文字排版和與其對應的圖片的文字排版相同。所述文字排版包括文字的位置,文字排列的方向,文字的大小,或者文字的顏色。以第一圖片為例,假設第一圖片包括三行文字,其中第一行文字為橫向排列,位於第一圖片的上方,三號字體,顏色為紅色;第二行文字為橫向排列,位於第一行文字下方,四號字體,顏色為黑色,其中第二行文字的第三個文字與第四個文字之間存在間隔;第三行文字為縱向排列,位於第一行文字和第二行文字下方,五號字體,顏色為綠色。按照上述排版提取第一圖片的文字信息,該文字信息中三行字體的排版與第一圖片的排版相同,即選用橫向排列方式,三號紅色字體記錄提取到的第一行文字;選用橫向排列方式,四號黑色字體記錄提取到的第二行文字;選用縱向排列方式,五號綠色字體記錄提取到的第三行文字。為了更進一步的體現第二行文字的第三個文字與第四個文字之間的間隔,文字信息中第二行文字的第三個文字與第四個文字之間可以採用空格或者「;」等分隔符斷開。本公開的實施例提供的技術方案中,按照每張課件圖片中的文字排版,提取並生成的每張課件圖片對應的一組文字信息,使得每組文字信息的文字排版和與其對應的圖片的文字排版相同,避免了因為改變了文字排版導致用戶無法分辨課件中重點內容的情況,提高了用戶體驗。在一個實施例中,如圖1c所示,在步驟102中,按照預設順序排列所述多組文字信息,可以通過步驟1021實現:在步驟1021中,按照所述多張圖片的排列順序排列所述多組文字信息。示例的,用戶在接受培訓時,通常按照講師的講解順序拍攝課件,終端通常按照照片的拍攝時間的先後順序排列照片,因此終端中多張課件圖片的排列順序符合課件的邏輯順序,終端可以按照多張課件圖片在終端中的排列順序排列從所述多張課件圖片中提取得到的多組文字信息,使得根據排列後的多組文字信息生成的文檔邏輯清晰,便於用戶查閱。上述實施例同樣適用於圖1b所示的技術方案。本公開的實施例提供的技術方案中,由於圖片的排列順序反映了課件的先後順序,因此根據圖片的排列順序排列多組文字信息,可以保證文字信息的連貫性,使得生成的文檔邏輯清晰,便於用戶查閱。在一個實施例中,如圖1d所示,所述方法還包括步驟104:在步驟104中,根據用戶操作,調整所述文檔中所述多組文字信息的組與組之間的先後順序。示例的,在用戶接受培訓的過程中,有可能根據講課的重點隨機的拍攝課件圖片,終端中課件圖片的排列順序較為混亂。為了查閱方便,用戶在終端將課件圖片轉化為文檔時可以調整多組文字信息組與組之間的先後順序。例如,用戶在相冊中選取多張課件圖片時,可以按照邏輯順序依次選取,終端在接收用戶選定的多張圖片時,可以記錄多張圖片的選取順序,當終端獲取到多組文字信息之後,按照該選取順序調整多組文字信息的先後順序。或者,終端可以將用戶選擇的多張圖片顯示在排列界面上,用戶在該排列界面上按照邏輯順序調整圖片的順序,終端可以記錄用戶最終確定的圖片的邏輯順序,當終端獲取到多組文字信息之後,按照該邏輯順序調整多組文字信息的先後順序。或者,終端可以為用戶選擇的多張圖片進行編號,在終端提取圖片的文字信息之後,圖片可以根據邏輯順序依次輸入圖片編號,終端可以記錄用戶輸入的圖片編號的編號順序,當終端獲取到多組文字信息之後,按照該編號順序調整多組文字信息的先後順序。或者,當終端獲取多組文字信息之後,可以顯示編輯頁面,該編輯頁面顯示多組文字信息的可編輯狀態,用戶可以根據課件的邏輯順序,調整多組文字信息組與組之間的順序,調整完畢之後,終端根據編輯頁面上各組文字信息之間的順序,生成文檔。上述實施例同樣適用於圖1b所示的技術方案。本公開的實施例提供的技術方案中,在提取到多張圖片的文字信息之後,用戶可以根據邏輯順序調整多組文字信息的排列順序,使得生成的文檔邏輯清晰,便於用戶查閱。在一個實施例中,如圖1e所示,在步驟103中,根據所述排列後的多組文字信息,生成文檔,可以通過步驟1032實現:在步驟1032中,根據所述排列後的多組文字信息,生成可編輯文檔。示例的,所述可編輯文檔包括Word或者TXT。以Word為例,終端在按照預設順序排列多組文字信息之後,可以按照排列後的多組文字信息的先後順序依次將該多組文字信息寫入新建的Word文檔,並以當前時間作為該Word文檔的名稱。示例的,終端在提取課件圖片中的文字信息時,難免會出現提取不正確或者遺漏的情況,因此用戶在查閱生成的文檔時,可以根據需要修改該文檔或者補充遺漏的內容。例如,用戶在終端屏幕上點擊需要補充內容的位置,此時終端顯示輸入界面,用戶在該輸入界面上輸入需要補充的文字內容,當用戶確定輸入完成時,終端將用戶輸入的文字內容顯示在用戶確定的需要補充內容的位置。或者,若用戶確定Word文檔中出現錯誤時,可以在屏幕上點擊錯誤的位置,此時終端顯示修改界面,該修改界面上顯示有用戶點擊位置的文字,用戶可以根據需要進行刪除,並輸入修改後的內容。當用戶確定修改完成時,終端在用戶確定的錯誤位置顯示修改後的內容。實際應用中,用戶輸入的內容也可以是圖片、圖標等。上述實施例同樣適用於圖1c或圖1d所示的技術方案。本公開的實施例提供的技術方案中,用戶可以根據需要在已生成的可編輯文檔中添加新的內容,提高了用戶使用文檔的靈活性,進一步提高了用戶體驗。在一個實施例中,所述可編輯文檔中相鄰兩組文字信息之間設置有分隔標識。為了便於用戶將查閱的Word文檔的位置定位至課件的位置,在將文字信息寫入Word文檔時,相鄰兩組文字信息之間可以通過分隔標識隔開,所述分隔標識可以為分隔線,空行或者以「*」組成的標識,本公開實施例在此不做限定。本公開的實施例提供的技術方案中,生成可編輯文檔中相鄰兩組文字信息之間設置有分隔標識,便於用戶區分不同的文字信息,確定查閱的位置。下面通過幾個實施例詳細介紹實現過程。圖2是根據一示例性實施例示出的一種文字提取方法的流程圖,執行主體為終端,如圖2所示,所述文字提取方法包括以下步驟:在步驟201中,根據用戶指示,選擇多張圖片。在步驟202中,依次提取多張圖片中每張圖片的文字信息。在步驟203中,獲取所述多張圖片的排列順序。在步驟204中,按照所述排列順序排列從所述多張圖片中提取到的多組文字信息。在步驟205中,根據所述排列後的多組文字信息,生成可編輯文檔,所述可編輯文檔中相鄰兩組文字信息之間設置有分隔標識。本公開的實施例公開一種文字提取方法,在該方法提供的技術方案中,若相冊中存儲大量課件圖片,可以將課件圖片中的文字提取為文字信息,並將該文字信息整理成邏輯清晰的文檔,用戶可以保留生成的文檔,刪除相冊中的課件圖片,這樣一來,用戶可以較為便捷的查閱課件信息,同時節約了相冊的存儲空間,提高了用戶體驗。圖3是根據一示例性實施例示出的一種文字提取方法的流程圖,執行主體為終端,如圖3所示,所述文字提取方法包括以下步驟:在步驟301中,根據用戶指示,選擇多張圖片。在步驟302中,依次提取多張圖片中每張圖片的文字信息。在步驟303中,接收用戶輸入的調整順序。在步驟304中,按照所述調整順序調整多組文字信息組與組之間的順序。在步驟305中,根據所述調整後的多組文字信息,生成可編輯文檔,所述可編輯文檔中相鄰兩組文字信息之間設置有分隔標識。在步驟306中,接收用戶輸入的文字內容。在步驟307中,根據用戶指示將所述文字內容寫入所述可編輯文檔中所述用戶指示指定位置。本公開的實施例公開一種文字提取方法,在該方法提供的技術方案中,若相冊中存儲大量課件圖片,可以將課件圖片中的文字提取為文字信息,並將該文字信息整理成邏輯清晰的文檔,用戶可以保留生成的文檔,刪除相冊中的課件圖片,這樣一來,用戶可以較為便捷的查閱課件信息,同時節約了相冊的存儲空間,提高了用戶體驗。下述為本公開裝置實施例,可以用於執行本公開方法實施例。圖4a是根據一示例性實施例示出的一種文字提取裝置40的結構示意圖,該裝置40可以通過軟體、硬體或者兩者的結合實現成為電子設備的部分或者全部。如圖4a所示,該文字提取裝置40包括:提取模塊401,用於提取多張圖片中每張圖片的文字,生成多組文字信息,其中,所述多組文字信息與所述多張圖片一一對應。排列模塊402,用於按照預設順序排列所述多組文字信息。生成模塊403,用於根據所述排列後的所述多組文字信息,生成文檔。在一個實施例中,如圖4b所示,所述生成模塊403包括:生成子模塊4031,用於根據提取到的每張圖片的文字和每張圖片的文字排版,生成每張圖片對應的一組文字信息,每組文字信息的文字排版和與其對應的圖片的文字排版相同。在一個實施例中,如圖4c所示,所述排列模塊402包括:排列子模塊4021,用於按照所述多張圖片的排列順序排列所述多組文字信息。上述實施例也適用於圖4b所示的文字提取裝置40。在一個實施例中,如圖4d所示,所述裝置40還包括:調整模塊404,用於根據用戶操作,調整所述文檔中所述多組文字信息的組與組之間的先後順序。上述實施例也適用於圖4b或圖4c所示的文字提取裝置40。在一個實施例中,所述生成模塊403根據所述排列後的多組文字信息,生成可編輯文檔。在一個實施例中,所述可編輯文檔中相鄰兩組文字信息之間設置有分隔標識。本公開的實施例公開一種文字提取裝置,若相冊中存儲大量課件圖片,該裝置可以將課件圖片中的文字提取為文字信息,並將該文字信息整理成邏輯清晰的文檔,用戶可以保留生成的文檔,刪除相冊中的課件圖片,這樣一來,用戶可以較為便捷的查閱課件信息,同時節約了相冊的存儲空間,提高了用戶體驗。本公開實施例提供一種文字提取裝置,該裝置包括:處理器;用於存儲處理器可執行指令的存儲器;其中,處理器被配置為:提取多張圖片中每張圖片的文字,生成多組文字信息,其中,所述多組文字信息與所述多張圖片一一對應;按照預設順序排列所述多組文字信息;根據排列後的所述多組文字信息,生成文檔。在一個實施例中,上述處理器還可被配置為:根據提取到的每張圖片的文字和每張圖片的文字排版,生成每張圖片對應的一組文字信息,每組文字信息的文字排版和與其對應的圖片的文字排版相同。在一個實施例中,上述處理器還可被配置為:按照所述多張圖片的排列順序排列所述多組文字信息。在一個實施例中,上述處理器還可被配置為:根據用戶操作,調整所述文檔中所述多組文字信息的組與組之間的先後順序。在一個實施例中,上述處理器還可被配置為:根據所述排列後的多組文字信息,生成可編輯文檔。在一個實施例中,所述可編輯文檔中相鄰兩組文字信息之間設置有分隔標識。本公開的實施例公開一種文字提取裝置,若相冊中存儲大量課件圖片,該裝置可以將課件圖片中的文字提取為文字信息,並將該文字信息整理成邏輯清晰的文檔,用戶可以保留生成的文檔,刪除相冊中的課件圖片,這樣一來,用戶可以較為便捷的查閱課件信息,同時節約了相冊的存儲空間,提高了用戶體驗。關於上述實施例中的裝置,其中各個模塊執行操作的具體方式已經在有關該方法的實施例中進行了詳細描述,此處將不做詳細闡述說明。圖5是根據一示例性實施例示出的一種用於文字提取裝置50的框圖,該裝置適用於終端設備。例如,裝置50可以是行動電話,計算機,數字廣播終端,消息收發設備,遊戲控制臺,平板設備,醫療設備,健身設備,個人數字助理等。裝置50可以包括以下一個或多個組件:處理組件502,存儲器504,電源組件506,多媒體組件508,音頻組件510,輸入/輸出(I/O)的接口512,傳感器組件514,以及通信組件516。處理組件502通常控制裝置50的整體操作,諸如與顯示,電話呼叫,數據通信,相機操作和記錄操作相關聯的操作。處理組件502可以包括一個或多個處理器520來執行指令,以完成上述的方法的全部或部分步驟。此外,處理組件502可以包括一個或多個模塊,便於處理組件502和其他組件之間的交互。例如,處理組件502可以包括多媒體模塊,以方便多媒體組件508和處理組件502之間的交互。存儲器504被配置為存儲各種類型的數據以支持在裝置50的操作。這些數據的示例包括用於在裝置50上操作的任何應用程式或方法的指令,聯繫人數據,電話簿數據,消息,圖片,視頻等。存儲器504可以由任何類型的易失性或非易失性存儲設備或者它們的組合實現,如靜態隨機存取存儲器(SRAM),電可擦除可編程只讀存儲器(EEPROM),可擦除可編程只讀存儲器(EPROM),可編程只讀存儲器(PROM),只讀存儲器(ROM),磁存儲器,快閃記憶體,磁碟或光碟。電源組件506為裝置50的各種組件提供電力。電源組件506可以包括電源管理系統,一個或多個電源,及其他與為裝置50生成、管理和分配電力相關聯的組件。多媒體組件508包括在所述裝置50和用戶之間的提供一個輸出接口的屏幕。在一些實施例中,屏幕可以包括液晶顯示器(LCD)和觸摸面板(TP)。如果屏幕包括觸摸面板,屏幕可以被實現為觸控螢幕,以接收來自用戶的輸入信號。觸摸面板包括一個或多個觸摸傳感器以感測觸摸、滑動和觸摸面板上的手勢。所述觸摸傳感器可以不僅感測觸摸或滑動動作的邊界,而且還檢測與所述觸摸或滑動操作相關的持續時間和壓力。在一些實施例中,多媒體組件508包括一個前置攝像頭和/或後置攝像頭。當裝置50處於操作模式,如拍攝模式或視頻模式時,前置攝像頭和/或後置攝像頭可以接收外部的多媒體數據。每個前置攝像頭和後置攝像頭可以是一個固定的光學透鏡系統或具有焦距和光學變焦能力。音頻組件510被配置為輸出和/或輸入音頻信號。例如,音頻組件510包括一個麥克風(MIC),當裝置50處於操作模式,如呼叫模式、記錄模式和語音識別模式時,麥克風被配置為接收外部音頻信號。所接收的音頻信號可以被進一步存儲在存儲器504或經由通信組件516發送。在一些實施例中,音頻組件510還包括一個揚聲器,用於輸出音頻信號。I/O接口512為處理組件502和外圍接口模塊之間提供接口,上述外圍接口模塊可以是鍵盤,點擊輪,按鈕等。這些按鈕可包括但不限於:主頁按鈕、音量按鈕、啟動按鈕和鎖定按鈕。傳感器組件514包括一個或多個傳感器,用於為裝置50提供各個方面的狀態評估。例如,傳感器組件514可以檢測到裝置50的打開/關閉狀態,組件的相對定位,例如所述組件為裝置50的顯示器和小鍵盤,傳感器組件514還可以檢測裝置50或裝置50一個組件的位置改變,用戶與裝置50接觸的存在或不存在,裝置50方位或加速/減速和裝置50的溫度變化。傳感器組件514可以包括接近傳感器,被配置用來在沒有任何的物理接觸時檢測附近物體的存在。傳感器組件514還可以包括光傳感器,如CMOS或CCD圖像傳感器,用於在成像應用中使用。在一些實施例中,該傳感器組件514還可以包括加速度傳感器,陀螺儀傳感器,磁傳感器,壓力傳感器或溫度傳感器。通信組件516被配置為便於裝置50和其他設備之間有線或無線方式的通信。裝置50可以接入基於通信標準的無線網絡,如WiFi,2G或3G,或它們的組合。在一個示例性實施例中,通信組件516經由廣播信道接收來自外部廣播管理系統的廣播信號或廣播相關信息。在一個示例性實施例中,所述通信組件516還包括近場通信(NFC)模塊,以促進短程通信。例如,在NFC模塊可基於射頻識別(RFID)技術,紅外數據協會(IrDA)技術,超寬帶(UWB)技術,藍牙(BT)技術和其他技術來實現。在示例性實施例中,裝置50可以被一個或多個應用專用集成電路(ASIC)、數位訊號處理器(DSP)、數位訊號處理設備(DSPD)、可編程邏輯器件(PLD)、現場可編程門陣列(FPGA)、控制器、微控制器、微處理器或其他電子組件實現,用於執行上述方法。在示例性實施例中,還提供了一種包括指令的非臨時性計算機可讀存儲介質,例如包括指令的存儲器504,上述指令可由裝置50的處理器520執行以完成上述方法。例如,所述非臨時性計算機可讀存儲介質可以是ROM、隨機存取存儲器(RAM)、CD-ROM、磁帶、軟盤和光數據存儲設備等。圖6是根據一示例性實施例示出的一種用於文字提取裝置60的框圖。例如,裝置60可以被提供為一伺服器。裝置60包括處理組件602,其進一步包括一個或多個處理器,以及由存儲器603所代表的存儲器資源,用於存儲可由處理組件602的執行的指令,例如應用程式。存儲器603中存儲的應用程式可以包括一個或一個以上的每一個對應於一組指令的模塊。此外,處理組件602被配置為執行指令,以執行上述方法。裝置60還可以包括一個電源組件606被配置為執行裝置60的電源管理,一個有線或無線網絡接口605被配置為將裝置60連接到網絡,和一個輸入輸出(I/O)接口608。裝置60可以操作基於存儲在存儲器603的作業系統,例如WindowsServerTM,MacOSXTM,UnixTM,LinuxTM,FreeBSDTM或類似。一種非臨時性計算機可讀存儲介質,當所述存儲介質中的指令由裝置50的處理器或者裝置60的處理組件執行時,使得裝置50或裝置60能夠執行上述文字提取的方法,所述方法包括:提取多張圖片中每張圖片的文字,生成多組文字信息,其中,所述多組文字信息與所述多張圖片一一對應;按照預設順序排列所述多組文字信息;根據排列後的所述多組文字信息,生成文檔。在一個實施例中,所述生成多組文字信息包括:根據提取到的每張圖片的文字和每張圖片的文字排版,生成每張圖片對應的一組文字信息,每組文字信息的文字排版和與其對應的圖片的文字排版相同。在一個實施例中,所述按照預設順序排列所述多組文字信息包括:按照所述多張圖片的排列順序排列所述多組文字信息。在一個實施例中,所述方法還包括:根據用戶操作,調整所述文檔中所述多組文字信息的組與組之間的先後順序。在一個實施例中,所述根據排列後的所述多組文字信息,生成文檔包括:根據所述排列後的多組文字信息,生成可編輯文檔。在一個實施例中,所述可編輯文檔中相鄰兩組文字信息之間設置有分隔標識。本領域技術人員在考慮說明書及實踐這裡公開的公開後,將容易想到本公開的其它實施方案。本申請旨在涵蓋本公開的任何變型、用途或者適應性變化,這些變型、用途或者適應性變化遵循本公開的一般性原理並包括本公開未公開的本
技術領域:
:中的公知常識或慣用技術手段。說明書和實施例僅被視為示例性的,本公開的真正範圍和精神由下面的權利要求指出。應當理解的是,本公開並不局限於上面已經描述並在附圖中示出的精確結構,並且可以在不脫離其範圍進行各種修改和改變。本公開的範圍僅由所附的權利要求來限制。當前第1頁1 2 3 當前第1頁1 2 3