內容轉換方法和裝置的製作方法
2023-05-21 09:49:31 2
>同樣,如果在現有狀態中的表達人工地起因於和另一狀態的數據點的特定關聯並編錄在一個資料庫中,兩種狀態之間的轉換是可能的。例如,如果每個以一種形式、狀態或語言表示的「概念」與電磁波(音調)關聯,將創建出該概念的「電磁表示」。一旦用對應的電磁表示編碼了給定數量的概念,數據(以概念的形式)可以被翻譯為電磁波並且馬上通過常規長途電信的基礎設施傳輸。當電磁波到達目的機器,該機器將合成電磁波為分離的成分並且,給出關聯時(和排序指令一起,使用上述的雙重重疊技術,和/或其他技術),呈現獨立的以電磁表示來表示的概念。2.概念轉換方法和裝置本發明的另一方面集中於提供方法和裝置,用於從包含第一種狀態、形式或語言的數據的第一個文檔創建包含第二種狀態、形式或語言的數據的第二個文檔,而最終結果是第一個和第二個文檔表示本質上相同的概念或信息,並且所述方法和裝置包括使用一個跨概念關聯資料庫。翻譯方法的所有實例使用雙重重疊技術來獲取概念從一種狀態到另一種狀態的準確翻譯。相反,現有技術的翻譯設備集中於單個單詞的翻譯或使用特殊的基於規則的代碼來幫助從第一種語言到第二種語言的翻譯。本發明使用重疊技術使第二種語言的單詞和單詞串能夠有機地連接在一起並且以在第二種語言中寫出那些單詞和短語的準確方式在它們正確的上下文中成為準確的翻譯。在本發明的一個實例中,組合創建資料庫的方法和重疊技術以提供準確的語言翻譯。語言可以為任意類型的轉換並且並不僅限於口語/書面語。例如,轉換可以包括計算機語言、特定的數據代碼如ASCII,及其類似。資料庫是動態的;即,當內容被輸入到翻譯系統中時,資料庫隨著翻譯系統使用先前輸入的內容進行的接連的迭代增長。本發明的首選實例使用如在已有的技術中隨時可用的類型的個人計算機系統這樣的計算設備。然而,該系統並不需要使用這樣的計算設備並且隨時可以通過其他方式實現,包括手工的資料庫創建和翻譯方法。本發明可以被用在有著至少一種顯示方法、一種輸入方法和輸出方法,及一個處理器的普通計算機系統中。顯示方法可以為已有技術中可用的任何方法,如陰極射線終端、液晶顯示、平板顯示等等。處理器方法也可以為可用的任何方法並且使用在計算環境中使得方法被提供從而允許計算機工作以執行本發明。最後,為了建立跨關聯資料庫,輸入方法被用來允許文檔的輸入;如上所述轉換到數字形式的特定輸入方法取決於用戶的需要可以是不同的。a.通過雙重重疊技術進行手工的資料庫創建和翻譯下面說明根據本發明從第一種語言到第二種語言翻譯文檔的方法和裝置的實例的一個例子,其中通過向用戶詢問單詞和單詞串的翻譯以及使用雙重重疊技術自動地生成片段的翻譯發展跨語言資料庫。為了說明首選實例,使用一個例子,其中英語的數據被翻譯為希伯來語。這些部分僅用於說明的目的,並不意味著限制第一種和第二種語言的選擇。根據本發明的一個首選實例,計算機系統創建從英語到希伯來語的翻譯之間的關聯的資料庫。翻譯方法至少包括以下步驟第一,英語的數據被輸入到計算機系統。第二,逐詞檢查英語輸入的所有單詞。資料庫將返回已知的希伯來語的單詞翻譯。如果該翻譯未被包括在資料庫中,那麼計算機系統將詢問用戶輸入合適的翻譯。因此,如果資料庫不知道等價於輸入的英語單詞的希伯來語,計算機將要求用戶提供合適的等價希伯來語。然後用戶將範圍翻譯並輸入所述的翻譯到資料庫中。在後面的使用中,計算機系統將以某種方式操作資料庫使得依靠用戶在先前的輸入知道該翻譯。因此,在接下來的步驟中以輸入數據的解析後的狀態檢查它-即逐詞-並且合適的翻譯要麼被返回(依靠資料庫的操作)要麼被輸入到資料庫中。第三,以某種方式檢查輸入數據以遞增解析過的片段。例如,如果首先逐詞解析數據,本發明的翻譯方法接下來通過評估兩單詞的串檢查輸入數據。再次,以類似於上述的方式,如果已知的話,資料庫返回兩單詞串的翻譯;如果未知,翻譯系統對所有可能的兩單詞串詢問用戶輸入適合的翻譯。所有重疊的2單詞片段然後被存儲在資料庫中。例如,如果一個單詞串由4個單詞組成,那麼資料庫檢查以確認在存儲器中是否有下面已翻譯的組合1,22,3和3,4。如果沒有,就詢問用戶。注意即使資料庫依靠上面的第二步包含每個單詞的定義,只有特定地編碼的兩單詞串的翻譯將作為準確翻譯返回。第四,如果兩個重疊的兩單詞英語串的希伯來語翻譯有一個(或多個)重疊的單詞,系統以某種方式工作來合併重疊的片段。在重疊中的多餘的希伯來語片段被去除以提供通過組合兩個重疊的英語串(並去除在英語重疊中的重複)的創建三單詞英語串的連貫的翻譯。從1到無限次的步驟(n)重複上述步驟以提供合適的翻譯。翻譯方法通過校驗連接已通過重疊編碼的兩種語言的單詞塊的一致的串自動地工作。一旦資料庫達到關鍵規模,跨兩種語言一致的重疊連接的這些自動認可提供以完美的準確性在兩種語言之間的翻譯的語言網絡。作為例子,考慮英語短語「Iwanttobuyacar」。通過本發明方法的操作,該短語被輸入到操作資料庫的計算機中。計算機將操作以確定資料庫是否包括等價於下面單詞的希伯來語「I」,「want」,「to」,「buy」,「a」和「car」。如果操作這樣的等價,計算機將返回等價的希伯來語。如果不存在這樣的等價,計算機將詢問用戶提供適合的希伯來語翻譯,並存儲這樣的翻譯以後使用。然後,計算機將以重疊的方式解析該句子為兩單詞片段「Iwant」,「wantto」,「tobuy」,「buya」和「acar」。計算機將操作以返回這些片段的等價希伯來語(即,和「Iwant」等價的希伯來語等等);如果不存在這樣的等價希伯來語,那麼計算機將詢問用戶提供適合的希伯來語翻譯,並存儲這樣的翻譯以後使用。然後本發明將檢查三單詞片段「Iwantto」,「wanttobuy」,「tobuya」和「buyacar」。在此本發明的處理嘗試組合每一對英語翻譯重疊的希伯來語翻譯並且組合來得到每個三單詞英語翻譯查詢(例如,組合「Iwant」和「wantto」來合成「Iwantto」)。如果希伯來語片段有連接它們的共同的重疊,翻譯方法自動地認可三單詞英語單詞串作為希伯來語翻譯而無需用戶幹預。如果希伯來語片段並不重疊並合併,用戶被詢問提供準確翻譯。在三單詞英語串的適合的翻譯嘗試之後,處理繼續對四單詞串等等進行,通過跨語言重疊嘗試自動地解決翻譯的組合,直到被檢查片段完成(在這種情況下,整個短語「Iwanttobuyacar」)。本發明的方法,在通過這種解析後,然後比較返回的翻譯等價,去除重疊片段中的冗餘,並向用戶輸出已翻譯的短語。b.通過關聯資料庫和雙重重疊技術進行文檔翻譯如另一首選實例,本發明可以翻譯第一種語言的文檔為第二種語言的文檔,按如上所述通過使用跨語言資料庫提供文檔中的單詞和單詞串的單詞串翻譯,然後使用上述的跨語言雙重重疊技術合併第二種語言的重疊的單詞串來提供文檔的翻譯。例如,考慮資料庫有足夠多的跨語言文檔來解決下面以英語輸入並將被翻譯為希伯來語的句子的成分「Inadditiontomyneedtobelovedbyallthegirlsintown,IalwayswantedtobeknownasthebestplayertoeverplayontheNewYorkstatebasketballteam」。通過上述處理,處理方法將確定短語「Inadditiontomyneedtobelovedbyallthegirls」是來自源文檔、開始於源文檔的第一個單詞並且存在於資料庫中的最長的單詞串。它在資料庫中和希伯來語單詞串「benosafltzorechshelilihiotahuvalyedaykolhabahurot」關聯。然後處理使用上述方法確定下面的翻譯-即,用和先前標識出的英語單詞重疊的一個單詞(或替換地更多單詞)翻譯(並且存在於資料庫中)來自文本的最長的英語單詞串,並且重疊的英語單詞串的兩個希伯來語翻譯也有重疊的片段「lovedbyallthegirlsintown」翻譯為「ahuvalyedaykokhabahurotbuir」;「thegirlsintown,Ialwayswantedtobeknown」翻譯為「Habahurotbuir,tamidratzitylihiotyahua」;「Ialwayswantedtobeknownasthebestplayer」翻譯為「tamidratzitylihiotyahuabettorhasahkanhachitov」;及「thebestplayertoeverplayontheNewYorkstatebasketballteam」翻譯為「hasahkanhachitovshhaypaamsihekbekvutzathakadursalshelmedinatnewyork」。通過資料庫的這些返回,處理以某種方式存在來比較重疊的單詞和單詞串並去除冗餘。因此,「Inadditiontomyneedtobelovedbyallthegirls」翻譯為「benosafltzorechshelilihiotahuvalyedaykolhabahurot」;並且「lovedbyallthegirlsintown」翻譯為「ahuvalyedaykolhabahurotbuir」。使用本發明的技術,系統將得到英語片段「Inadditiontomyneedtobelovedbyallthegirls」和「lovedbyallthegirlsintown」並返回希伯來語片段「benosafltzorechshelilihiotahuvalyedaykolhabahurot」和「ahuvalyedaykolhabahurotbuir」並確定重疊。在英文中,短語為「Inadditiontomyneedtobelovedbyallthegirls」和「lovedbyallthegirlsintown」。去除重疊得到「Inadditiontomyneedtobelovedbyallthegirlsintown」。在希伯來語中,短語為「benosafltzorechshelilihiotahuvalyedaykolhabahurot」和「ahuvalyedaykolhabahurotbuir」去除重疊得到「benosafltzorechshelilihiotahuvalyedaykolhabahurotbuir」。然後本發明操作下一個已解析的片段來繼續處理。在這個例子中,處理過程操作短語「thegirlsintown,Ialwayswantedtobeknown」。系統解決英語片段「Inadditiontomyneedtobelovedbyallthegirlsintown」和新的英語單詞集合「thegirlsintown,Ialwayswantedtobeknown」。對應的希伯來語單詞集合為「benosafltzorechshelilihiotahuvalyedaykolhabahurotbuir」和對應的希伯來語的單詞集合「habahurotbuir,tamidratzity「hiotyahua」。在英語中進行去除重疊操作,如下「Inadditiontomyneedtobelovedbyallthegirlsintown」和「thegirlsintown,Ialwayswantedtobeknown」得到「Inadditiontomyneedtobelovedbyallthegirlsintown,Ialwayswantedtobeknown」。在希伯來語中,重疊處理操作如下「benosafltzorechshelilihiotahuvalyedaykolhabahurotbuir」和「habahurotbuir,tamidratzitylihiotyahua」得到「benosafltzorechshelilihiotahuvalyedaykolhabahurotbuir,tamidratzitylihiotyahua」。本發明在被翻譯的文檔中對餘下的單詞和單詞串繼續這種類型的操作。因此,在首選實例的一個例子中,下一個英語單詞串為「Inadditiontomyneedtobelovedbyallthegirlsintown,Ialwayswantedtobeknown」和「Ialwayswantedtobeknownasthebestplayer」。由資料庫對這些短語返回的希伯來語翻譯為「benosafltzorechshelilihiotahuvalyedaykolhabahurotbuir,tamidratzitylihiotyahua」和「tamitratzitylihiotyahuabettorhasahkanhachitov」。去除英語重疊得到「Inadditiontomyneedtobelovedbyallthegirlsintown,Ialwayswantedtobeknownasthebestplayer」。去除希伯來語重疊得到「benosafltzorechshelilihiotahuvalyedaykolhabahurotbuir,tamidratzitylihiotyahuabettorhasahkanhachitov」。繼續該處理下一個單詞串為「Inadditiontomyneedtobelovedbyallthegirlsintown,Ialwayswantedtobeknownasthebestplayer」和「thebestplayertoeverplayontheNewYorkStatebasketballteam」。對應的希伯來語短語為「benosafltzorechshelilihiotahuvalyedaykolhabahurotbuir,tamidratzitylihiotyahuabettorhasahkanhachitov」和「hasahkanhachitovshhaypaamsihekbekvutzathakadursalshelmedinatnewyork」。去除英語重疊得到「Inadditiontomyneedtobelovedbyallthegirlsintown,IalwayswantedtobeknownasthebestplayertoeverplayontheNewYorkstatebasketballteam」。去除希伯來語重疊得到「benosafltzorechshelilihiotahuvalyedaykolhabahurotbuir,tamidratzitylihiotyahuabettorhasahkanhachitovshhaypaamsihekbekvutzathakadursalshelmedinatnewyork」,即需要被翻譯的文本的翻譯。在完成這個處理後,本發明返回已翻譯的最終文本並輸出該文本。應注意根據上述處理該返回是資料庫返回重疊關聯的最終結果。該系統,通過該處理,最終不接受通過重疊沒有和連續的第二種語言的片段自然匹配的連接的第二種語言的返回。如果任何希伯來語的返回沒有和連續的希伯來語單詞串關聯的準確重疊,它將被拒絕並且由和連續的希伯來語單詞串重疊的希伯來語單詞串關聯替代。本發明的首選實例的一個例子使用下面和技術中熟知的類型的計算機系統一起工作的電腦程式?functionconvert($what,$olang){if($what==″′″)$what=″\′″;if($what==″\\″)return;$query=″selectsletterfrom″.$olang.″letterwhere.fletter=′$what′″;$result=MYSQL(″minibush″,″$query″)ordie(″*$what*-error#1$query-″.MYSQL_ERROR);if(MYSQL_NUMROWS($result)0){list($sletter)=MYSQL_FETCH_ROW($result);return$sletter;}elsereturnstripslashes($what);}functionoverlap($s,$mm,$mean,$tos,$osmean,$max,$dictionary_t,$lang,$olang,$spaceaddress,$longestolang){$tempmax=$max;${$olang}=$osmean;${$lang}=$mean;$mean=explode(″″,$mean);$osmean=explode(″″,$osmean);for($m=$mm;$mcount($mean);$m++){unset($string);for($l=$m;$1count($mean);$1++)$string.=$mean[$1].″″;$sm=$s+count($mean);unset($nextwordmatch);if($spaceaddress[$sm+1])$nextwordmatch=″$langlike′″.str_replace(″%″,″″,trim($string.$spaceaddress[$sm])).″%′or″;$query1=″select$lang,$olangfrom$dictionary_twhere$nextwordmatch$lang=′″.str_replace(″%″,″″,trim($string.$spaceaddress[$sm])).″′and$olang″orderby$langdesc,length($lang),$olangdesc,length($olang)desc″;$result1=MYSQL(″minibush″,″$query1″)ordie(″can′terror#2-′$query1′″.MYSQL_EROR);$t=0;while($tMYSQL_NOMROWS($result1))#$tempmatch!=″yes″){list(${″temp″.$lang},${″temp″.$olang})=MYSQL_FETCH_ROW($result1);$tempmean=expode(″″,${″temp″.$lang});$tempomean=explode(″″,${″temp″.$olang});$tg=$m;$tm=0;unset($tempmatch);while($tgcount($tempmean)+$m){if(($spaceaddress[$s+$tg]==$tempmean[$tm])($tempmatch!=″no″))$tempmatch=″yes″;else$tempmatch=″no″;$tg++;$tm++;}if($tempmatch==″yes″substr_count($longestresult,″″)=substr_count(${″temp″.$lang},″″))#checksifthenewoverlapismatchingthetranslationrequest.{$longestresult=${″temp″.$lang};$omean=explode($tempomean,${$olang});$to=count($omean)-1;$tcheckb=substr(${″temp″.$olang},0,strlen($tempomean));if($osmean[$tos]==$tempomeanisset($osmean[$tos])){if(count($mean)+count($tempmean)-1$max)#singlewordoverlap{$max=$m+count($tempmean);$ns=$m;$tolang=${$olang}.substr(${″temp″.$olang},strlen($tempomean));$overlap=″true″;}else$tempmatch=″no″;}elseif($osmean[($tos-1)]==$tempomean$osmean[$tos]==$tempomean[1]isset($osmean[($tos-1)])){if(count($mean)+count($tempmean)-1$max)#singlewordoverlap{$max=$m+count($tempmean);$ns=$m;$tolang=${$olang}.substr(${″temp″.$olang},strlen($tempomean.″″.$tempomean[1]));$overlap=″true″;}else$tempmatch=″no″;}elseif($osmean[($tos-2)]==$tempomean$osmean[($tos-1)]==$tempomean[1]$osmean[$tos]==$tempomean[2]isset($osmean[($tos-2)])){if(count($mean)+count($tempmean)-1$max)#singlewordoverlap{$max=$m+count($tempmean);$ns=$m;$tolang=${$olang}.substr(${″temp″.$olang},strlen($tempomean.″″.$tempomean[1].″″.$tempomean[2]));$overlap=″true″;}else$tempmatch=″no″;}elseif(substr_count(${$olang},″″)==0$tcheckb==trim(substr(${$olang},1))){if(count($mean)+count($tempmean)-1$max)#singlewordoverlap{$max=$m+count($tempmean);$ns=$m;$olangminus=substr(${″temp″.$olang},strlen(${$olang}));$tolang=${$olang}.″″.$olangminus;$overlap=″true″;}}elseif(substr_count(${$olang},″″)==0substr_count(${″temp″.$olang},″″)==0)#englishoverlaphebrewonewordonly.{$max=$m+count($tempmean);$ns=$m;$tolang=${$olang}.″″.${″temp″.$olang};$overlap=″true″;}else{$tempmatch=″no″;}if($overlap==″true″){$mmean=explode(″″.$tempmean,${$lang});$to=count($mmean)-1;$ttos=count($mean)-1;if($mmean[$to]$to0){$tcheck=substr(${″temp″.$lang},strlen($tempmean)+1);if(substr($tcheck,0,strlen(trim($mmean[$to])))==trim($mmean[$to]))#overlapping{$tlang=${$lang}.substr($tcheck,strlen(trim($mean[$to])));}}elseif($mean[$ttos]==$tempmean$mean[$ttos]){$tlang=${$lang}.substr(${″temp″.$lang},strlen($tempmean));}else{print″BIGERROR″;exit;}}}$t++;}}if($overlap!=″true″)$overlap=″false″;if($tempmax==$max$overlap!=″true″)$max=0;$array=array(″s″=″$s″,″mm″=count($mean),″muean″=$tlang,″tos″=substr_count($tolang,″″),″osmean″=$tolang,″max″=″$max″,″tolang″=″$tolang″,″overlap″=″$overlap″,″longestolang″=″$longestolang″);return$array;}functiontranslate($word,$lock,$tags,$baselang){global$id_t,$prefix_t,$dictionary_t;if(!$word)return;if($transeng==″true″){if(ereg(″[a-zA-Z]″,$word))return$word;}if($baselang==″hebrew″){$spaceit=″true″;$emailend=″áòáéú.+.éì″;}if($baselang==″japanese″){$dictionary_t=″dictionaryjap″;$spaceit=″false″;}if($baselang==″chinesesim″){$dictionary_t=″dictionarychnsim″;$spaceit=″false″;}MYSQLCONNECT(″216.205.78.138″,″nobody″)ordie(″can′tconnect″.MYSQL_ERROR);$word=trim($word);if((strstr($word,hebrev($idt).″,″)||strstr($word,hebrev($id_t).″″)||substr($word,strlen($word)-strlen($id_t))==hebrev($id_t))isset($id_t)){$word=str_replace(hebrev($id_t),″″,$word);$systemsite=″true″;}if($word)##################ww.something##################{#####################if(strstr($word,″http//www.inhebrew.co.il/nsia.html″)){$word=split(″=″,$word);$word=split(″″,$word[1]);return$word;}#####################if(strstr($word,″//″)){$temp=explode(″//″,$word);$address=$temp[1];}else$address=$word;$address=explode(″/″,$address);$addresscheck=$address;if(!ereg(″[-zA-Za-ú]″,$addresscheck))$addresscheck=$address[1];if(ereg(″[a-zA-Z]″,$addresscheck)){$lang=″english″;$olang=$baselang;if(strtolower(substr($word,0,7))==″http//″){$word=substr($word,7);$pre=″//″;}if(strtolower(substr($word,0,8))==″https//″){$word=substr($word,8);$pre=″//″;}if(strtolower(substr($word,0,6))==″ftp//″){$word=substr($word,6);$pre=″//″;}}elseif($baselang==″hebrew″){$lang=″hebrew″;$olang=″english″;if(substr($word,0,8)==″//*″){$word=substr($word,8);$pre=″http//″;$upper=″true″;}elseif(substr($word,0,7)==″//″){$word=substr($word,7);$pre=″http//″;}elseif(substr($word,0,9)==″//*″){$word=substr($word,9);$pre=″https//″;$upper=″true″;}elseif(substr($word,0,8)==″//″){$word=substr($word,8);$pre=″https//″;}elseif(substr($word,0,7)==″//*″){$word=substr($word,7);$pre=″ftp//″;$upper=″true″;}elseif(substr($word,0,6)==″//″){$word=substr($wotd,6);$pre=″ftp//″;}elseif(substr($word,0,1)==″*″){$word=substr($word,1);$upper=″true″;}}elseif($bselang==″japanese″){$lang=″japanese″;$olang=″english″;}elseif($baselang==″chinesesim″){$lang=″chinesesim″;$olang=″english″;}$s=0;$tempreplace=strtolower($word);while($sstrlen($tempreplace)){if(!ereg(″[a-úa-zA-Z0-9\′\″]″,$tempreplace[$s])){$tempreplace=substr_replace($tempreplace,″$tempreplace[$s]″,$s,1);$s=$s+2;}$s++;}$tempreplace=eregi_replace(″[[space]]+″,″″,$tempreplace);$spaceaddress=explode(″″,$tempreplace);$s=0;unset($space);$color=″red″;$counts=count($spaceaddress);$query=″select$lang,$olangfrom$dictionary_twhere$lang=$tempreplace′″;$result=MYSQL(″minibush″,″$query″)ordie(″can′terror#0.1-′$query′″MYSQL_ERROR);if(MYSQL_NUMROWS($result)0){list(${$lang},${$olang})=MYSQL_FETCH_ROW($result);$space=${$olang};$counts=0;}while($counts$s)#wordbetween..{$spaceaddress[$s]=trim($spaceaddress[$s]);if($tags==″true″){$open=″fontcolor=\″$color\″″;$close=″/font″;if($color==″red″)$color=″blue″;else$color=″red″;}if(ereg(″[à-úa-zA-Z\′\″]″,$spaceaddress[$s])){unset($restofaddress);for($i=$s;$i$counts;$i++)$restofaddress.=″″.$spaceaddress[$i];$restofaddress=trim($restofaddress);$query=″select$lang,$olangfrom$dictionary_twhere$lang=′$restofaddress′″;$result=MYSQL(″minibush″,″$query″)ordie(″can′terror#0.2-′$query′″.MYSQL_ERROR);if(MYSQL_NUMROWS($result)==1){list(${$lang},${$olang})=MYSQL_FETCH_ROW($result);$space.=″″.$open.${$olang}.$close;$space=trim($space);$counts=0;}else{$n=$s+1;unset($nextwordmatch);if($spaceaddress[$n])$nextwordmatch=″$langlike′″.str_replace(″%″,″″,$spaceaddress[$s]).″″.str_replace(″%″,″″,$spaceaddress[$n]).″%′or″;$query=″select$lang,$olangfrom$dictionary_twhere$nextwordmatch$lang=′$spaceaddress[$s]′and$olang″orderby$langdesc,length($lang),$olangdesc,length($olang)desc″;$result=MYSQL(″minibush″,″$query″)ordie(″can′terror#1-′$query′″.MYSQL_RROR);if($match==″yes″)unset($match);if((MYSQL_NUMROWS($result)0)($match!=″no″)){$n=0;$maximum=0;$maximumr=0;unset($finals);unset($finalsr);unset($longestolang);unset($longestlang);while($nMYSQL_NUMROWS($result))#($match!=″yes″)){list(${$lang},${$olang})=MYSQL_FETCH_ROW($result);$mean=explode(″″,${$lang});$osmean=explode(″″,${$olang});$tos=count($osmean)-1;$g=0;unset($match);while($gcount($mean)){if(($spaceaddress[$s+$g]==$mean[$g])($match!=″no″))$match=″yes″;else$match=″no″;$g++;}if($match==″yes″){if(strlen($longestolang)strlen(${$olang}))$longestolang=${$olang};if(strlen($longestlang)strlen(${$lang}))$longestlang=${$lang};unset($overlap);unset($max);$array=array;$array=overlap($s,1,${$lang},$tos,${$olang},$g,$dictionary_t,$lang,$olang,$spaceaddress,$longestolang);$max=$array[″max″];$tolang=$array[″tolang″];if($tolang)$wasok=″true″;while($array[″overlap″]!=″false″count($spaceaddress)$max){$arroay=overlap($array[″s″],$array[″mm″],trim($array[″mean″]),$array[″tos″].trim($array[″osmean″]),$g,$dictionary_t,$lang,$olang,$spaceaddress,$longestolang);if($array[″overlap″]==″true″){$max=$array[″max″];$tolang=$array[″tolang″];$wasok=″true″;}}if($max$maximim$max0){$maximum=$max;$finals=$tolang;}if($wasok!=″true″){if(strlen(${$lang})$maximumr){$maximumr=strlen(${$lang});$gr=$g;$finalsr=${$olang};}}}$n++;}if($wasok==″true″){$match=″true″;if(!strstr($finals,$longestolang)$maximum=(substr_count(″″,$longestolang)+1)){#print″*″;if($s==0)$space=$space.$open.$longestolang.$close;else$space=$space.″″.$open.$longestolang.$close;$s=$s+substr_count($longestlang,″″)+1;}else{if($s==0)$space=$space.$open.$finals.$close;else$space=$space.″″.$open.$finals.$close;$s=$s+$maximum;}unset($maximum);unset($wasok);}elseif($finalsr)###testingnewthing,whathappenswhenapartialmachwasfound,(ieasomething,butaisnotinthesystem).{if($s==0)$space=$space.$open.$finalsr.$close;else$space=$space.″″.$open.$finalsr.$close;$s=$s+$gr;unset($maximumr);}else#stillistestphase.{if(ereg(″[a-zA-Zà-ú]″,$spaceaddress[$s]))$space=$space.″″$open.convert(substr($spaceaddress[$s],0,1),$baselang).$close;else$space=$space.$open.convert(substr($spaceaddress[$s],0,1),$baselang).$close;$spaceaddress[$s]=substr($spaceaddress[$s],1);if(!$spaceaddress[$s]||$spaceaddress[$s]==″0″)$s++;unset($match);}}else{if(ereg(″[a-zA-Zà-ú]″,$spaceaddress[$s]))$space=$space.″″.$open.convert(substr($spaceaddress[$s],0,1),$baselang).$close;else$space=$space.$open.convert(substr($spaceaddress[$s],0,1),$baselang).$close;$spaceaddress[$s]=substr($spaceaddress[$s],1);if(!$spaceaddress[$s]||$spaceaddress[$s]==″0″)$s++;unset($match);}if(!$spaceaddress[$s]||$spaceaddress[$s]==″0″)$s++;}}else{if(ereg(″[a-zA-Zà-ú]″,$spaceaddress[$s])){$space=$space.″″.$open.convert(substr($spaceaddress[$s],0,1),$baselang).$close;print″##″;}elseif(ereg(″[a-zA-Zà-ú]″,$spaceaddress[($s-1)]))$space=$space.″″.$open.convert(substr($spaceaddress[$s],0,1),$baselang).$close;else$space=$space.$open.convert(substr($spaceaddress[$s],0,1),$baselang).$close;$spaceaddress[$s]=substr($spaceaddress[$s],1);$s++;unset($match);}}#endofwordbetween..$url.=$space;unset($temp);$count++;#nextword.if(strstr($word,″@″)){$revid=hebrev($id_t);if(strstr($url,″.″))$url=ereg_replace(″([a-zA-Z0-9/-/_/])@([a-zA-Z0-9/-/_/]*)([/,])″,″\\1.\\[email protected]\\3″,″$url″);else$url=eregreplace(″([a-zA-Z0-9/-/_/])@([a-zA-Z0-9/-/_/]*)″,″\\1.\\[email protected]″,$url);unset($systemsite);}if(strstr($word,″@inhebrew.co.il″)){$revid=hebrev($id_t);$url=ereg.replace(″([à-ú]).([/-/à-ú/-/]*)@$emailend″,″\\1@\\2$revid″,$url);}if($systemsite==″true″!strstr(″$word″,″@″)){if($end)return″http//″.str_replace(″″,″″,$end).″.inhebrew.co.il/index.html?sub=″.substr($end,1);elsereturn″http//″.strreplace(″″,″″,$url).″.inhebrew.co.il}if(ereg(″inhebrew.co.il/([a-zA-Z0-9/-]*)/index.html″,$word)!strstr($word,″inhebrew.co.il/sample/″)){$end=substr($end,1);if(strstr($end,″/″)){returneregi_replace(″[[space]]+″,″″,str_replace(″-″,″-″,str_replace(″@″,″@″,($end))));}}returneregi_replace(″[[space]]+″,″″,str_replace(″-″,″-″,str_replace(″@″,″@″,$url)));}}?上述組合跨語言關聯資料庫和跨語言雙重重疊翻譯技術的使用的實例有其他潛在的應用來提高嘗試從一種狀態到另一種狀態等價轉換信息的現有技術,如技術中熟知的語音識別軟體,及OCR掃描設備的質量。這些技術都可以用本發明的翻譯方法檢驗它們的系統的結果。當翻譯不存在並且因此會產生錯誤時,用戶能夠得到警報並且被詢問或者系統可以被編程在資料庫中對非重疊的翻譯查找接近的替代來產生重疊翻譯。當然,所有給用戶的返回都能夠被轉換回初始的語言。熟悉技術的人應理解,熟練的從業者能夠對上述的裝置和方法作出很多改動而不偏離本發明的精神和範圍。權利要求1.一種轉換內容的方法,其特徵在於,包括下面的步驟接收以第一種狀態表達的內容;將所述以第一種狀態表達的內容解析為至少第一個片段和第二個片段,所述第一個片段有第一個部分,所述第二個片段有第二個部分,所述第一個部分和第二個部分有所述內容的重疊部分;訪問所述以第二種狀態表達的內容的第三個片段,所述第三個片段對應於所述第一個片段和第二個片段中的一個;訪問所述以第二種狀態表達的內容的第四個片段,所述第四個片段對應於所述第一個片段和第二個片段中的另一個並且和所述第三個片段有重疊的部分;基於組合所述第三和第四個片段確定所述以第二種狀態表達的內容;及提供所述以第二種狀態表達的內容。2.一種創建內容轉換資料庫的方法,其特徵在於,所述方法包括下面的步驟提供一對以兩種不同狀態表示相同概念的文檔;及通過解析第一種狀態的片段並比較所述已解析的第一種狀態的片段和已解析的第二種狀態的片段,及通過關聯已解析的第一種狀態的片段和已解析的第二種狀態的片段之間的出現頻數,使用所述一對文檔來創建兩種不同狀態之間的片段關聯的資料庫。3.如權利要求2所述的方法,其特徵在於,所述創建資料庫包括使用所述第一種狀態和所述第二種狀態的片段的範圍的步驟。4.如權利要求2所述的方法,其特徵在於,所述創建內容轉換資料庫的方法包括步驟提供多對以所述第一種和所述第二種狀態表示相同概念的文檔,及通過解析第一種狀態的片段並比較所述已解析的第一種狀態的片段和已解析的第二種狀態的片段,及通過關聯已解析的第一種狀態的片段和已解析的第二種狀態的片段之間的出現頻數,使用所述多對文檔來創建兩種不同狀態之間的片段關聯的資料庫。5.如權利要求2所述的方法,其特徵在於,所述創建內容轉換資料庫的方法包括步驟提供多對以多種狀態表示相同概念的文檔,及通過解析至少一種狀態的片段並比較所述已解析的片段和已解析的至少另一種狀態的片段,及通過關聯已解析的多種狀態的片段之間的出現頻數,使用所述多對文檔來創建多種不同狀態之間的片段關聯的資料庫。6.一種創建資料庫的方法,其特徵在於,包括下面的步驟提供一對或多對以兩種或多種狀態表示相同概念的文檔;選擇第一種狀態的所選片段的至少第一個和第二個出現,所選的片段在第一種狀態的文檔多次出現;在第二種狀態的文檔中選擇至少第一個範圍和第二個範圍,所述第一個和第二個範圍大致對應於第一種狀態的第一個和第二個所選的片段的出現;比較第一個範圍和第二個範圍的片段並定位兩個範圍共同的片段;在所述資料庫中存儲已定位的共同片段;及在所述資料庫中關聯已定位的共同片段和所選的片段,並根據出現頻數排序。7.如權利要求6所述的方法,其特徵在於,所述概念以文本的形式出現。8.如權利要求6所述的方法,其特徵在於,所述狀態以語言的形式出現。9.如權利要求6所述的方法,其特徵在於,所述片段以一個單詞或多個單詞的形式出現。10.一種從第一種狀態到第二種狀態翻譯概念內容的方法,其特徵在於,包括步驟使用所述第一種狀態和所述第二種狀態的內容之間的片段關聯的資料庫來轉換第一種狀態的文檔的內容為第二種狀態的文檔,所述轉換包括檢查所述第一種狀態的內容的片段和所述第二種狀態的內容的片段,並且從所述已檢查的第一種狀態的內容和所述已檢查的第二種狀態的內容中去除相似的片段,並且在去除相似的片段之後關聯所述第一種狀態的內容和所述第二種狀態的內容。11.一種轉換文檔的方法,其特徵在於,所述方法包括步驟提供包含和第二種狀態的數據片段關聯的第一種狀態的數據片段的內容;選擇被翻譯的文檔的、開始於文檔的第一個片段並且存在於資料庫中的最長的分隔開的部分;從資料庫檢索和已定位的第一種狀態的第一個片段關聯的第二種狀態的片段;選擇和先前分隔開的第一種狀態的片段有一個或多個重疊部分的至少第二個分隔開的第一種狀態的部分;從資料庫檢索和已定位的第一種狀態的第二個片段關聯的第二種狀態的片段;作為第一種狀態的單個數據片段返回第一種狀態的有重疊內容的兩個數據片段;如果第二種狀態的兩個數據片段有重疊內容,返回第二種狀態的單個數據片段;及關聯所述第一種狀態的所述單個數據片段和所述第二種狀態的所述單個數據片段,從而返回所述單個數據片段從所述第一種狀態到所述第二種狀態的轉換。12.如權利要求11所述的方法,其特徵在於,包括附加步驟重複選擇被翻譯的文檔的、存在於資料庫中並且開始於文檔的最後一個已檢查的重疊的片段的最長的分隔的部分。13.如權利要求11所述的方法,其特徵在於,所述狀態以語言的形式出現。14.如權利要求11所述的方法,其特徵在於,所述片段以一個單詞或多個單詞的形式出現。15.如權利要求12所述的方法,其特徵在於,所述狀態以語言的形式出現。16.如權利要求12所述的方法,其特徵在於,所述片段以一個單詞或多個單詞的形式出現。17.一種轉換文檔的方法,其特徵在於,所述方法包括步驟(a)提供包含和第二種狀態的數據片段關聯的第一種狀態的數據片段的內容;(b)選擇被翻譯的文檔的、開始於文檔的第一個單詞並且存在於資料庫中的最長的分隔開的片段;(c)從資料庫檢索和已定位的第一種語言片段關聯的第二種語言的數據片段;(d)選擇和先前分隔開的第一種語言的片段有一個或多個重疊單詞的至少第二個分隔開的第一種語言的片段;(e)從資料庫檢索和已定位的第一種語言的數據片段關聯的第二種語言的數據片段;(f)如果兩個數據片段有重疊的一個單詞或多個單詞,組合第二種語言的兩個片段來構成翻譯,並且如果兩個數據片段沒有重疊的一個單詞或多個單詞,重複步驟(e)和(f)直到用重疊的一個單詞或多個單詞定位了數據片段。18.如權利要求17所述的方法,其特徵在於,進一步包括重複步驟(d)-(f)直到文檔被完全地轉換為第二種狀態。19.一種轉換內容的計算機系統,其特徵在於,所述系統包括接收以第一種狀態表達的內容並且解析所述以第一種狀態表達的內容為至少第一個片段和第二個片段,所述第一個片段有第一個部分,所述第二個片段有第二個部分,所述第一個部分和第二個部分有所述內容的重疊部分的計算設備;所述計算設備訪問所述以第二種狀態表達的內容的第三個和第四個片段,所述第三個片段對應於所述第一個片段和第二個片段中的一個,所述第四個片段對應於所述第一個片段和第二個片段中的另一個並且和所述第三個片段有重疊的部分;及所述計算設備基於有重疊部分的所述第三和第四個片段確定所述以第二種狀態表達的內容並提供所述以第二種狀態表達的內容。20.如權利要求19所述的方法,其特徵在於,進一步包括存儲所述第三個和第四個片段的資料庫系統,所述計算設備從所述資料庫系統訪問所述第三個和第四個片段。全文摘要一種自動地將文檔從一種語言翻譯為另一種語言的方法和裝置。該方法包括比較表示相同或相似概念、各自以第一種和第二種語言寫出的第一組和第二組樣本文檔,並創建關聯互為翻譯的第一種語言的單詞和第二種語言的單詞的資料庫。該方法也可以包括將文檔從第一種語言翻譯為第二種語言。該方法包括解析第一種語言的文檔為單詞或片段,查找對應於所選第一種語言的單詞或片段的第二種語言的單詞或片段,及查找對應於第一種語言的單詞或片段組合的第二種語言的單詞或片段。文檔編號G06F17/27GK1505786SQ01823161公開日2004年6月16日申請日期2001年12月27日優先權日2001年3月16日發明者埃裡·阿博,埃裡阿博申請人:埃裡·阿博,埃裡阿博