新四季網

甲骨拓片字形的計算機輔助復原方法

2023-04-30 05:50:51 3


專利名稱::甲骨拓片字形的計算機輔助復原方法
技術領域:
:本發明涉及一種甲骨文拓片字形的復原方法。
背景技術:
:甲骨文是契刻在較硬的龜甲和獸骨上的文字,因此刻出的筆劃線條瘦勁挺直,兩端尖銳,轉折處往往以兩條直線相接成屈折狀,形成方筆。由於龜甲和獸骨質地本身並非平滑如鏡,又深埋地下經歷了幾千年的歲月滄桑,由於受到腐蝕、發掘損壞和運輸的汙損,導致甲骨上有許多噪聲點,字形的邊緣已經非常模糊,已經失去了原始面貌,如圖1、圖2、圖3所示,圖4是甲骨拓片圖像的輪廓圖。這樣受汙損的字形無法在建設甲骨文字庫以及數字圖書館中進一步使用,而且由於字形受到腐蝕汙染,字形邊緣已經變得非常模糊,對於甲骨文字形的識讀和研究帶來極大不便,因而非常需要對甲骨拓片上的字形進行復原。以往在甲骨拓片字形圖像的處理過程中,通常是利用圖像處理軟體進行手工修復。但是,目前的圖像處理軟體並不是針對甲骨拓片字形進行設計的,沒有分析甲骨拓片噪聲區域和字形邊緣的特徵,對於像龜甲和獸骨這種書寫材料比較特殊、汙染原因多樣化以及埋藏時間漫長的甲骨字形缺乏針對性,其修復過程完全依靠非常繁重的手工交互勞動,而且需要具有豐富經驗的專業人員操作,非常耗時耗力。
發明內容為了克服利用圖像處理軟體修複方法的耗時耗力的缺陷,本發明提供一種甲骨拓片字形的計算機輔助復原方法,該計算機輔助復原方法,省時省力,方便快捷,復原效果好。本發明的技術方案是包括以下步驟(1)利用數字掃描儀,將紙稿上的甲骨拓片字形掃描下來,存儲進電腦中;(2)對掃描得到的圖像大小進行調整,對圖像進行二值化處理;(3)通過計算甲骨拓片上各連通區域的面積以及具有相同面積的連通區域的數量,獲得甲骨拓片上連通區域的分布特徵,這些連通區域的面積服從泊松分布;計算連通區域面積的數學期望,對區域面積進行識別處理。根據連通區域面積與面積期望的差值判定噪聲區域和字形筆劃區域,將面積小於期望的區域判定為噪聲區域,並被填充,從而去除噪聲區域,保留字形區域。(4)計算甲骨拓片字形輪廓的特徵點,通過特徵點計算字形筆段的端點,通過筆段的端點,區分不同的筆段。特徵點的提取如下所示θ=arccos(V1『V2/|Vj|V2|)θ≤π上式中,θ為字形輪廓上每一點?1與相鄰點Ρη、Ρμ形成的向量義、%之間的夾角。考慮到用戶的不同需求,我們設計了交互功能,讓用戶可以自行設置不同的角度閾值Μ,當兩向量的夾角θ<M時,系統就認SPi是特徵點。筆段端點的提取方法與特徵點的提取方法類似。如下所示上式中,α為字形輪廓上每一特徵點Fi與相鄰特徵點Fm、Fi+1形成的向量N」V2之間的夾角。可以設置不同的角度閾值T,當偏移角度αPi+1(xi+1,yi+1)^Pi-:(Xi-i;Y^1)>Pi-2(x^,Y^2)是Pi(XiJi)相鄰的四個特徵點,界^+^^^界^分別是特徵點?^?^?^?^汴^的坐標權值,P'^x'y'0是特徵點PiUi,Yi)經過加權變換後的坐標點。(6)計算甲骨拓片字形各筆段的分形維數。如果分形維數小於設定的閾值,則程序輸出圖像,否則繼續對字形邊緣進行壓縮變換,直到字形邊緣的分形維數符合設定的閾值要求。本發明的優點省時省力,方便快捷,復原效果好。(1)具備圖像處理去噪功能。甲骨拓片上的噪聲區域是由於受到腐蝕以及發掘過程中的汙損引起的,通過分析甲骨拓片上各連通區域面積的統計分布特徵,利用泊松分布的統計特徵計算連通區域面積的數學期望,通過計算期望與區域面積的差值判定噪聲區域和字形筆劃區域。將小於面積期望的連通區域判定為噪聲區域,進行填充,從而去除噪聲。將大於面積期望的連通區域判定為字形筆劃區域,予以保留。反覆進行上述操作,直到甲骨拓片連通區域面積的數學期望大於設定的閾值為止。通過上述操作,噪聲區域被去除,保留了字形筆劃區域。(2)可以實現對甲骨拓片字形邊緣的自動平滑處理。甲骨文字形的筆劃多種多樣,同樣的筆劃又具有很多種不同的書寫形式,需要針對不同的筆段分別進行壓縮變換處理,從而得到接近甲骨文字形真實形態的字形。通過對各個筆段進行壓縮變換,就可以對甲骨拓片字形的邊緣進行平滑。對筆段進行壓縮變換,首先要找到筆段的位置。字形輪廓邊緣彎曲角度比較劇烈的地方,我們稱之為特徵點,通過輪廓的特徵點計算筆段的端點,從而找到筆段的位置。因此,只要能夠提取出甲骨文字形輪廓上的端點,就能夠找到筆段的位置。通過計算找出甲骨拓片字形的特徵點,然後利用特徵點找到甲骨拓片字形筆段的端點,通過字形筆劃的端點,區分不同的筆段,實現對各筆段的平滑處理。通過對各筆段的平滑處理,從而獲得邊緣得到平滑的甲骨拓片字形。(3)通過計算分形維數,可以設定字形邊緣平滑程度。龜甲和獸骨上的甲骨文字形由於受到腐蝕,字形邊緣出現鋸齒形狀,呈現分形特徵。在對字形的不同筆段進行平滑處理的過程中,可以預先設定筆段分形維數的閾值,從而設定對字形邊緣進行平滑的程度。通過本發明處理後,原來甲骨拓片上的噪聲區域被去除,甲骨文字形的筆劃邊緣被平滑,不再有鋸齒形狀,得到的甲骨文字形接近原始面貌,從而方便甲骨文研究學者對甲骨文字形的辨識和研究,極大地改進甲骨學研究手段,促進甲骨學的發展,也有利於甲骨文字庫的建設以及在數字圖書館中的使用,使甲骨文能夠藉助數字網絡為大眾所共享。圖1是《甲骨文合集》(中華書局,1979-1983年)559(正面)。圖2是圖1之局部放大。圖3是圖2經過二值化處理的圖像。圖4是圖3的輪廓圖。圖5是圖4中連通區域面積分布特徵圖。圖6是圖4中連通區域概率密度。圖7是甲骨拓片字形計算機輔助復原系統的界面圖。圖8是圖3去除噪聲點的圖像。圖9是圖8中字形右上角邊緣的分形特徵示意圖。圖10是字形邊緣平滑示意圖。圖11是圖8中字形邊緣經過平滑的字形圖像。具體實施例方式本發明提出的對甲骨拓片上的字形進行計算機輔助復原方法包括以下步驟(1)電腦與數字掃描儀連接,通過數字掃描儀將紙稿上的甲骨拓片圖片掃描進電腦,通過圖像處理軟體將甲骨拓片字形分割出來,並對甲骨拓片字形圖像的高度進行調整,將圖像處理為高度為512像素的二值圖像。(2)甲骨拓片字形的計算機輔助復原系統界面如圖7所示,利用其去噪功能,將拓片圖像中的噪聲點去除。採用基於泊松分布的區域填充的去噪方法,包括以下步驟1)通過計算甲骨拓片上各連通區域的面積以及具有相同面積的連通區域的數量,獲得甲骨拓片上連通區域的概率密度特徵,得到連通區域的面積在統計上的泊松分布特徵。甲骨拓片上的噪聲點具有如下特徵1)噪聲區域的亮度低於字形筆劃的亮度;2)噪聲區域呈離散狀態,連通區域面積較小,區域面積服從泊松分布。以高度512像素、寬度320像素的圖像為例,根據實驗數據,連通區域的面積與連通區域數目的關係如圖5所示。從圖5中可以看出,噪聲區域的面積通常在50個像素以下,字形筆劃區域的面積一般在100個像素以上。通過計算,甲骨拓片連通區域面積分布的概率密度函數可以表示如下p.=p{x=i}=—e~5(/=0,1』2,…)/!甲骨拓片連通區域面積的數學期望大約為5,即高度為512像素、寬度320像素的甲骨拓片字形數字圖像上各連通區域面積的平均值為5個像素。圖6是甲骨拓片連通區域的概率密度圖。連通區域的面積與具有相同面積的連通區域的數量之間關係的計算方法,可以用C語言描述如下structREGION//定義連通區域的數據結構{longarea;//連通區域的面積longquantity;//具有相同面積的連通區域的數量}voidArea_Quantity(intContourNumber){inti,j;//循環變量REGIONregion[ContourNumber];memset(region,0,ContourNumber);//將內存region初始化為0for(i=0;i<ContourNumber;i++){region[i].area=RegionArea[i];region[i].quantity=region[i].quantity+1;for(j=0;j<ContourNumberMj!=i;j++){if(region[j].area==region[i].area{region[i].quantity=region[i].quantity+1;}}}}上述算法中,先定義連通區域的數據結構REGION,數組region[ContourNumber]用於保存每一個連通區域的面積以及具有相同面積的連通區域的數量,RegionArea[i]表示計算序號為i的連通區域的面積,ContourNumber表示甲骨拓片上連通區域的數目。甲骨拓片上連通區域的概率密度的計算方法,可以用C語言描述如下voidProbability(intContourNumber){floatprob[ContourNumber];//具有相同面積的連通區域在連通區域總數中的概率for(i=1;i<ContourNumber;i++){prob[i]=region[i].quantity/ContourNumber;}}上述算法中,ContourNumber表示甲骨拓片上連通區域的數目。數組prob[ContourNumber]用於保每一個連通區域在連通區域總數中的概率。2)根據連通區域面積與面積期望的差值判定噪聲區域和字形筆劃區域。小於面積期望的連通區域被判定為噪聲區域,並被填充。以高度512像素、寬度320像素的圖像為例,根據甲骨拓片上連通區域面積的分布特徵,基於泊松分布的甲骨拓片圖像區域填充算法如下voidRegion_Fill(intContourNumber){intsum=O;//用於保存已填充區域的數目do{for(i=O;i<ContourNumber;i++){if(RegionArea[i]-AreaExpect(ContourNumber)^0)Fill(Region[i]);//對序號為i的連通區域進行填充sum=sum+1;}ContourNumber=ContourNumber-sum;RegionArea=AreaExpect(ContourNumber);}while(RegionArea<50)}上述算法中,RegionArea[i]表示序號為i的連通區域的面積,Region[i]表示序號為i的連通區域,Fill(Region[i])表示對序號為i的連通區域進行填充。ContourNumber表示甲骨拓片上連通區域的數目,AreaExpect(ContourNumber)表示對ContourNumber個連通區域的面積計算數學期望。當甲骨拓片圖像中所有連通區域面積的數學期望大於50個像素時,退出循環,輸出圖像。3)重複進行以上步驟,直到連通區域面積的數學期望大於50個像素為止。圖8為去除噪聲區域後的字形圖像。(3)使用三次Bezier曲線擬合經過去噪處理的甲骨拓片二值圖像的邊緣輪廓。方法如下一段η次的Bezier曲線P(U)可由下面的表達式來描述「π、^nUii-Uy1UiVi^d.wr_2]p^=§(n一脾式中ViG=0,1,...,η)為Bezier特徵多邊形的頂點。V。、Vn是曲線端點,其它頂點稱為控制點。Bmi(U)(i=0,1,...,η)稱為Bernstein多項式。給定四個頂點%、V1.V2和V3,可定義一段三次曲線P(U)P(U)=(1-U)X+3(1-U)2uV!+3(1_u)u2V2+u3V3,ue(4)利用甲骨拓片字形的計算機輔助復原系統的壓縮變換功能,對甲骨拓片上字形輪廓進行壓縮變換,平滑甲骨拓片圖像上字形邊緣。包括以下步驟1)採用計盒維數的方法計算甲骨拓片字形各筆段的分形維數。如果分形維數小於設定的閾值,則程序輸出圖像並停止執行,否則執行步驟2)。甲骨拓片字形的筆劃一般是單連通區域,個別筆段會出現斷裂。甲骨拓片字形筆劃的像素亮度較高,而且比較連續,且在某個像素值區域比較集中。龜甲和獸骨在地下深埋上千年,由於受到腐蝕,字形邊緣呈現出凹凸不平連綿起伏的鋸齒形狀。甲骨字形圖像的鋸齒形狀邊緣部分與整體具有相似性,具備分形特徵,如圖9所示。採用計盒維數法計算甲骨拓片字形邊緣各筆段的分形維數的方法如下設F是Rn中任一非空有界子集,記N(F,δ)為覆蓋F的邊長為δ的最小立方塊數,則F的計算盒維數由下式定義通過計算,甲骨拓片上字形邊緣筆段的分形維數在1.21.3之間。直線的分形維數是1,一般情況下,甲骨拓片字形邊緣的分形維數的閾值可以設為1.05即可。2)通過識別字形的端點來判定不同的筆段。甲骨拓片字形的筆劃多種多樣,同樣的筆劃又具有很多種不同的書寫形式,需要針對不同的筆段分別進行壓縮變換處理,從而得到接近甲骨文字形真實形態的字形。通過對各個筆段進行壓縮變換,就可以對甲骨拓片字形的邊緣進行平滑。對筆段進行壓縮變換,首先要找到筆段的位置。字形輪廓邊緣彎曲角度比較劇烈的地方,我們稱之為特徵點,通過輪廓的特徵點計算筆段的端點,從而找到筆段的位置。因此,只要能夠提取出甲骨文字形輪廓上的端點,就能夠找到筆段的位置。特徵點的提取如下所示上式中,θ為字形輪廓上每一點Pi與相鄰點Ρη、Ρμ形成的向量義、%之間的夾角。考慮到用戶的不同需求,我們設計了交互功能,讓用戶可以自行設置不同的角度閾值Μ,當兩向量的夾角θ<M時,系統就認SPi是特徵點。筆段端點的提取方法與特徵點的提取方法類似。如下所示上式中,α為字形輪廓上每一特徵點Fi與相鄰特徵點Fm、Fi+1形成的向量N」V2之間的夾角。可以設置不同的角度閾值T,當偏移角度α<T時,系統就認為Fi是筆段的端點。3)對甲骨拓片字形的不同筆段分別進行壓縮變換處理。在平面歐氏空間中,伸縮變換可以表示為上式中,r為伸縮比,r小於1時為壓縮變換。以筆段的首尾兩個端點的連線建立X軸,過其中一端點垂直於端點連線建立Y軸,建立平面直角坐標系。在對字形輪廓上的特徵點進行壓縮變換操作時,為了既對字形邊緣進行平滑,同時又保持甲骨拓片字形筆劃的基本走向和基本形狀,對特徵點的坐標與其相鄰特徵點的坐標進行加權處理,可以用矩陣表示如下字形輪廓邊緣平滑操作如圖12所示。Pi+2(xi+2,yi+2)、Pi+1(xi+1,yi+1)(χ^,γ^)、Ρ-2(Χ-2'Υ-2)是Pi(Xi,Yi)相鄰的四個特徵點,wi+2、Wi^n1、Wi_2分別是特徵點Pi+2、Pi+1、Ρ、ΡΗ、Ρ-2的坐標權值,P'i(x'i,y'D是特徵APi(Xi,Yi)經過加權變換後的坐標點。圖12中短劃線是經過坐標加權處理壓縮變換後的圖形。從圖ο可以看出,經過加權處理後,字形邊緣變得平滑,同時又保持了甲骨拓片字形筆劃的基本走向和基本形狀。圖Ii是經過變換處理後得到平滑的字形。4)執行步驟1)。權利要求一種甲骨拓片字形的計算機輔助復原方法,其特徵在於該方法包括以下步驟(1)利用數字掃描儀,將紙稿上的甲骨拓片字形掃描下來,存儲進電腦中;(2)對掃描得到的圖像大小進行調整,對圖像進行二值化處理;(3)通過計算甲骨拓片上各連通區域的面積以及具有相同面積的連通區域的數量,獲得甲骨拓片上連通區域的分布特徵,這些連通區域的面積服從泊松分布,計算連通區域面積的數學期望,對連通區域的面積進行識別處理,根據連通區域面積與面積期望的差值判定噪聲區域和字形筆劃區域,將面積小於期望的區域判定為噪聲區域,並被填充,從而去除噪聲區域,保留字形區域;(4)計算甲骨拓片字形輪廓的特徵點,通過特徵點計算字形筆段的端點,通過筆段的端點,區分不同的筆段,特徵點的提取如下所示θ=arccos(V1·V2/|V1||V2|)θ≤π設置角度閾值M,當兩向量的夾角θ<M時,系統就認為Pi是特徵點,筆段端點的提取如下所示α=arccos(V1·V2/|V1||V2)α≤π設置角度閾值T,當偏移角度α<T時,系統就認為Fi是筆段的端點;(5)對甲骨拓片字形的各筆段進行壓縮變換,以筆段的首尾兩個端點的連線建立X軸,過其中一端點垂直於端點連線建立Y軸,建立平面直角坐標系,對特徵點的坐標與其相鄰特徵點的坐標進行加權處理,用矩陣表示如下yi=yi+2yi+1yiyi-1yi-2wi+2wi+1wiwi-1wi-2,i2,Pi+2(xi+2,yi+2)、Pi+1(xi+1,yi+1)、Pi-1(xi-1,yi-1)、Pi-2(xi-2,yi-2)是Pi(xi,yi)相鄰的四個特徵點,wi+2、wi+1、wi、wi-1、wi-2分別是特徵點Pi+2、Pi+1、Pi、Pi-1、Pi-2的坐標權值,P′i(x′i,y′i)是特徵點Pi(xi,yi)經過加權變換後的坐標點;(6)計算甲骨拓片字形各筆段的分形維數,如果分形維數小於設定的閾值,則程序輸出圖像,否則繼續對字形邊緣進行壓縮變換,直到字形邊緣的分形維數符合設定的閾值要求。全文摘要本發明公開了一種甲骨拓片字形的計算機輔助復原方法,該方法包括將紙稿上的甲骨拓片字形掃描下來,存進電腦;對掃描的圖像大小進行調整,進行二值化處理;通過計算甲骨拓片上各連通區域的面積以及具有相同面積的連通區域的數量,獲得甲骨拓片上連通區域的分布特徵,計算連通區域面積的數學期望,對區域面積進行識別處理,計算甲骨拓片字形輪廓的特徵點,通過特徵點計算字形筆段的端點,通過筆段的端點,區分不同的筆段;對甲骨拓片字形的各筆段進行壓縮變換;計算甲骨拓片字形各筆段的分形維數。省時省力,方便快捷,復原效果好。適用於甲骨文拓片字形的復原。文檔編號G06T7/00GK101872478SQ20101019263公開日2010年10月27日申請日期2010年5月31日優先權日2010年5月31日發明者楊亦鳴,酆格斐,顧紹通申請人:徐州師範大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀