一種漢字書寫形態美觀度的計算機評估方法
2023-04-23 10:30:11 1
專利名稱:一種漢字書寫形態美觀度的計算機評估方法
技術領域:
本發明涉及計算機藝術與美學以及人工智慧領域,尤其涉及一種漢字美觀 度的計算機評估方法。
背景技術:
已經有大量的工作來模擬人類的藝術思維,並進一步建立計算機智能系統
以解決真實世界裡的問題。在中文字方面,1995年的Proceedings of the International Conference on Computer Processing of Oriental Languages (ICCPOL) 會議論文集(文章標題"Chinese glyph generation using character composition and beauty evaluation metrics")公布了一個使用啟發式的方法來嘗試定量評估中文字 體美感的問題他們定義了在漢字寫作裡的四條規則,並實現到了他們基於規 則的美學評分模塊中;這一模塊簡單地對四條規則逐一計算相應的分數,並得 到他們的加權和。2005年的IEEE Intelligent Systems雜誌(文章標題"Automatic generation of artistic Chinese calligraphy",以下簡稱文獻IS2005)刊登了 一個中 國藝術書法的自動生成系統。但是,他們的工作主要關注在使用基於約束的推 理來生成格式化的中文字體,而幾乎沒有關注到這些生成結果如何具有美感。
為了獲得更好的計算機中文字體生成結果,也為了嘗試對美學做定量計算, 我們通過學習基本數值關係背後的訓練集從而實現了漢字美觀度評分。許多在 工作中使用過專家系統的人知道,高級的專家規則並不總能正常工作;而有時 這並不一定是由於專家系統本身的知識盲點,或者問題根本無法總結。因此我 們覺得,我們基於學習技術的數據驅動方法可以提供一種比人類專家的大腦評 測更好的機器評價能力。
在繪畫方面,計算機圖形學領域中同樣有一些研究自動繪畫創作的工作, 但這大都是在給定一幅照片的基礎上完成的。其他也有人探索了結合人工智慧 和人機互動技術來創作繪畫風格的動畫,如2006年ACM學報ACM Trans. Graph 幹'J登的文章"Animating Chinese paintings through stroke-based decomposition,,用筆 劃分解的方法來實現動態的繪畫。在視覺藝術領域之外,計算機音樂是另一個 應用人工智慧技術來進行或協助創作的成功方向。在2007年的國際人工智慧聯 合大會(IJCAI2007)上,有一個獨立的專題叫音樂人工智慧(MUSIC-AI2007) 來專門研討這一話題。值得注意的是,對於計算機音樂的研究包括自動音樂創 作與音樂評價,這與我們在中文字體上的思路比較相似。此外還有其他大量的研究工作如故事創作,可信執法官,互動式故事,等等,都旨在捕捉美學的
可計算性。
發明內容
本發明的目的是提供一種漢字美觀度的計算機評估方法,用一個基於機器 學習算法的機制,首先對一部分由人類評委給定美觀度評分的漢字樣本字體進 行學習,分析出每個字體的參數化信息,然後使用圖像處理和人工智慧的方法 來獲得字體形態與其美觀度之間的潛在關係,進而可以對漢字字體的美觀度做 評分。
漢字美觀度的計算機評估方法包括如下步驟
1) 通過多人調査的方式為500 2000個漢字單筆劃的筆劃樣本評分,並使用 人工神經網絡、決策樹、模糊邏輯或支持向量機來訓練並獲得字體單筆劃形態 與其美觀度評價結果間的映射關係,然後使用訓練後的學習器對字體單筆劃美 觀度進行評分;
2) 通過多人調査的方式為500 2000個漢字樣本的內部結構評分,並使用人 工神經網絡、決策樹、模糊邏輯或支持向量機來訓練並獲得字體內部結構特徵 與其美觀度評價結果間的映射關係,然後使用訓練後的學習器對字體內部結構 進行評分,其中,字體內部結構包括字體各內部筆劃或偏旁部首元素間的拓撲 關係、相對位置關係、面積遮蓋關係,以及筆劃與筆劃、筆劃與偏旁部首之間 的空間位置關係與該字的標準字體的差異,實現對字體內的各部分空間結構分 布的美觀度評分;
3) 通過多人調查的方式為100 300個漢字樣本的風格一致性評分,並使用 人工神經網絡、決策樹、模糊邏輯或支持向量機來訓練並獲得字體風格一致性 特徵與其美觀度評價結果間的映射關係,使用訓練後的學習器對字體風格一致 性進行評分;對字體各個內部筆劃或偏旁部首元素計算出與該字多種已知風格 字體的相似度,並以此確定該字體的風格一致性評分;
4) 根據對漢字進行的單筆劃美觀度評分、內部結構美觀度評分、風格一致性 評分,應用統計學習方法綜合各項得分,獲得該字體的總體美觀度評分。
所述的一種漢字美觀度的計算機評估方法,其特徵在於所述的通過多人調 査的方式為500 2000個漢字單筆劃的筆劃樣本評分,並使用人工神經網絡、 決策樹、模糊邏輯或支持向量機來訓練並獲得字體單筆劃形態與其美觀度評價 結果間的映射關係,然後使用訓練後的學習器對字體單筆劃美觀度進行評分方 法包括如下步驟a) 事先通過多人調査方式,讓六人各自對來自100個漢字的單筆劃圖像做評 分,評分結果為"好"、"一般"、"差"三種其中之一;綜合所有人的評分結果,計 算該筆劃的分數概率,即分別統計將筆劃評分為"好"、"一般"、"差"的人數, 除以總人數,所得三個百分數分別為該筆劃美觀度為"好"、"一般"、"差"的概率, 獲得500 2000個單筆劃的美觀度的人工評價結果;b) 將步驟a)中所述各筆劃的楷書體圖像作為該筆劃的標準筆劃;將這些單筆 劃圖像參數化,即提取出它們的輪廓、軌跡、位置信號,轉換成向量的形式, 對這些向量進行預處理,去除噪音,並進一步抽取特徵向量,對獲得的特徵向 量,與該筆劃的標準筆劃的特徵向量作向量減法,從而得到單筆劃的形態差異口 c)使用人工神經網絡、決策樹、模糊邏輯或支持向量機來訓練並獲得單筆劃 的形態差異向量中的信號差異與美觀度評價結果間的函數映射關係;即以形態 差異向量與美觀度評價結果分別作為人工神經網絡、決策樹、模糊邏輯或支持 向量機的輸入和輸出;應用步驟a)中的人工評價結果,對人工神經網絡或決策 樹或模糊邏輯或支持向量機施行帶有反饋的機器學習過程;d) 使用訓練後的人工神經網絡、決策樹、模糊邏輯或支持向量機對單筆划進 行評分即對任意給定的單筆劃圖像,應用步驟b)得到該筆劃與其標準筆劃間 的形態差異向量,以該向量作為訓練後的人工神經網絡或決策樹或模糊邏輯或 支持向量機的輸入,獲取此時的輸出,即為該漢字筆劃的美觀度得分。所述的一種漢字美觀度的計算機評估方法,其特徵在於所述的通過多人調 查的方式為500 2000個漢字樣本的內部結構評分,並使用人工神經網絡、決 策樹、模糊邏輯或支持向量機來訓練並獲得字體內部結構特徵與其美觀度評價 結果間的映射關係,然後使用訓練後的學習器對字體內部結構進行評分,其中, 字體內部結構包括字體各內部筆劃或偏旁部首元素間的拓撲關係、相對位置關 系、面積遮蓋關係,以及筆劃與筆劃、筆劃與偏旁部首之間的空間位置關係與 該字的標準字體的差異,實現對字體內的各部分空間結構分布的美觀度評分方 法,包括以下步驟e) 事先通過多人調査方式,事先通過多人調查方式,讓六人分別對漢字圖像 做評分,評分結果為"好"、"一般"、"差"三種其中之一;綜合所有人的評分結果, 計算該字體的分數概率,即分別統計將字體評分為"好"、"一般"、"差"的人數, 除以總人數,所得百分數分別為該字體分數為"好"、"一般"、"差"的概率;通過 這樣的方式獲得500 2000個字體空間結構美觀度的人工評價結果;f) 通過筆劃分解結果將該字體參數化,轉換成向量的形式;這些向量層次化 的表達了字體的輪廓、軌跡與相對位置信息;g) 將步驟e)中所述各字體的楷書體圖像作為該字體的標準字體;提取出這些 字體所對應向量中,各筆劃或偏旁部首間的拓撲、幾何關係的信號,與其標準 字體的拓撲、幾何關係的信號做比較,獲得其信號差異,即做向量減法;h) 使用人工神經網絡、決策樹、模糊邏輯或支持向量機來訓練並獲得向量信 號差異與美觀度評價結果間的映射關係;應用步驟e)中人工標定的評價結果, 對人工神經網絡、決策樹、模糊邏輯或支持向量機施行帶有反饋的迭代學習過 程。i) 使用訓練後的人工神經網絡、決策樹、模糊邏輯或支持向量機對字體空間 結構美觀度進行評分。即對任意給定的字體圖像,應用步驟f)-步驟g)得到該字 體內部結構與該字的標準字體間的信號差異,以該差異向量作為訓練後的人工 神經網絡或決策樹或模糊邏輯或支持向量機的輸入,獲取此時的輸出,即為該 字體的內部結構美觀度得分。所述的一種漢字美觀度的計算機評估方法,其特徵在於所述的通過多人調 查的方式為100 300個漢字樣本的風格一致性評分,並使用人工神經網絡、決 策樹、模糊邏輯或支持向量機來訓練並獲得字體風格一致性特徵與其美觀度評 價結果間的映射關係,使用訓練後的學習器對字體風格一致性進行評分;對字 體各個內部筆劃或偏旁部首元素計算出與該字多種已知風格字體的相似度,並 以此確定該字體的風格一致性評分的方法包括如下步驟j)事先通過多人調査方式,讓多個人分別對多個漢字圖像的風格一致性做評 分,評分結果為"好"、"一般"、"差"三種其中之一;綜合所有人的評分結果,計 算該字體的分數概率,艮卩分別統計將該字評分為"好"、"一般"、"差"的人數, 分別將其除以總人數,所得百分數分別為該該字分數為"好"、"一般"、"差"的概 率;通過這樣的方式獲得100 300個漢字字體風格一致性的人工評價結果;k)準備好這些漢字對應的楷書體、行書體及隸書體中的書寫形態樣本,或更 多其他字體,作為已知字體;l)通過筆劃分解結果將以上字體參數化,轉換成向量的形式;這些向量層次 化的表達了字體的輪廓、軌跡與相對位置信息;m)對各字體的每個部分,計算出該部分與其各種已知字體該部分的相似程 度;單筆劃Ai與己知字體Bj的相似度Sij的計算方法可以任選以下兩種之一(l)以已知字體Bj作為單筆劃Ai的標準筆劃,使用單筆劃美觀度評分方法計算出該筆劃美觀度的三個概率值P1, P2, P3,分別表示該筆劃美觀度為"好"、 "一般"、"差"的概率;在本實施例中,Sij=Plx50%+P2x50%;(2沐出筆劃Ai的範圍矩形,即能包含該筆劃所有部分的矩形中的最小矩形, 並通過不斷平移和繞範圍矩形中心旋轉Ai,使Ai的字跡與其字體Bj相應筆劃 的字跡的重合面積最大;設Ai的字跡面積為Cl,其字體Bj相應筆劃的字跡的 面積為C2,貝USij叫CinC2i/IClUC21,及相似程度為C1、 C2交集面積與C1、 C2併集面積的比值;n)將字體每個部分與每種已知字體的相似程度聚合可得到一個矩陣,作為該 字體的風格一致性特徵;o)使用人工神經網絡、決策樹、模糊邏輯或支持向量機來訓練並獲得該矩陣 與美觀度評價結果間的映射關係;應用人工標定的評價結果,對人工神經網絡、 決策樹、模糊邏輯或支持向量機施行帶有反饋的迭代學習過程;p)使用訓練後的人工神經網絡、決策樹、模糊邏輯或支持向量機對字體風格 一致性進行評分。即對任意給定的字體圖像,應用步驟k)-步驟n)得到該字體 與各已知字體間的相似度,以該矩陣作為訓練後的人工神經網絡或決策樹或模 糊邏輯或支持向量機的輸入,獲取此時的輸出,即為該字體的風格一致性得分。所述的一種漢字美觀度的計算機評估方法,其特徵在於所述的根據對漢字 進行的單筆劃美觀度評分、內部結構美觀度評分、風格一致性評分,應用統計 學習方法綜合各項得分,獲得該字體的總體美觀度評分的方法包括如下步驟q)利用上述三個方法,使用訓練後的人工神經網絡、決策樹、模糊邏輯或支 持向量機自動獲得100 300個漢字的各單筆劃美觀度得分、內部結構美觀度得 分和字體風格一致性得分;r)通過多人調查方式,讓多個人分別對步驟q)中所述漢字圖像做美觀度總體 評分,評分結果為"好"、"一般"、"差"三種其中之一;綜合所有人的評分結果, 計算該字體的分數概率,即分別統計將字體評分為"好"、"一般"、"差"的人數, 分別將其除以總人數,所得百分數分別為該字體分數為"好"、"一般"、"差"的概 率;s)使用人工神經網絡、決策樹、模糊邏輯或支持向量機來訓練並獲得步驟 q)中的得分與步驟r)中的美觀度總體評分間的映射關係;應用人工標定的評價結 果,對人工神經網絡、決策樹、模糊邏輯或支持向量機施行帶有反饋的迭代學 習過程;t)使用訓練後的人工神經網絡、決策樹、模糊邏輯或支持向量機對字體的總體美觀度進行評分,即對任意給定的漢字字體圖像,應用步驟q)的方法得到該 字體的單筆劃美觀度得分、內部結構美觀度得分和字體風格一致性得分,並以 這些得分作為訓練後的人工神經網絡或決策樹或模糊邏輯或支持向量機的輸 入,獲取此時的輸出,即為該字體的總體美觀度得分。 本發明與現有技術相比具有的有益效果(1) 綜合了多種人工智慧與圖像處理技術,使得計算機對漢字的美觀度評價 成為可能;(2) 利用了 一種機器學習的機制,使得計算機對漢字的美觀度評價能力可以 從人類的審美觀學習而來;(3) 在對漢字的筆劃分解中,引入了用戶的交互式輸入,大大提高了形變嚴 重的字體尤其是草書體的筆劃分解效果。
圖1是本發明所述實施例系統的流程圖;圖2是本發明所述美觀度評分算法的各部分評分算法的示意圖;圖3(a)是漢字樣本字體;圖3(b)是圖3(a)中字體的細化結果;圖3(c)是圖3(a)中字體的"幾何圖";圖4是本發明所述筆劃分解及漢字參數化的流程示例圖;圖4(a)為漢字樣本字體;圖4(b)為圖4(a)的"幾何圖";圖4(c)為圖4(a)的對應標準字體,即正楷字體;圖4(d)為圖4(a)在骨架上的筆劃分解結果;圖4(e)為圖4(a)的最終筆劃分解結果;圖5是本發明所述利用用戶交互界面協助筆劃分解及漢字參數化的流程示 例圖;圖5(a)為漢字樣本字體; 圖5(b)為圖5(a)的"幾何圖"; 圖5(c)為圖5(a)的標準字體,即正楷字體;圖5(d)為圖5(a)的自動分解結果,彩色筆劃表示在自動分解成功的筆劃; 圖5(e)為用戶通過交互界面在字體上勾勒的剩餘筆劃草圖; 圖5(f)為根據用戶草圖得到的骨架上的筆劃匹配結果; 圖5(g)為綜合圖5(d)和圖5(f)所示結果後的筆劃骨架;圖5(h)為圖5(a)的最終筆劃分解結果;
圖6為單筆劃評分方法中所用到的筆劃特徵信號;
圖7為漢字書寫形態評分的一個示例,該字的五個單筆劃如圖8(a)-(e)所示; 該字的空間結構分布美觀度評分為(82.5%好、17.1%—般、0.4%差),其風格 一致性評分為(26.8%好、51.1%—般、22.1%差),其總體美觀度評分為(35.2% 好、49.7%—般、15.1%差);
圖8(a)為圖7所示漢字的第1筆劃,其單筆劃美觀度評分為(56.0%好、 44.0%—般、0%差);
圖8(b)為圖7所示漢字的第2筆劃;其單筆劃美觀度評分為(84.7%好、 15.3%—般、0%差);
圖8(c)為圖7所示漢字的第3筆劃;其單筆劃美觀度評分為(34.8%好、 54.6%—般、10.6%差);
圖8(d)為圖7所示漢字的第4筆劃;其單筆劃美觀度評分為(12.7%好、 46.9°/。一般、40.4%差);
圖8(e)為圖7所示漢字的第5筆劃。其單筆劃美觀度評分為(9.2%好、37.5% 一般、63.3%差)。
具體實施例方式
漢字美觀度的計算機評估方法包括如下步驟
1) 通過多人調査的方式為500 2000個漢字單筆劃的筆劃樣本評分,並使用 人工神經網絡、決策樹、模糊邏輯或支持向量機來訓練並獲得字體單筆劃形態 與其美觀度評價結果間的映射關係,然後使用訓練後的學習器對字體單筆劃美 觀度進行評分;
2) 通過多人調查的方式為500 2000個漢字樣本的內部結構評分,並使用人 工神經網絡、決策樹、模糊邏輯或支持向量機來訓練並獲得字體內部結構特徵 與其美觀度評價結果間的映射關係,然後使用訓練後的學習器對字體內部結構 進行評分,其中,字體內部結構包括字體各內部筆劃或偏旁部首元素間的拓撲 關係、相對位置關係、面積遮蓋關係,以及筆劃與筆劃、筆劃與偏旁部首之間 的空間位置關係與該字的標準字體的差異,實現對字體內的各部分空間結構分 布的美觀度評分;
3) 通過多人調查的方式為100 300個漢字樣本的風格一致性評分,並使用 人工神經網絡、決策樹、模糊邏輯或支持向量機來訓練並獲得字體風格一致性 特徵與其美觀度評價結果間的映射關係,使用訓練後的學習器對字體風格一致性進行評分;對字體各個內部筆劃或偏旁部首元素計算出與該字多種已知風格 字體的相似度,並以此確定該字體的風格一致性評分;
4)根據對漢字進行的單筆劃美觀度評分、內部結構美觀度評分、風格一致性 評分,應用統計學習方法綜合各項得分,獲得該字體的總體美觀度評分。
所述的一種漢字美觀度的計算機評估方法,其特徵在於所述的通過多人調 査的方式為500 2000個漢字單筆劃的筆劃樣本評分,並使用人工神經網絡、 決策樹、模糊邏輯或支持向量機來訓練並獲得字體單筆劃形態與其美觀度評價 結果間的映射關係,然後使用訓練後的學習器對字體單筆劃美觀度進行評分方 法包括如下步驟
a) 事先通過多人調査方式,讓六人各自對來自100個漢字的單筆劃圖像做評 分,評分結果為"好"、"一般"、"差"三種其中之一;綜合所有人的評分結果,計 算該筆劃的分數概率,艮卩分別統計將筆劃評分為"好"、"一般"、"差"的人數, 將其除以總人數,所得三個百分數分別為該筆劃美觀度為"好"、"一般"、"差" 的概率,獲得500 2000個單筆劃的美觀度的人工評價結果;
b) 將步驟a)中所述各筆劃的楷書體圖像作為該筆劃的標準筆劃;將這些單筆 劃圖像參數化,即提取出它們的輪廓、軌跡、位置信號,轉換成向量的形式, 對這些向量進行預處理,去除噪音,並進一步抽取特徵向量,對獲得的特徵向 量,與該筆劃的標準筆劃的特徵向量作向量減法,從而得到單筆劃的形態差異 向量;
c) 使用人工神經網絡、決策樹、模糊邏輯或支持向量機來訓練並獲得單筆劃 的形態差異向量中的信號差異與美觀度評價結果間的函數映射關係;即以形態 差異向量與美觀度評價結果分別作為人工神經網絡、決策樹、模糊邏輯或支持 向量機的輸入和輸出;應用步驟a)中的人工評價結果,對人工神經網絡或決策 樹或模糊邏輯或支持向量機施行帶有反饋的機器學習過程;
d) 使用訓練後的人工神經網絡、決策樹、模糊邏輯或支持向量機對單筆划進 行評分即對任意給定的單筆劃圖像,應用步驟b)得到該筆劃與其標準筆劃間 的形態差異向量,以該向量作為訓練後的人工神經網絡或決策樹或模糊邏輯或 支持向量機的輸入,獲取此時的輸出,即為該漢字筆劃的美觀度得分。
所述的一種漢字美觀度的計算機評估方法,其特徵在於所述的通過多人調 査的方式為500 2000個漢字樣本的內部結構評分,並使用人工神經網絡、決 策樹、模糊邏輯或支持向量機來訓練並獲得字體內部結構特徵與其美觀度評價 結果間的映射關係,然後使用訓練後的學習器對字體內部結構進行評分,其中,字體內部結構包括字體各內部筆劃或偏旁部首元素間的拓撲關係、相對位置關 系、面積遮蓋關係,以及筆劃與筆劃、筆劃與偏旁部首之間的空間位置關係與 該字的標準字體的差異,實現對字體內的各部分空間結構分布的美觀度評分方 法,包括以下步驟
e) 事先通過多人調查方式,事先通過多人調査方式,讓六人分別對漢字圖像 做評分,評分結果為"好"、"一般"、"差"三種其中之一;綜合所有人的評分結果, 計算該字體的分數概率,即分別統計將字體評分為"好"、"一般"、"差"的人數, 分別將其除以總人數,所得百分數分別為該字體分數為"好"、"一般"、"差"的概 率;通過這樣的方式獲得500 2000個字體空間結構美觀度的人工評價結果;
f) 通過筆劃分解結果將該字體參數化,轉換成向量的形式;這些向量層次化 的表達了字體的輪廓、軌跡與相對位置信息;
g) 將步驟e)中所述各字體的楷書體圖像作為該字體的標準字體;提取出這些 字體所對應向量中,各筆劃或偏旁部首間的拓撲、幾何關係的信號,與其標準 字體的拓撲、幾何關係的信號做比較,獲得其信號差異,即做向量減法;
h) 使用人工神經網絡、決策樹、模糊邏輯或支持向量機來訓練並獲得向量信 號差異與美觀度評價結果間的映射關係;應用步驟e)中人工標定的評價結果, 對人工神經網絡、決策樹、模糊邏輯或支持向量機施行帶有反饋的迭代學習過 程。
i) 使用訓練後的人工神經網絡、決策樹、模糊邏輯或支持向量機對字體空間 結構美觀度進行評分。即對任意給定的字體圖像,應用步驟0-步驟g)得到該字 體內部結構與該字的標準字體間的信號差異,以該差異向量作為訓練後的人工 神經網絡或決策樹或模糊邏輯或支持向量機的輸入,獲取此時的輸出,即為該 字體的內部結構美觀度得分。
所述的一種漢字美觀度的計算機評估方法,其特徵在於所述的通過多人調 査的方式為100 300個漢字樣本的風格一致性評分,並使用人工神經網絡、決 策樹、模糊邏輯或支持向量機來訓練並獲得字體風格一致性特徵與其美觀度評 價結果間的映射關係,使用訓練後的學習器對字體風格一致性進行評分;對字 體各個內部筆劃或偏旁部首元素計算出與該字多種已知風格字體的相似度,並 以此確定該字體的風格一致性評分的方法包括如下步驟
j)事先通過多人調査方式,讓多個人分別對多個漢字圖像的風格一致性做評 分,評分結果為"好"、"一般"、"差"三種其中之一;綜合所有人的評分結果,計 算該字體的分數概率,即分別統計將該字評分為"好"、"一般"、"差"的人數,分別將其除以總人數,所得百分數分別為該該字分數為"好"、"一般"、"差"的概
率;通過這樣的方式獲得100 300個漢字字體風格一致性的人工評價結果;
k)準備好這些漢字對應的楷書體、行書體及隸書體中的書寫形態樣本,或更
多其他字體,作為己知字體;
l)通過筆劃分解結果將以上字體參數化,轉換成向量的形式;這些向量層次
化的表達了字體的輪廓、軌跡與相對位置信息;
m)對各字體的每個部分,計算出該部分與其各種已知字體該部分的相似程
度;單筆劃Ai與已知字體Bj的相似度Sij的計算方法可以任選以下兩種之一
(1) 以已知字體Bj作為單筆劃Ai的標準筆劃,使用單筆劃美觀度評分方法 計算出該筆劃美觀度的三個概率值P1, P2, P3,分別表示該筆劃美觀度為"好"、 "一般"、"差"的概率;在本實施例中,Sij=Plx50°/。+P2x50%;
(2) 求出筆劃Ai的範圍矩形,即能包含該筆劃所有部分的矩形中的最小矩形, 並通過不斷平移和繞範圍矩形中心旋轉Ai,使Ai的字跡與其字體Bj相應筆劃 的字跡的重合面積最大;設Ai的字跡面積為Cl,其字體Bj相應筆劃的字跡的 面積為C2,貝lJSij叫CinC2l/IClUC2卜及相似程度為C1、 C2交集面積與C1、 C2併集面積的比值;
n)將字體每個部分與每種已知字體的相似程度聚合可得到一個矩陣,作為該
字體的風格一致性特徵;
o)使用人工神經網絡、決策樹、模糊邏輯或支持向量機來訓練並獲得該矩陣 與美觀度評價結果間的映射關係;應用人工標定的評價結果,對人工神經網絡、 決策樹、模糊邏輯或支持向量機施行帶有反饋的迭代學習過程;
p)使用訓練後的人工神經網絡、決策樹、模糊邏輯或支持向量機對字體風格 一致性進行評分。即對任意給定的字體圖像,應用步驟k)-步驟n)得到該字體 與各已知字體間的相似度,以該矩陣作為訓練後的人工神經網絡或決策樹或模 糊邏輯或支持向量機的輸入,獲取此時的輸出,即為該字體的風格一致性得分。
所述的一種漢字美觀度的計算機評估方法,其特徵在於所述的根據對漢字 進行的單筆劃美觀度評分、內部結構美觀度評分、風格一致性評分,應用統計 學習方法綜合各項得分,獲得該字體的總體美觀度評分的方法包括如下步驟
q)利用上述三個方法,使用訓練後的人工神經網絡、決策樹、模糊邏輯或支 持向量機自動獲得100 300個漢字的各單筆劃美觀度得分、內部結構美觀度得 分和字體風格一致性得分;
r)通過多人調査方式,讓多個人分別對步驟q)中所述漢字圖像做美觀度總體評分,評分結果為"好"、"一般"、"差"三種其中之一;綜合所有人的評分結果, 計算該字體的分數概率,即分別統計將字體評分為"好"、"一般"、"差"的人數,
分別將其除以總人數,所得百分數分別為該字體分數為"好"、"一般"、"差"的概
率;
s)使用人工神經網絡、決策樹、模糊邏輯或支持向量機來訓練並獲得步驟 q)中的得分與步驟r)中的美觀度總體評分間的映射關係;應用人工標定的評價結 果,對人工神經網絡、決策樹、模糊邏輯或支持向量機施行帶有反饋的迭代學 習過程;
t)使用訓練後的人工神經網絡、決策樹、模糊邏輯或支持向量機對字體的總 體美觀度進行評分,即對任意給定的漢字字體圖像,應用步驟q)的方法得到該 字體的單筆劃美觀度得分、內部結構美觀度得分和字體風格一致性得分,並以 這些得分作為訓練後的人工神經網絡或決策樹或模糊邏輯或支持向量機的輸 入,獲取此時的輸出,即為該字體的總體美觀度得分。
如圖1所示,本發明所述的實施例系統的流程包括漢字圖像101、筆劃分解 及漢字參數化102、漢字美觀度評分方法103、漢字美觀度評分結果104;其中 漢字美觀度評分方法103的組成包括漢字圖像樣例201、人類評分202、機器學 習過程203;
本發明所述的實施例系統中的漢字美觀度評分方法103包括學習和評分兩 部分學習部分,即使用一個機器學習過程203,對漢字圖像樣例201與人類評 分202之間的潛在關係進行探測,並得到訓練後的學習器;評分部分,即使用 經過機器學習過程203訓練得到的學習器,對漢字圖像101計算其美觀度得分, 得到漢字美觀度評分結果104。
漢字圖像101:漢字圖像是指包含漢字字體的數字圖像;在本實施例中,所有的 字體圖像都被分離成了一個個的單字,然後將它們歸一化成同一尺寸的二值黑 白圖像(長寬均為300像素點);其示例如圖3A所示。 筆劃分解及漢字參數化102:在本實施例中,該部分包括以下步驟
(A)從字體圖像中提取其結構特徵,其步驟詳述如下(參見圖3A、圖3B、 圖3C):
l)對漢字圖像101做細化(Thinning)處理,以獲得該字的骨架圖像;本實施 例應用了 ACM學報在1994年所公布的一個圖像細化算法("A noniterative thinning algorithm" J CM 7hmsa"/ora ow Ma^附加'ca/ 20(1 ):5—20,
1994);其示例如圖3B所示;2) 從骨架圖像中提取"特徵點"("特徵點"的定義參考IEEE學報1999年公布 的一篇文章"Identification of fork points on the skeletons of handwritten Chinese characters" 7V(msaWora 爿wa/,'s朋(i Mac/w'"e /"fe〃/gewce (PAMI) 21(10):1095-1100, 1999,以下簡稱文獻PAMI99),這些特徵點將把整個骨架分 割成若干條曲線段;
3) 對每條曲線段都用多條首尾相連的直線段來近似,具體步驟如下對每一 條未被直線段取代的曲線段AB,設A、 B分別是其兩端端點;計算以曲線段 AB上的某一點C為頂點的夾角ACB,當角ACB最大時的角度值小於一個預定 值(如135度),則將曲線段AB分割成AC, CB兩段;否則以直線段連接AB 兩點,取代原有的曲線段AB;該步驟不斷進行直至所有曲線段均被直線段所取 代;
4) 由一系列直線段及其端點構成的圖被稱為該字體的"幾何圖"(geometric graph);對"幾何圖"做修正和剪枝;本實施例應用了文獻PAMI99中使用的骨架 圖修正技術;最終得到的"幾何圖"示例如圖3C所示;
(B) 在步驟(A)中所述漢字字體與其標準字體間計算出一個最佳的筆劃匹 配,從而完成筆劃分解,其步驟詳述如下(參見圖4):
1) 對步驟(A)所述字體的標準字體重複步驟(A),得到該標準字體的"幾 何圖";並假設標準字體的筆劃分解結果已經預知;
2) 在步驟(A)中所述字體的"幾何圖"與其標準字體的"幾何圖"間,計算出 一個最佳的筆劃匹配結果;本實施例應用了《模式識別》雜誌於2001年公布的 一篇文章("Model-based stroke extraction and matching for handwritten Chinese character recognition".i ecogwY/o", 34(12):2339—2352, 2001)中所述啟發 式搜索的方法來計算出"幾何圖"上的筆劃間一一對應關係;
3) 將"幾何圖"上以多條直線段表示的各筆劃軌跡,轉化為在原字體輪廓上的 筆劃分解結果,其具體方法為對各筆劃上的各直線段上的每一點,以其為圓 心畫橢圓,使該橢圓儘量大而又不包含任何原字體圖像上的空白部分(即在原 字體的黑白圖像上,該橢圓區域內的所有像素點均為黑色),該筆劃的所有橢圓 區域總和即為筆劃分解所得的圖像輪廓;
(C) 對與標準字體形態相差較大的字體,對步驟(B)中無法完成匹配的部 分筆劃,使用一個交互式的用戶界面來協助筆劃分解,其步驟詳述如下(參見 圖5):
l)用戶通過交互式的用戶界面來為字體描繪其骨架草172) 根據用戶草圖來修改由標準字體而得的"幾何圖";本實施例將步驟(2)中 未完成匹配的部分筆劃在標準字體"幾何圖"中均由用戶草圖的對應部分所替代;
3) 重複步驟(B),重新計算筆劃間的最佳匹配方案,從而完成筆劃分解;
(D) 對完成筆劃分解的字體,將其參數化,以向量的形式表達;本實施例採 用了文獻IS2005中的漢字參數化方法,每個字體都等價的用一個矩陣在向量空 間中表示。
漢字美觀度評分方法103:如前所述,包括漢字圖像樣例201、人類評分202、 機器學習過程203;最終用訓練得到的學習器來對筆劃分解及漢字參數化102得 到的結果做評分,而得到漢字美觀度評分結果104。
漢字圖像樣例201:同漢字圖像IOI,但使用於人類評分後供機器學習過程
203來學習;
人類評分202:通過調査的方式讓一定數量的人分別對字體圖像做評分(單
筆劃美觀度或字體內部結構美觀度或字體風格一致性),評分結果為"好"、"一
般"、"差,,三種其中之一;綜合所有人的評分結果,計算該字體的分數概率,艮P: 分別統計將字體評分為"好"、"一般"、"差"的人數,分別將其除以總人數,所得 百分數分別為該字體分數為"好"、"一般"、"差"的概率;
機器學習過程203:使用一個學習器(如人工神經網絡),其輸入為該字體 的特徵參數,其輸出為3個百分數,分別表示該字體分數為"好"、"一般"、"差" 的概率;利用漢字圖像樣例201及其對應的人類評分,對學習器做訓練;使用 訓練後的學習器對字體美觀度做出評分。
如圖2所示,漢字美觀度評分分為四種單筆劃美觀度評分301、內部結構 美觀度評分302、內部風格一致性評分303、總體美觀度評分304。
(E) 單筆劃美觀度評分301,包括以下步驟
1) 事先準備一定數量的漢字圖像樣例201 (均為單筆劃圖像),並對其做人 類評分202,獲得一定數量的單筆劃的美觀度人類評分結果;
2) 對每個單筆劃,使用筆劃分解及漢字參數化102中的細化算法得到其骨 架,並使用文獻IS2005中的參數化方法得到其參數化表示;取骨架上的一條最 大路徑;所謂最大路徑是指一條包含於骨架的離散曲線,並且以該曲線上的點 為圓心的覆蓋橢圓的面積之和在所有包含於骨架的離散曲線中為最大(覆蓋橢 圓Covering Ellipse的定義參見文獻IS2005);
3) 對最大路徑上的每個點,做其法向直線,使直線兩端剛好位於該筆劃字跡 邊沿並過該點,此即該點處的筆劃寬度;4) 將該筆劃的最大路徑分成三段;分段方法包含以下步驟1枚舉分成三 段所需的兩個分割點的位置;2對每種分段方法,計算每段上所有點的筆劃 寬度的平均值,記其為wl、 w2、 w3;3若max(lwl-w21, Iw2-w3l)超過一個閾 值,則轉步驟IO),否則轉步驟5);在本實施例中,該閾值取值為最大路徑兩端
端點間直線距離的1/4;
5) 如圖6所示,對最大路徑上的每個點,提取出它的坐標S氣Sx,Sy),它所 對應覆蓋橢圓的長軸半徑與短軸半徑分別組成的兩條一維曲線Ma、 Mi,以及骨 架該點到字體外輪廓邊緣的最近距離組成的一維曲線D;所有點的這些特徵組 成了5條一維曲線;
6) 記(o=(Sx, Sy, Ma, Mi, D),求出該筆劃的標準字的對應信號co0=(Sx0, SyO, Ma0,Mi0,D0),並獲得co與coO之間的差異,設00*=0)-0)0;
7) 對0)*中每條曲線計算其一階導數,得到另一曲線集合co, = (Sx,, Sy,, Ma,, Mi,, D,);
8) 對co*中的每一條一維曲線C,求出曲線C上的最大值Cmax,平均值Cave, 中位值Cmed;對①,中的每一條一維曲線C,,求出曲線C,上的最大值Cmax,, 平均值Cave',中位值Cmed';
9) 將Cmax7Cmax、 Cave,/Cmax、 Cmed,/Cmax、 Cmax,/Cave、 Cave,/Cave、 Cmed,/Cave、 Cmax7Cmed、 Cave,/Cmed、 Cmed7Cmed作為學習器輸入,三個 取值在0到100間的實數作為學習器的輸出(分別對應該筆劃美觀度為"好"、"一 般"、"差"的概率),使用該學習器對步驟l)中所用的漢字圖像樣例201並結合 其人工評分結果202作為學習樣本,對F與單筆劃評分結果間的關係進行學習; 本實施例使用了反向傳播神經網絡(Back-Propagating Neural Network)作為學 習器;轉步驟ll);
10) 對該筆劃三段中的每一段,視為一個單獨筆劃並對其執行步驟5)-8);將 這三段中每一段的Cmax,/Cmax、 Cave7Cmax、 Cmed7Cmax、 Cmax7Cave、 Cave7Cave、 Cmed7Cave、 Cmax7Cmed、 Cave,/Cmed、 Cmed7Cmed作為學習器 輸入,三個取值在0到100間的實數作為學習器的輸出(分別對應該筆劃美觀 度為"好"、"一般"、"差"的概率),使用該學習器對步驟l)中所用的漢字圖像樣 例201並結合其人工評分結果202作為學習樣本,對F與單筆劃評分結果間的 關係進行學習;本實施例使用了反向傳播神經網絡(Back-Propagating Neural Network)作為學習器;
11) 使用學習後的學習器,對漢字單筆划進行評分;(F) 內部結構美觀度評分302,包括以下步驟
1) 事先準備一定數量的漢字圖像樣例201,並對其內部結構美觀度做人類評 分202,獲得一定數量的內部結構美觀度的人類評分結果;
2) 提取出這些字體所對應向量中,各部分(如筆劃、部首)間拓撲、幾何等 關係的信號;本實施例使用的信號包括對每一對筆劃x和y,我們計算出x和 y所有點在平面上的相互最大距離Lmax、最小距離Lmin和平均距離Lave;這 些值可以描述出這些筆劃間的空間關係與拓撲關係。另外,我們在每個筆劃上 畫出它的範圍矩形(boimdingbox,即能包含該筆劃所有部分的矩形中的最小矩 形);然後對每兩個範圍矩形計算它們在水平方向、豎直方向以及面積上的重疊 部分,分別記為Bh(x,y)、 Bv(x,y)、 Bp(x,y);
3) 假設該字體的筆劃共有n個,通過步驟2)可以得到6個nxn矩陣,記為 Mmax、 Mmin、 Mave、 Mh、 Mv、 Mp,其中每個矩陣的第i行第j列元素代表 了該字體第i筆劃與第j筆劃間的相應關係;
4) 將步驟3)所述6個矩陣與該字的標準字體所對應的6個矩陣相減,記其 運算結果為Qmax、 Qmin、 Qave、 Qh、 Qv、 Qp;連同其逆矩陣一起共12個矩 陣,記為Qi(i-l,…,12);
5) 對每個Qi,求得其矩陣元素中的最大值cpmax、最小值cpmin、最大絕對 值cpmaxa、平均值(pave、中位值cpmed,連同該Qi的前三個矩陣特徵值XI、 X2、 X3—起,作為學習器的輸入;
6) 三個取值在0到IOO間的實數作為學習器的輸出(分別對應該結構美觀度 為"好"、"一般"、"差"的概率),使用該學習器對步驟l)中所用的漢字圖像樣例
201並結合其人工評分結果202作為學習樣本,對內部結構特徵與其美觀度評分 結果間的關係進行學習;本實施例使用了反向傳播神經網絡(Back-Propagating Neural Network)作為學習器;
7) 使用學習後的學習器,對內部結構美觀度進行評分;
(G) 內部風格一致性評分303,包括以下步驟
l)事先準備一定數量的漢字圖像樣例201,並對其內部風格一致性做人類評 分202,獲得一定數量的內部風格一致性的人類評分結果;
2灘備好字體樣例所對應的若干種已知字體,如楷書體、行書體、隸書體等, 每個字體樣例均有m種已知字體,記為(BJlJM,2,…,mb對該字體圖像內的每 個子部分Ai (如對每個單筆劃,i=l,2,...,n),計算出它與每種已知字體中對應子 部分的相似程度Sij (i=l,2,...,n;j=l,2,...,m),計算結果以一個百分數表示;每個字體圖像可得到一個nxm的矩陣F={Sij};
3) 將矩陣F作為學習器的輸入,三個取值在0到100間的實數作為學習器的 輸出(分別對應該字體風格一致性為"好"、"一般"、"差"的概率),使用該學習 器對步驟l)中所用的漢字圖像樣例201並結合其人工評分結果202作為學習樣 本,對F與字體內部風格一致性評分結果間的關係進行學習;本實施例使用了 反向傳播神經網絡(Back-Propagating Neural Network)作為學習器;
4) 使用學習後的學習器,對內部風格一致性進行評分; (H)總體美觀度評分304,包含以下步驟
1) 利用上述三個方法301、 302、 303,使用訓練後的人工神經網絡、決策樹、 模糊邏輯或支持向量機自動獲得100 300個字體的各單筆劃美觀度得分、內部 結構美觀度得分和書寫風格一致性得分;
2) 通過多人調査方式,讓一定數量的人分別對以上字體圖像做美觀度總體評
分,評分結果為"好"、"一般"、"差"三種其中之一;綜合所有人的評分結果,計 算該字體的分數概率,S卩分別統計將字體評分為"好"、"一般"、"差"的人數, 分別將其除以總人數,所得百分數分別為該字體分數為"好"、"一般"、"差"的概
率;
3) 使用人工神經網絡、決策樹、模糊邏輯或支持向量機來訓練並獲得步驟
l)中的得分與步驟2)中的美觀度總體評分間的映射關係;應用人工標定的評價結 果,對人工神經網絡、決策樹、模糊邏輯或支持向量機施行帶有反饋的迭代學
習過程;
4) 使用訓練後的人工神經網絡、決策樹、模糊邏輯或支持向量機對字體的總 體美觀度進行評分。即對任意給定的漢字圖像,應用步驟(l)的方法得到該字體 的單筆劃美觀度得分、內部結構美觀度得分和書寫風格一致性得分,並以這些 得分作為訓練後的人工神經網絡或決策樹或模糊邏輯或支持向量機的輸入,獲 取此時的輸出,即為該字體的總體美觀度得分。
漢字美觀度評分結果104:同人類評分202的結果,以三個百分數來分別表示該 字體美觀度為"好"、"一般"、"差"的概率。
權利要求
1. 一種漢字書寫形態美觀度的計算機自動評估方法,其特徵在於包括如下步驟1)通過多人調查的方式為500~2000個漢字單筆劃的筆劃樣本評分,並使用人工神經網絡、決策樹、模糊邏輯或支持向量機來訓練並獲得字體單筆劃形態與其美觀度評價結果間的映射關係,然後使用訓練後的學習器對字體單筆劃美觀度進行評分;2)通過多人調查的方式為500~2000個漢字樣本的內部結構評分,並使用人工神經網絡、決策樹、模糊邏輯或支持向量機來訓練並獲得字體內部結構特徵與其美觀度評價結果間的映射關係,然後使用訓練後的學習器對字體內部結構進行評分,其中,字體內部結構包括字體各內部筆劃或偏旁部首元素間的拓撲關係、相對位置關係、面積遮蓋關係,以及筆劃與筆劃、筆劃與偏旁部首之間的空間位置關係與該字的標準字體的差異,實現對字體內的各部分空間結構分布的美觀度評分;3)通過多人調查的方式為100~300個漢字樣本的風格一致性評分,並使用人工神經網絡、決策樹、模糊邏輯或支持向量機來訓練並獲得字體風格一致性特徵與其美觀度評價結果間的映射關係,使用訓練後的學習器對字體風格一致性進行評分;對字體各個內部筆劃或偏旁部首元素計算出與該字多種已知風格字體的相似度,並以此確定該字體的風格一致性評分;4)根據對漢字進行的單筆劃美觀度評分、內部結構美觀度評分、風格一致性評分,應用統計學習方法綜合各項得分,獲得該字體的總體美觀度評分。
2. 根據權利要求1所述的一種漢字美觀度的計算機評估方法,其特徵在於所 述的通過多人調查的方式為500 2000個漢字單筆劃的筆劃樣本評分,並使用 人工神經網絡、決策樹、模糊邏輯或支持向量機來訓練並獲得字體單筆劃形態 與其美觀度評價結果間的映射關係,然後使用訓練後的學習器對字體單筆劃美 觀度進行評分方法包括如下步驟a) 事先通過多人調查方式,讓六人各自對來自100個漢字的單筆劃圖像做評 分,評分結果為"好"、"一般"、"差,,三種其中之一;綜合所有人的評分結果,計 算該筆劃的分數概率,即分別統計將筆劃評分為"好"、"一般"、"差"的人數, 除以總人數,所得三個百分數分別為該筆劃美觀度為"好"、"一般"、"差"的概率, 獲得500 2000個單筆劃的美觀度的人工評價結果;b) 將步驟a)中所述各筆劃的楷書體圖像作為該筆劃的標準筆劃;將這些單筆劃圖像參數化,即提取出它們的輪廓、軌跡、位置信號,轉換成向量的形式, 對這些向量進行預處理,去除噪音,並進一步抽取特徵向量,對獲得的特徵向 量,與該筆劃的標準筆劃的特徵向量作向量減法,從而得到單筆劃的形態差異C)使用人工神經網絡、決策樹、模糊邏輯或支持向量機來訓練並獲得單筆劃的形態差異向量中的信號差異與美觀度評價結果間的函數映射關係;即以形態 差異向量與美觀度評價結果分別作為人工神經網絡、決策樹、模糊邏輯或支持 向量機的輸入和輸出;應用步驟a)中的人工評價結果,對人工神經網絡或決策 樹或模糊邏輯或支持向量機施行帶有反饋的機器學習過程;d) 使用訓練後的人工神經網絡、決策樹、模糊邏輯或支持向量機對單筆划進 行評分即對任意給定的單筆劃圖像,應用步驟b)得到該筆劃與其標準筆劃間 的形態差異向量,以該向量作為訓練後的人工神經網絡或決策樹或模糊邏輯或 支持向量機的輸入,獲取此時的輸出,;即為該漢字筆劃的美觀度得分。
3.根據權利要求1所述的一種漢字美觀度的計算機評估方法,其特徵在於所 述的通過多人調査的方式為500 2000個漢字樣本的內部結構評分,並使用人 工神經網絡、決策樹、模糊邏輯或支持向量機來訓練並獲得字體內部結構特徵 與其美觀度評價結果間的映射關係,然後使用訓練後的學習器對字體內部結構 進行評分,其中,字體內部結構包括字體各內部筆劃或偏旁部首元素間的拓撲 關係、相對位置關係、面積遮蓋關係,以及筆劃與筆劃、筆劃與偏旁部首之間 的空間位置關係與該字的標準字體的差異,實現對字體內的各部分空間結構分 布的美觀度評分方法,包括以下步驟e) 事先通過多人調査方式,事先通過多人調查方式,讓六人分別對漢字圖像 做評分,評分結果為"好"、"一般"、"差"三種其中之一;綜合所有人的評分結果, 計算該字體的分數概率,艮卩分別統計將字體評分為"好"、"一般"、"差"的人數, 分別將其除以總人數,所得百分數分別為該字體分數為"好"、"一般"、"差"的概 率;通過這樣的方式獲得500 2000個字體空間結構美觀度的人工評價結果;f) 通過筆劃分解結果將該字體參數化,轉換成向量的形式;這些向量層次化 的表達了字體的輪廓、軌跡與相對位置信息;g) 將步驟e)中所述各字體的楷書體圖像作為該字體的標準字體;提取出這些 字體所對應向量中,各筆劃或偏旁部首間的拓撲、幾何關係的信號,與其標準 字體的拓撲、幾何關係的信號做比較,獲得其信號差異,即做向量減法;h) 使用人工神經網絡、決策樹、模糊邏輯或支持向量機來訓練並獲得向量信號差異與美觀度評價結果間的映射關係;應用步驟e)中人工標定的評價結果, 對人工神經網絡、決策樹、模糊邏輯或支持向量機施行帶有反饋的迭代學習過 程。i)使用訓練後的人工神經網絡、決策樹、模糊邏輯或支持向量機對字體空間 結構美觀度進行評分。即對任意給定的字體圖像,應用步驟f)-步驟g)得到該字 體內部結構與該字的標準字體間的信號差異,以該差異向量作為訓練後的人工 神經網絡或決策樹或模糊邏輯或支持向量機的輸入,獲取此時的輸出,即為該 字體的內部結構美觀度得分。
4.根據權利要求1所述的一種漢字美觀度的計算機評估方法,其特徵在於所 述的通過多人調査的方式為100 300個漢字樣本的風格一致性評分,並使用人 工神經網絡、決策樹、模糊邏輯或支持向量機來訓練並獲得字體風格一致性特 徵與其美觀度評價結果間的映射關係,使用訓練後的學習器對字體風格一致性 進行評分;對字體各個內部筆劃或偏旁部首元素計算出與該字多種已知風格字 體的相似度,並以此確定該字體的風格一致性評分的方法包括如下步驟j)事先通過多人調查方式,讓多個人分別對多個漢字圖像的風格一致性做評 分,評分結果為"好"、"一般"、"差"三種其中之一;綜合所有人的評分結果,計 算該字體的分數概率,即分別統計將該字評分為"好"、"一般"、"差"的人數, 分別將其除以總人數,所得百分數分別為該該字分數為"好"、"一般"、"差"的概 率;通過這樣的方式獲得100 300個漢字字體風格一致性的人工評價結果;k)準備好這些漢字對應的楷書體、行書體及隸書體中的書寫形態樣本,或更 多其他字體,作為已知字體;l)通過筆劃分解結果將以上字體參數化,轉換成向量的形式;這些向量層次 化的表達了字體的輪廓、軌跡與相對位置信息;m)對各字體的每個部分,計算出該部分與其各種已知字體該部分的相似程 度;單筆劃Ai與已知字體Bj的相似度Sij的計算方法可以任選以下兩種之一(l)以已知字體Bj作為單筆劃Ai的標準筆劃,使用單筆劃美觀度評分方法 計算出該筆劃美觀度的三個概率值P1, P2, P3,分別表示該筆劃美觀度為"好"、 "一般"、"差"的概率;在本實施例中,Sij=Plx50%+P2x50%;(2沐出筆劃Ai的範圍矩形,即能包含該筆劃所有部分的矩形中的最小矩形, 並通過不斷平移和繞範圍矩形中心旋轉Ai,使Ai的字跡與其字體Bj相應筆劃 的字跡的重合面積最大;設Ai的字跡面積為Cl,其字體Bj相應筆劃的字跡的 面積為C2,貝lJSij叫CinC2l/IClUC21,及相似程度為C1、 C2交集面積與C1、C2併集面積的比值;n)將字體每個部分與每種已知字體的相似程度聚合可得到一個矩陣,作為該字體的風格一致性特徵;o)使用人工神經網絡、決策樹、模糊邏輯或支持向量機來訓練並獲得該矩陣 與美觀度評價結果間的映射關係;應用人工標定的評價結果,對人工神經網絡、 決策樹、模糊邏輯或支持向量機施行帶有反饋的迭代學習過程;p)使用訓練後的人工神經網絡、決策樹、模糊邏輯或支持向量機對字體風格 一致性進行評分。即對任意給定的字體圖像,應用步驟k)-步驟n)得到該字體 與各已知字體間的相似度,以該矩陣作為訓練後的人工神經網絡或決策樹或模 糊邏輯或支持向量機的輸入,獲取此時的輸出,即為該字體的風格一致性得分。
5.根據權利要求1所述的一種漢字美觀度的計算機評估方法,其特徵在於所 述的根據對漢字進行的單筆劃美觀度評分、內部結構美觀度評分、風格一致性 評分,應用統計學習方法綜合各項得分,獲得該字體的總體美觀度評分的方法 包括如下步驟q)利用上述三個方法,使用訓練後的人工神經網絡、決策樹、模糊邏輯或支 持向量機自動獲得100 300個漢字的各單筆劃美觀度得分、內部結構美觀度得 分和字體風格一致性得分;r)通過多人調査方式,讓多個人分別對步驟q)中所述漢字圖像做美觀度總體評 分,評分結果為"好"、"一般"、"差,,三種其中之一;綜合所有人的評分結果,計算 該字體的分數概率,艮卩分別統計將字體評分為"好"、"一般"、"差"的人數,分別 將其除以總人數,所得百分數分別為該字體分數為"好"、"一般"、"差"的概率;s)使用人工神經網絡、決策樹、模糊邏輯或支持向量機來訓練並獲得步驟 q)中的得分與步驟r)中的美觀度總體評分間的映射關係;應用人工標定的評價結 果,對人工神經網絡、決策樹、模糊邏輯或支持向量機施行帶有反饋的迭代學 習過程;t)使用訓練後的人工神經網絡、決策樹、模糊邏輯或支持向量機對字體的總 體美觀度進行評分,即對任意給定的漢字字體圖像,應用步驟q)的方法得到該 字體的單筆劃美觀度得分、內部結構美觀度得分和字體風格一致性得分,並以 這些得分作為訓練後的人工神經網絡或決策樹或模糊邏輯或支持向量機的輸 入,獲取此時的輸出,即為該字體的總體美觀度得分。
全文摘要
本發明公開了一種漢字書寫形態美觀度的計算機評估方法。方法基於對人工給定的漢字書寫樣本的美觀度評分進行機器學習而得。首先對漢字書寫形態進行筆劃分解與參數化,然後使用圖像處理和人工智慧的方法獲得漢字書寫形態與其美觀度間的潛在關係。在第一步筆劃分解與參數化過程中引入用戶智能交互,提高了對潦草字跡的處理能力。在第二步學習字體形態與人工評分間關係的過程中,分別開展對漢字書寫形態中每個單獨筆劃、字體內各部分的空間結構、以及字體內各部分的書寫風格一致性進行美觀度評分;最後綜合上述評分結果,給出該漢字書寫形態整體美觀度的評分。該方法的優點是可由計算機自動執行。
文檔編號G06K9/64GK101295371SQ20081006076
公開日2008年10月29日 申請日期2008年4月18日 優先權日2008年4月18日
發明者劉智滿, 徐頌華, 浩 江, 潘雲鶴 申請人:浙江大學