一種碎紙機切割的雙面文檔碎片拼接方法
2023-10-05 23:53:39 1
一種碎紙機切割的雙面文檔碎片拼接方法
【專利摘要】本發明屬信息【技術領域】,涉及一種碎紙機切割的雙面文檔碎片拼接方法。發明首先將碎紙機切割得到的n張文檔碎片的正反兩面進行標號並掃描得到2n張圖片,讀取每張圖片的像素值並計算任意兩張圖片之間的距離;然後通過引入0-1變量xij刻畫任意兩個圖片是否可以相接,以所有相鄰的碎片之間的距離之和最小為目標函數建立0-1規劃模型;最後根據xij的求解結果將2n張圖片左右相接,並將文檔分成正反兩面完成拼接。本發明的碎片拼接方法,利用數位化方法解決了碎紙機切割的雙面文檔碎片的拼接,0-1規劃的方法的引入使得碎片拼接正確率高且拼接速度快。
【專利說明】一種碎紙機切割的雙面文檔碎片拼接方法
【技術領域】
[0001]本發明涉及一種文檔碎片的拼接復原方法,特別涉及一種碎紙機切割的雙面文檔碎片拼接方法,屬信息【技術領域】。
【背景技術】
[0002]碎紙機已成為文檔破碎、銷毀的主要工具,然而許多時候需要對破碎的文檔進行拼接還原,如文件恢復、司法取證等。
[0003]對於數量不大或邊緣特徵明顯的碎片,人工即可完成拼接復原,但效率很低。由於碎紙機破碎後的文檔形狀規則,無明顯輪廓特徵可用,只能根據文檔內容進行拼接,給文檔的拼接復原造成了一定困難。
[0004]對於雙面列印的文檔,由於每張碎片都有正反兩面信息,且事先並不能區分哪面為正面哪面為反面,這又為文檔的拼接復原增加了難度。
[0005]邢楠在其發明專利「基於文字特徵的碎紙機破碎文檔恢復方法」中提出了根據漢字文字特徵——橫筆位置拼接文檔碎片的方法,但文字特徵提取方法複雜且準確度不高,更大的局限在於此方法只能應用於中文文檔,且只涉及單面文檔的拼接。
[0006]0-1規劃屬最優化方法,0-1變量可以數量化地描述諸如是與否、取與舍、有與無等現象所反映的離散變量間的邏輯關係、順序關係,在決策、優化等領域有著重要應用,將0-1規劃引入碎片拼接,會大大提高拼接的速度和準確度。
【發明內容】
[0007]本發明的目的是對碎紙機破碎後的雙面文檔碎片進行拼接,提供一種高效、快速的拼接復原方法。
[0008]本發明所涉及的碎紙機切割的雙面文檔碎片拼接方法,採用以下步驟:
(0.首先將碎紙機切割得到的η張文檔碎片的正反兩面進行標號,記為i=1...2η,然後對所有碎片的正反兩面進行掃描,掃描後得到2η張圖片,對應碎片的編號記為i=1...2η.每張圖片的大小為MXN,M為圖片的高度,N為圖片的寬度;
(2).讀取每張圖片的像素值,得到圖片的像素矩陣為.,其中為.的每一個元素為O到255之間的整數,表示像素的灰度值,255表示像素為白色,隨著數字的減小,顏色變暗,O表示像素為黑色;
(3).定義兩張圖片i,J之間的距離為:圖片i的右邊緣和圖片j的左邊緣像素值之間的歐式距離,記做
【權利要求】
1.一種碎紙機切割的雙面文檔碎片拼接方法,其特徵在於採用以下步驟: (1)將碎紙機切割得到的η張文檔碎片的正反兩面進行標號,記為?=1...2η,然後對所有碎片的正反兩面進行掃描,掃描後得到2η張圖片,對應碎片的編號記為?=1...2η.每張圖片的大小為MXN,M為圖片的高度,N為圖片的寬度; (2)讀取每張圖片的像素值,得到圖片的像素矩陣Ai,其中Ai的每一個元素為O到255之間的整數,表示像素點的灰度值; (3)定義兩張圖片i,j之間的距離為:圖片i的右邊緣和圖片j的左邊緣像素值之間的歐式距離,記做= ; 用,I表示為的最後一列的第k個元素,表示4第一列的第A個元素,則圖片i和j.之間的距離:r&.= (% - ?a,)2.1 = 1*.^ 2n, j = I…2? ;
(4)引入ο-1變量
【文檔編號】G06T5/50GK103886570SQ201410138845
【公開日】2014年6月25日 申請日期:2014年4月9日 優先權日:2014年4月9日
【發明者】屈忠峰, 房瑩 申請人:濟南大學