新四季網

一種基於文件頭和壓縮參數的jpeg圖片原始性檢測方法

2023-05-19 14:09:26

一種基於文件頭和壓縮參數的jpeg圖片原始性檢測方法
【專利摘要】本發明公開一種基於文件頭和壓縮參數的JPEG圖片原始性鑑別方法,其包括以下步驟:從待檢測的圖片的文件頭和壓縮參數中提取N維特徵,N為正整數,並根據各特徵的屬性設置其特徵值為A或B;構建決策模型:統計N維特徵中A或B出現的個數並設置一個閾值T,T為自然數,如果A的個數大於閾值T,則圖片非原始圖片,否則圖片為原始圖片;依據決策模型對待檢測的圖片做檢測判斷。本發明適用於多媒體取證中的JPEG圖片原始性鑑別,具有簡單有效、檢測準確率高的優點。
【專利說明】一種基於文件頭和壓縮參數的JPEG圖片原始性檢測方法

【技術領域】
[0001] 本發明涉及多媒體內容取證領域,更具體地,涉及一種基於文件頭和壓縮參數的 JPEG圖片原始性檢測方法。

【背景技術】
[0002] 隨著數字圖像處理技術的快速發展,藉助專業的圖像編輯軟體例如Photoshop、 A⑶see、GIMP和美圖秀秀等,即使普通用戶也能篡改數字圖像而不留下明顯的視覺痕跡,這 使得數字圖像的真實性不斷受到質疑,顛覆了人們"眼見為實"的傳統觀念。近年來,數字 圖像的篡改已經影響到政治、法律、傳媒等方方面面,因此圖像認證技術變得十分重要。
[0003] 圖像認證技術可分為主動認證和被動認證兩類。典型的主動認證技術包括數字水 印和數字籤名。這兩種方法都需要事先對圖片附加額外的信息,認證時從圖片中提取相應 信息,然後與事先附加信息進行匹配判別。而在實際的應用中,更多的情況下我們不可能獲 得有效的附加信息,因此主動認證方法有很大局限性。這種情況下,就需要藉助於被動式的 認證技術。圖像被動認證技術不需要任何附加的信息,而是利用和分析圖像的一些內在特 徵,來達到認證的目的。
[0004] 針對JPEG圖像的原始性的被動取證算法主要分為兩部分:基於信號處理的方式 和基於文件頭和碼流的方式。由於JPEG有損壓縮模式中存在編解碼的取整和截斷誤差,大 多數基於信號處理方式的算法涉及統計相關性,但是這類算法有一個較強假設前提,即事 先假設有或者沒有某種方式的篡改,例如判別有沒有粘貼-複製操作,因此實際應用中當 需要判別一種未知的篡改種類的圖片時,往往會出現誤判;又由於JPEG特殊的編碼格式, 其文件頭和碼流結構在圖像篡改前後會出現較大的差異,因此基於文件頭信息的被動取證 也湧現出來,但是此類算法不僅需要龐大的資料庫支撐,而且魯棒性較差,不能抵抗反取證 操作。
[0005] 因此,從實際應用角度出發,亟需一種準確率較高、魯棒性較高、不需要龐大數據 庫支持的被動取證算法。


【發明內容】

[0006] 本發明為克服上述現有技術所述的至少一種缺陷(不足),提供一種高效並且簡 單的基於文件頭和壓縮參數的JPEG圖片原始性檢測方法。
[0007] 為解決上述技術問題,本發明的技術方案如下:
[0008] 當原始JPEG圖片經過圖像編輯軟體重新壓縮,會在JPEG文件頭、全圖的JPEG的 壓縮參數和縮略圖的JPEG壓縮參數上留下痕跡,本發明提出一種基於文件頭和壓縮參數 的JPEG圖片原始性檢測方法,包括以下步驟:
[0009] S1 :從待檢測的圖片的文件頭和壓縮參數中提取N維特徵,N為正整數,並根據各 特徵的屬性設置其特徵值為A或B ;
[0010] S2 :構建決策模型:統計N維特徵中A或B出現的個數並設置一個閾值T,T為自 然數,如果A或B的個數大於閾值T,則圖片非原始圖片,否則圖片為原始圖片;
[0011] S3 :依據決策模型對待檢測的圖片做檢測判斷。
[0012] 由於實驗樣本不可能覆蓋所有型號的數位相機,所以考慮到誤檢,可以通過閾值Τ 進行控制。
[0013] 在一種優選的方案中,所述Ν = 13, Τ = 0,即只要13維特徵中有一項或一項以上 的特徵值為〇,則判斷該圖片非原始圖片。
[0014] 在一種優選的方案中,所述A = 0, Β = 1,Ν維特徵及其特徵值的設置方法為:
[0015] 從文件頭的EXIF信息提取特徵:
[0016] (1)比較文件頭EXIF信息裡的"DateTime"屬性值與"DateTimeDigitized"屬性 值,若兩個屬性值不為空且不同,則特徵值為〇,否則為1 ;
[0017] (2)提取文件頭EXIF信息裡的"Software"屬性值,如果屬性值裡含有圖像編輯軟 件的信息,則特徵值為〇,否則為1 ;
[0018] (3)判斷文件頭裡是否有"AppO"標記位,如果有則特徵值為0,否則為1 ;
[0019] 根據全圖的JPEG壓縮參數提取特徵:
[0020] (4)提取全圖的JPEG的量化表,如果與第一圖像處理軟體固有的全圖量化表相 同,則特徵值為〇,否則為1 ;
[0021] (5)提取全圖的量化表標記位"FFDB"的個數,如果個數等於1,則特徵值為1,否則 為〇 ;
[0022] (6)提取全圖的哈夫曼表,如果和JPEG編碼的默認哈夫曼表相同,則特徵值為1, 否則為〇 ;
[0023] (7)提取全圖的JPEG的哈夫曼表標記位"FFC4"的個數,如果個數等於1,則特徵 值為1,否則為0 ;
[0024] (8)提取全圖的YCbCr採樣率,如果是2X2或者是2X1,則特徵值為1,否則為0 ;
[0025] 根據縮略圖的JPEG壓縮參數提取特徵:
[0026] (9)提取縮略圖的JPEG的量化表,如果與第二圖像處理軟體固有的縮略圖量化表 相同,則特徵值為〇,否則為1,
[0027] (10)提取縮略圖中量化表標記位"FFDB"的個數,如果個數等於1,則特徵值為1, 否則為〇 ;
[0028] (11)提取縮略圖的哈夫曼表,如果和JPEG編碼的默認哈夫曼表相同,則特徵為1, 否則為〇 ;
[0029] (12)提取縮略圖的JPEG的哈夫曼表標記位"FFC4"的個數,如果個數等於1,則特 徵值為1,否則為〇;
[0030] (13)提取縮略圖的YCbCr採樣率,如果是2X1,則特徵值為1,否則為0。
[0031] 由於第一圖像處理軟體固有的全圖量化表,所以對應維的特徵可以用來檢測圖像 是否被第一圖像處理軟體編輯過。同理,因為第二圖像處理軟體固有的的縮略圖的量化表, 所以對應維的特徵可以用來檢測圖像是否被第二圖像處理軟體編輯過。
[0032] 在一種優選的方案中,所述第一圖像處理軟體為Photo shop,第二處理軟體為 Photoshop或ACDsee。因為Photoshop才有其固有的全圖量化表,所以對應的這維特徵是 用來排除Photoshop,同理,因為Photoshop和ACDsee才有其固有的縮略圖的量化表,所以 對應的這維特徵是用來排除Photoshop和A⑶see的。
[0033] 與現有技術相比,本發明技術方案的有益效果包括:
[0034] 本發明從JPEG壓縮和編碼的根源出發,統計原始JPEG圖片和經過軟體壓縮後的 JPEG的多種區別,因此本發明具有較高的準確率和魯棒性,不需要龐大資料庫支持等優點。 本發明的決策模型,通過將N維特徵中0出現的個數與預設的閾值T比較,得到決策結果, 因此可以根據檢測樣本的不同設置不同的閥值T,從而提高了檢測的準確率;本發明的檢 測過程,只需要從頭文件、全圖以及縮略圖中提取N維特徵並設置其特徵值,即可根據決策 模型進行判斷,因此簡便方法較現有技術更為簡便。

【專利附圖】

【附圖說明】
[0035] 圖1為JPEG圖片篡改的一般過程。
[0036] 圖2為本發明圖片原始性鑑別的流程。

【具體實施方式】
[0037] 下面結合附圖和實施例對本發明的技術方案做進一步的說明。
[0038] 實施例1
[0039] 當原始JPEG圖片經過圖像編輯軟體重新壓縮,會在JPEG文件頭、全圖的JPEG的 壓縮參數和縮略圖的JPEG壓縮參數上留下痕跡,如圖2所示,本發明提出一種基於文件頭 和壓縮參數的JPEG圖片原始性鑑別方法,包括以下步驟:
[0040] S1 :從待檢測的圖片的文件頭和壓縮參數中提取13維特徵,並根據各特徵的屬性 設置其特徵值為〇或1 ;
[0041] S2 :構建決策模型:統計N維特徵中0出現的個數並設置一個閾值T,T為自然數, 如果Α的個數大於閾值Τ,則圖片非原始圖片,否則圖片為原始圖片;
[0042] S3 :依據決策模型對待檢測的圖片做檢測判斷。
[0043] 因為由於實驗樣本不可能覆蓋所有型號的數位相機,所以考慮到誤檢,可以通過 閾值T進行控制。在具體實施過程,設置T = 0,即只要13維特徵中有一項或一項以上的特 徵值為〇,則判斷該圖片非原始圖片。
[0044] 在具體實施過程中,所述13維特徵及其特徵值的設置方法為:
[0045] 從文件頭的EXIF信息提取特徵:
[0046] (1)比較文件頭EXIF信息裡的"DateTime"屬性值與"DateTimeDigitized"屬性 值,若兩個屬性值不為空且不同,則特徵值為〇,否則為1 ;
[0047] (2)提取文件頭EXIF信息裡的"Software"屬性值,如果屬性值裡含有如果屬性值 裡含有圖像編輯軟體的信息,如"Photoshop"、"ACD Systems"、"6頂?"、"11^加",則特徵值 為〇,否則為1 ;
[0048] (3)判斷文件頭裡是否有"AppO"標記位,如果有則特徵值為0,否則為1 ;
[0049] 根據全圖的JPEG壓縮參數提取特徵:
[0050] (4)提取全圖的JPEG的量化表,如果與Photoshop軟體固有的全圖量化表相同,則 特徵值為〇,否則為1 ;
[0051] (5)提取全圖的量化表標記位"FFDB"的個數,如果個數等於1,則特徵值為1,否則 為Ο ;
[0052] (6)提取全圖的哈夫曼表,如果和JPEG編碼的默認哈夫曼表相同,則特徵值為1, 否則為〇 ;
[0053] (7)提取全圖的JPEG的哈夫曼表標記位"FFC4"的個數,如果個數等於1,則特徵 值為1,否則為〇 ;
[0054] (8)提取全圖的YCbCr採樣率,如果是2X2或者是2X1,則特徵值為1,否則為0 ;
[0055] 根據縮略圖的JPEG壓縮參數提取特徵:
[0056] (9)提取縮略圖的JPEG的量化表,如果與Photoshop或ACDsee軟體固有的縮略圖 量化表相同,則特徵值為〇,否則為1,
[0057] (10)提取縮略圖中量化表標記位"FFDB"的個數,如果個數等於1,則特徵值為1, 否則為〇 ;
[0058] (11)提取縮略圖的哈夫曼表,如果和JPEG編碼的默認哈夫曼表相同,則特徵為1, 否則為〇 ;
[0059] (12)提取縮略圖的JPEG的哈夫曼表標記位"FFC4"的個數,如果個數等於1,則特 徵值為1,否則為〇;
[0060] (13)提取縮略圖的YCbCr採樣率,如果是2X1,則特徵值為1,否則為0。
[0061] 本發明方法的原理如下:
[0062] 當原始JPEG圖片按圖1所示的過程經過圖像編輯軟體重新壓縮,或多或少會在 JPEG文件頭、全圖的JPEG壓縮參數和縮略圖的JPEG壓縮參數上留下痕跡。故在本實施例 中使用了 13維特徵,這些特徵在不同的數位相機之間不存在差異性,而在數位相機和圖像 處理軟體之間差異較大。
[0063] 下面對13維特徵分別做出解釋:
[0064] "DateTime"屬性值表示保存圖片的時間,"DateTimeDigitized"屬性值表示拍攝 圖片的時間。因此當JPEG是原始圖片時,如果文件頭裡有這些屬性值,這兩個屬性值是一 樣的;當JPEG被篡改後,"DateTime"的值是篡改後保存圖片的時間,因此兩個屬性值就不 一致。
[0065] "Software"屬性值表示JPEG圖片被哪一種軟體保存。一些圖片處理軟體在篡改 圖片後,會將該屬性值設置成自己的logo,例如軟體名稱Photoshop和美圖秀秀等。
[0066] "AppO"標記位,數位相機不使用這個標記位,而經過圖像處理軟體保存後,會有此 標記位。
[0067] 全圖的JPEG的量化表,Photoshop使用其固有的,不同於目前所有相機的量化表, 因此通過該特徵,可以判別是否經過Photoshop處理。
[0068] 全圖的量化表標記位的個數,數位相機使用1個標記位,而圖像處理軟體,例如 Picasa,GIMP使用多個標記位。
[0069] 全圖的哈夫曼表,數位相機採用和Independent JPEG Group所發布的JPEG程序 中默認的哈夫曼表,而圖像處理軟體可以使用最優哈夫曼表等。
[0070] 全圖的哈夫曼表標記位的個數,數位相機使用1個標記位,而圖像處理軟體,例如 Picasa,GIMP使用4個標記位。
[0071] 全圖的YCbCr採樣率,數位相機一般採用2X2和2X1的形式,圖像軟體有可能採 用其他形式,例如美圖秀秀和Photoshop通常採用IX 1。
[0072] 縮略圖的量化表,Photoshop和A⑶See使用不同於相機的量化表,因此通過該特 徵,可以判別是否經過Photoshop和A⑶See處理。
[0073] 縮略圖的量化表標記位的個數,數位相機使用1個標記位,而圖像處理軟體,例如 Picasa,GIMP使用多個標記位。
[0074] 縮略圖的哈夫曼表,數位相機採用和Independent JPEG Group所發布的JPEG程 序中默認的哈夫曼表,而Photoshop使用其固有的表。
[0075] 縮略圖的哈夫曼表標記位的個數,數位相機使用1個標記位,而圖像處理軟體,例 如Picasa,GIMP等使用4個標記位。
[0076] 縮略圖的YCbCr採樣率,相機採用2X 1,經過有些圖像處理軟體,例如Photoshop 採用2X2。
[0077] 採用本發明的實驗及其結果:
[0078] (1)同庫實驗
[0079] ①選取正樣本:選取2600張原始JPEG圖片,來源於26種不同型號的數位照相機, 相機型號如表1所示。
[0080] 表 1
[0081]

【權利要求】
1. 一種基於文件頭和壓縮參數的JPEG圖片原始性檢測方法,其特徵在於,包括以下步 驟: 51 :從待檢測的圖片的文件頭和壓縮參數中提取N維特徵,N為正整數,並根據各特徵 的屬性設置其特徵值為A或B; 52 :構建決策模型:統計N維特徵中A或B出現的個數並設置一個閾值T,T為自然數, 如果Α的個數大於閾值Τ,則圖片非原始圖片,否則圖片為原始圖片; 53 :依據決策模型對待檢測的圖片做檢測判斷。
2. 根據權利要求1所述的基於文件頭和壓縮參數的JPEG圖片原始性檢測方法,其特徵 在於,所述N = 13, T = 0。
3. 根據權利要求2所述的基於文件頭和壓縮參數的JPEG圖片原始性檢測方法,其特徵 在於,所述A = 0, B = 1,N維特徵及其特徵值的設置方法為: (1) 比較文件頭EXIF信息裡的"DateTime"屬性值與"DateTimeDigitized"屬性值,若 兩個屬性值不為空且不同,則特徵值為〇,否則為1 ; (2) 提取文件頭EXIF信息裡的"Software"屬性值,如果屬性值裡含有圖像編輯軟體的 信息,則特徵值為〇,否則為1 ; (3) 判斷文件頭裡是否有"AppO"標記位,如果有則特徵值為0,否則為1 ; (4) 提取全圖的JPEG的量化表,如果與第一圖像處理軟體固有的全圖量化表相同,則 特徵值為〇,否則為1 ; (5) 提取全圖的量化表標記位"FFDB"的個數,如果個數等於1,則特徵值為1,否則為 〇 ; (6) 提取全圖的哈夫曼表,如果和JPEG編碼的默認哈夫曼表相同,則特徵值為1,否則 為〇 ; (7) 提取全圖的JPEG的哈夫曼表標記位"FFC4"的個數,如果個數等於1,則特徵值為 1,否則為0 ; (8) 提取全圖的YCbCr採樣率,如果是2X2或者是2X1,則特徵值為1,否則為0 ; (9) 提取縮略圖的JPEG的量化表,如果與第二圖像處理軟體固有的縮略圖量化表相 同,則特徵值為〇,否則為1 ; (10) 提取縮略圖中量化表標記位"FFDB"的個數,如果個數等於1,則特徵值為1,否則 為〇 ; (11) 提取縮略圖的哈夫曼表,如果和JPEG編碼的默認哈夫曼表相同,則特徵為1,否則 為〇 ; (12) 提取縮略圖的JPEG的哈夫曼表標記位"FFC4"的個數,如果個數等於1,則特徵值 為1,否則為0 ; (13) 提取縮略圖的YCbCr採樣率,如果是2X1,則特徵值為1,否則為0。
4. 根據權利要求3所述的基於文件頭和壓縮參數的JPEG圖片原始性檢測方法,其特徵 在於,所述第一圖像處理軟體為Photoshop,第二處理軟體為Photoshop或AO)see。
【文檔編號】G06T1/00GK104102861SQ201410340251
【公開日】2014年10月15日 申請日期:2014年7月16日 優先權日:2014年7月16日
【發明者】陳超, 黃繼武, 駱偉祺 申請人:中山大學, 深圳大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀