新四季網

一種基於海量菸葉數據的自動定級系統和方法

2024-03-03 03:36:15

一種基於海量菸葉數據的自動定級系統和方法
【專利摘要】本發明涉及的是一個基於海量菸葉數據的自動定級系統和方法,它是一種利用計算機視覺、圖像分析、機器學習、大數據檢索和人工智慧的技術算法對菸葉圖像進行分析、存儲、檢索和自動定級的系統。將海量數據搜索的技術引入了自動菸葉評級系統中,構建相應的資料庫和高效的檢索引擎,使定級的結果更準確,隨著計算機技術的發展,這種大數據理念將成為必然的趨勢。引入人工智慧的專家系統的算法,運用特定領域的菸葉知識構造專家知識庫,模擬人類專家才能解決的各類複雜菸葉分級的問題,達到與該領域專家具有同等解決問題能力的計算機智能。
【專利說明】一種基於海量菸葉數據的自動定級系統和方法
【技術領域】
[0001]本發明涉及的是一種基於海量菸葉數據的自動定級系統和方法,具體的說是一種利用計算機視覺、圖像分析、機器學習、大數據檢索和人工智慧的技術算法對菸葉圖像進行分析、存儲、檢索和自動定級的系統及相關方法。
【背景技術】
[0002]長期以來,不論是國內還是國外,菸葉質量的檢測和分級都是參照各地區頒布的菸葉分級標準和標準的菸葉樣本,依靠人的視覺和觸覺感官來進行判斷分級的。因此,每到收購菸葉之前,全國各煙區都要成立學習班,收集大量的、標準的菸葉樣本作為培訓材料,用來培訓收購站的菸葉分級人員,這樣的分級方式需要消耗和費損大量的人力、物力和財力,而目效率也很低下。更重要的方面是,人類的感官判斷帶有強烈的主觀性和模糊性,影響著對菸葉分級的細緻性和變化性的判斷,使檢驗和分級的結果存在著較大的差異。隨著經濟和社會的發展,以及捲菸製品質量的發展,我國己經開始全面推廣42級新的菸葉分級標準(GB2635-92),以此來逐步提高對菸葉質量的要求。儘管新的分級標準越來越細緻,但是對菸葉等級的描述都是採用定性的標準,並沒有量化的標準來供參考,這種主觀隨意性強的感官判斷和模糊主觀評定的人工分級方式反而越來越難以滿足菸草行業對菸葉質量的要求。因此,研究和實現計算機系統對菸葉自動分級,開發實用化系統在這樣的大環境下己經是勢在必行的了。
[0003]烤菸菸葉分級方法是目前評判菸葉質量的主要手段,其分級判斷的依據主要是菸葉外觀特徵,如顏色、長度、厚度、油分、成熟度,殘損等。作為計算機領域的一個重要分支,計算機視覺的研究、應用和發展正越來越得到重視。計算機視覺能模仿人眼接受各類信息,同時具有比人眼解析度高、客觀和定量等優點。故應用計算機視覺來識別菸葉的外觀特徵並依據菸葉的分級標準進行分級,從而替代繁雜的體力勞動和提供客觀評斷菸葉等級就成為目前菸葉分級研究中的主要趨勢。因此,將計算機技術應用於烤菸菸葉的分級具有重大的意義。
[0004]與一般的農產品相比,菸葉的外觀質量檢測要複雜的多,用儀器進行菸葉分級的難度較大,故有關用儀器對菸葉進行外觀質量檢測及分級的研究不多。計算機視覺及神經網絡技術在對農產品的鑑定與質量分選開始於20世紀70年代末期,從20世紀80年代後期逐步走向成熟。而數字圖像處理技術正式應用於菸草分級與識別還是開始於1984年。美國的 Thomas C.E 在其論文《Techniques of Image Analysis Applied to the Measurementof Tobacco and Related Products))中提出將數字圖像處理技術運用於菸葉的外觀特徵的識別。此後,數字圖像處理技術在菸草領域的研究有了一定的進展.辛巴威大學的MacCommc J.K.M設計了一個用於菸葉等級自動識別的圖像處理單元原型。CHO H.K和PAEK K.H研究了如何利用機器視覺技術提取白肋煙的形狀顏色等表面特徵以對其進行等級判定George Tattersfield等提取菸葉的形狀、顏色等特徵,對辛巴威烤菸的生長部位和顏色進行識別。[0005]在國內,基於圖像的菸葉分級方面,鄭州大學的申金媛利用光譜和圖像特徵進行菸葉分級的方法,使用了菸葉圖像信息和光譜信息的特徵進行分組、分色和分級;華中農業大學的馬文杰博士開闢了一條新的研究路徑,與一般研究菸葉的反射圖像特徵不同,他提出從烤菸菸葉投射圖像的特徵出發,來實現菸葉特徵參數的提取;這些方法但只是使用了菸葉的圖像信息,而並沒有在大數據的範圍中實踐和分析,同時並沒有使用專家學習系統的思想來進行建模分析和學習。
[0006]在系統構建方面,1998年以來,北京工商大學的韓力群等開展了烤菸菸葉質量特徵提取的軟硬體系統研製,建立了烤菸菸葉的標準資料庫管理系統,並將人工神經網絡技術用於菸葉成熟度的自動分級,使用了擬腦智能方法。河南農業大學的潘建斌把專家系統技術引入了菸葉烘烤的過程。這些方法僅僅引入了人工智慧的算法,或者僅部分使用了專家系統的技術在烘烤控制過程,並沒有利用海量菸葉數據進行模式分析。
[0007]從上述的研究進展和研究成果看,我們可以發現國內外己經有很多的學者投入到菸葉質量的檢測和分級【技術領域】的研究,其理論成果是豐碩的。但是到日前為止,對提取菸葉特徵參數以及實現菸葉自動分級的系統軟體的研究都是處於實驗和探討的階段,還沒有能全面檢測和提取菸葉特徵並能實現最終自動化分級的設備和技術發明,並不能滿足市場對這一【技術領域】的實際要求。同時,大部分工作還是基於少量數據進行測試,沒有使用大數據的思想和技術進行菸葉圖像數據挖掘和評級。
[0008]針對於次,本發明將計算機視覺和機器學習的算法引入菸葉定級系統中,對菸葉圖像進行預處理、特徵提取和數學建模;通過對菸草圖像的集中存儲,構建大規模菸葉圖像和特徵資料庫;面對海量的菸葉特徵數據,設計出有效的算法以度量特徵和圖像之間的內容相似度,並且能夠通過有效的方法和框架來快速的處理海量的數據,能夠快速自動獲得相應的菸葉數據;引入專家系統算法,運用菸葉領域的專門知識和經驗,建立龐大的專家菸葉定級規則庫,通過推理來模擬人類專家,達到與專家具有同等解決問題能力,從而對菸葉進行評級決策;在決策的同時,系統並有自學習功能,能自動完善菸葉評級所需的知識。
[0009]上海大學多媒體技術研發中心於2013年上半年開始與川渝中煙工業公司合作,對基於海量菸葉數據的自動定級系統和方法相關技術展開深入研究。
[0010]目前菸葉分級系統研究大多處於試驗階段,且大多致力於特徵分析方面。根據調研,到目前為止,把菸葉圖像特徵提取、分類模型建立、大數據系統搭建和專家系統等方面有機地集成在一起,本發明尚屬首例。

【發明內容】

[0011 ] 鑑於以上所述現有技術存在的問題和不足,本發明的目的在於提供一個基於海量菸葉數據的自動定級系統和方法,對於制定科學定量的菸葉分級標準、培訓菸葉分級人員、裁決菸葉質量糾紛、以及指導實際的菸葉分級工作和捲菸自動生產線上的應用開發,都具有重要的實用價值。
[0012]為達到上述目的,本發明採用下述技術構思:
根據菸葉自動分級的需求,引入海量數據檢索技術,綜合利用計算機視覺、數字圖像處理以及人工智慧融合技術,完成菸葉自動定級。系統運行前,首先根據國家菸葉定級標準,構造專家規則庫。系統運行初期,先進行菸葉訓練圖像的採集,完成顏色、形狀和紋理特徵的提取,使用機器學習的算法構建初始化分類模型。系統運行時,用戶將待檢測的菸葉放入圖像採集區域,圖像採集系統實時獲取菸草圖像,並存入菸葉圖像庫。機器視覺系統獲取菸葉圖像的相關特徵,存入菸葉特徵庫。通過海量數據智能搜索系統,獲取與該圖像相似的圖像特徵集合。專家系統根據規則庫信息、圖像特徵集合和分類模型,通過推理給出相應的評級決策。評級決策通過顯示屏幕和語音系統,提示用戶評級結果。每次評級結束後,學習系統會自動完善專家菸葉定級規則庫,更新分類模型的相應參數,優化分類模型。
[0013]本發明採用以下技術方案實現:
一種基於海量菸葉數據的自動定級系統,如圖1所示,其硬體系統具體包括以下組成部分:
1):待分級的菸葉:放在代採集區的菸葉;
2):攝像頭:用於採集菸葉圖像;
3)=PCl圖像採集與處理處理器:通過使用(2)攝像頭和視頻採集卡對真實場景進行採集、預處理和特徵提取,構建相關菸葉的分類模型;
4):PC2存儲和搜尋引擎處理器:負責系統數據查詢、存儲和搜索相關菸草圖像和特徵數據,管理專家菸葉定級規則庫;
5):PC3通信與系統監控處理器:是系統的通信和控制中心,還完成定級信息音頻輸出控制、定級信息顯示控制以及硬體設備狀態監控等任務;
6):音頻系統:分級信息音頻輸出;
7):顯示系統:分級信息視頻輸出;
8):千兆交換機;
9):菸葉圖像資料庫集群:多個存儲採集的菸葉圖像資料庫;
10):菸葉特徵資料庫集群:多個存儲採集的菸葉特徵資料庫;
11):PC4分類模型資料庫存儲器:用於存儲和訓練各種不同菸葉的分類模型;
12):PC5專家菸葉定級規則庫存儲器:用於存儲國家標準和專家相關定級經驗,並且完成菸葉定級工作;
一種基於海量菸葉數據的自動定級方法,如圖2所示,其具體操作步驟如下:
1):使用攝像頭,採集待檢測區域的菸葉圖像;
2):對菸葉圖像進行分析和預處理,保留視覺關心的圖像部分,去除噪聲,然後提取菸葉的相關細節特徵,保證數據的稀疏性和相關性;
3):從菸葉特徵資料庫中,獲取不同種類的菸葉特徵數據,進行模型的構建,且為之後的決策提供模型;
4):對菸葉圖像和特徵數據,進行分析,通過專家菸葉定級規則庫來獲得專家知識,以及獲取相應的菸葉模型,再通過推理及來進行具體的推演,以得出相應菸葉的級別;
5):將菸葉圖像和特徵數據,分別存儲於相應的菸葉圖像資料庫和菸葉特徵資料庫存儲器中;
6):將本次菸葉分級的結果通過音頻輸出到喇叭,且輸出到液晶顯示屏,提供給用戶獲取結果。
[0014]更為詳細地,所述操作步驟2)具體包括以下步驟:
2)-1:圖像預處理:為了消除圖像噪聲,且保證邊界不模糊,根據局部區域內圖像狀態的不同,對其相鄰的像素選擇,進行高斯濾波處理,使用灰度直方圖均衡化方法進行圖像模型化處理,最後使用全局閾值的算法完成圖像的二值化;
2)-2:特徵提取:對原始圖像獲取菸葉的色調均值、飽和度均值和亮度均值,同時從二值化後的圖像中獲取相關形狀特徵一周長、面積、原型度係數、長度、寬度、長寬比,用灰度共生矩陣獲得菸葉的紋理特徵一能量、角二階矩、對比度、相關性、一致性、灰度平均值、灰度均方差。
[0015]更為詳細地,所述操作步驟3)具體包括以下步驟:
3)-1:特徵降維:使用主成分分析的算法,對菸葉的相關特徵從高維數據投影到低維空間,降低了數據的複雜性,保證了數據的有效性,提高了算法的速率;
3)-2:模型選擇:根據現有的特徵的數量和分布,智能選擇模型的假設空間,同時確定模型學習的策略和算法,模型假設空間為支持向量機(SVM)或神經網絡或K近鄰模型或決策樹;
3)-3:模型訓練:通過菸葉訓練數據和驗證數據,根據學習策略,從假設空間中選擇最優模型,用數值計算的方法求解最優模型的參數,從而保證誤差最小化。
[0016]更為詳細地,所述操作步驟4)具體包括以下步驟:
4)-1:菸葉知識庫構建:歸納菸葉專家的領域知識和國家標準知識,預處理和系統化,使其可以進行決策;
4)-2:推理機制管理:使用知識庫來獲得專家知識,再通過推理及來進行具體的推演,以得出菸葉分級決策建議。
[0017]更為詳細地,所述操作步驟5)具體包括以下步驟:
5)-1:數據存儲:使用網絡附加存儲,即採用網絡(TCP / IP、ATM、FDDI)技術,通過網絡交換機連接存儲系統和伺服器主機,建立專用於數據存儲的存儲私網,可由所有的網絡用戶共享,很好的支持多用戶的並發存儲處理,從而全面改進了以前低效的存儲方式;
5)-2:數據檢索:在海量菸葉的特徵描述的基礎上,使用分布式相似度計算方法,該方法基於Map/Reduce的計算模型,即首先對每一塊數據進行獨立而並行的處理,然後這些獨立的處理塊的結果會被重新組合成不同的排序的集合,這些集合最後由統一的作業模塊進行處理,最後完成了實時菸葉信息的檢索。
[0018]本發明與現有技術相比較,具有如下顯而易見的突出實質性特點和顯著優點:首先,本發明實際上提出了一種全新的設計開發理念——將海量數據搜索的技術引入了自動菸葉評級系統中,構建相應的資料庫和高效的檢索引擎,使定級的結果更準確,隨著計算機技術的發展,這種大數據理念將成為必然的趨勢。其次,本發明引入人工智慧的專家系統的算法,運用特定領域的菸葉知識構造專家知識庫,模擬人類專家才能解決的各類複雜菸葉分級的問題,達到與該領域專家具有同等解決問題能力的計算機智能。
【專利附圖】

【附圖說明】
[0019]圖1為本發明一種基於海量菸葉數據的自動定級系統和方法的硬體結構組成概念圖。
[0020]圖2為本發明一種基於海量菸葉數據的自動定級系統和方法的操作流程圖。【具體實施方式】
[0021]本發明的優選實施例結合附圖詳述如下:
實施例一:
參見圖1,本基於海量菸葉數據的自動定級系統,其特徵在於包括以下組成部分,通過千兆交換機(8)連接:
攝像頭和視頻採集卡(2):用於採集菸葉(I)圖像;
PCl圖像採集與處理器(3):通過使用攝像頭(2)和視頻採集卡對真實場景進行採集、預處理和特徵提取,構建相關菸葉的分類模型;
PC2存儲和搜尋引擎處理器(4):負責系統數據查詢、存儲和搜索相關菸草圖像和特徵數據,管理專家菸葉定級規則庫;
PC3通信與系統監控處理器(5):是系統的通信和控制中心,還完成定級信息音頻輸出控制、定級信息顯示控制以及硬體設備狀態監控等任務;
音頻系統(6):分級信息音頻輸出;
顯示系統(7):分級信息視頻輸出;
菸葉圖像資料庫集群(9):多個存儲採集的菸葉圖像資料庫;
菸葉特徵資料庫集群(10):多個存儲採集的菸葉特徵資料庫;
PC4分類模型資料庫存儲器(11):用於存儲和訓練各種不同菸葉的分類模型;
PC5專家菸葉定級規則庫存儲器`(12):用於存儲國家標準和專家相關定級經驗,並且完成菸葉定級工作。
[0022]實施例二:
本實施例與實施例一基本相同,特別之處如下:
1)所述攝像頭和視頻採集卡(2):採用的是CBC公司的LCH-P49A工業攝像頭,它具有背光補償,自動白平衡,自動增益控制等功能。其攝像頭使用1/4〃0^(3.2\2.4!11111),水平清晰度500線。鏡頭的參數可調,焦距範圍為4-9mm,最大光圈口徑比為1:1.6,水平視角範圍為51.8° -23.8°,垂直視角可調範圍為38.3° -17.8°,該攝像頭有許多可調節的參數,解析度較高,使用它捕捉的圖像質量很好,是一個比較符合設計初衷的選擇;針對攝像頭,使用了 Microview V211視頻採集卡,它是基於PCI總線,採集PAL制、NTSC制標準黑白/彩色信號的兩路高畫質實時專業圖像採集卡,支持多路視頻輸入並實時採集顯示,單卡支持兩路768X288X24 bitX25場/秒實時採集、顯示,不佔用CPU資源,支持一機多卡;
2)所述PCl圖像採集與處理器(3)=PCl是配置較高的圖形圖像工作站,使用的工作站型號為XASUN EX580s,它提供32核計算能力超級圖形工作站,為超大規模數據計算、圖形圖像處理、複雜3D模型實時生成、4K視頻實時編輯等高端應用,提供超級計算能力、海量圖形圖像處理、超高解析度的3D可視化,高密集數據存儲與高速讀寫性能,同時具有綠色環境要求的靜音、零輻射;
3)所述PC2存儲和搜尋引擎處理器(4)、PC4分類模型資料庫存儲器(11)、PC5專家菸葉定級規則庫存儲器(12):採用企業資料庫伺服器IBM xSeries 255 8685-A1D,它是IBM公司推出的一款性能超強的伺服器,適合大中型企業作為資料庫伺服器使用。該伺服器採用塔式設計,支持4路Intel Xeon MP處理器,支持24GB DDR RECC內存的擴展;集成Ultra 160 SCSI控制器,最大可將容量擴充到1.76TB ;集成雙千兆網卡,採用冗餘雙熱插拔電源供電;
4)所述PC3通信與系統監控處理器(5):PC3是一臺高速計算機;
5)所述顯示系統(7):顯示系統是一臺LG42LN5180 42英寸LED液晶電視,解析度為1920*1080。
[0023]實施例三:
參見圖2,本基於海量菸葉數據的自動定級方法,採用上述系統進行操作,其特徵在於如下:
1):圖像採集:使用攝像頭和視頻採集卡(2),採集待檢測區域的菸葉圖像;
2):特徵獲取:對菸葉圖像進行分析和預處理,保留視覺關心的圖像部分,去除噪聲,然後提取菸葉的相關細節特徵,保證數據的稀疏性和相關性;
3):模型構建:從菸葉特徵資料庫中,獲取不同種類的菸葉特徵數據,進行模型的構建,且為之後的決策提供模型;
4):菸葉定級:對菸葉圖像和特徵數據,進行分析,通過專家菸葉定級規則庫來獲得專家知識,以及獲取相應的菸葉模型,再通過推理及來進行具體的推演,以得出相應菸葉的級別;
5):數據存儲:將菸葉圖像和特徵數據,分別存儲於相應的菸葉圖像資料庫和菸葉特徵資料庫存儲器中;
6):定級結果輸出:將本次菸葉分級的結果通過音頻輸出到喇叭,且輸出到液晶顯示屏,提供給用戶獲取結果。
[0024]實施例四:
本實施例與實施例三基本相同,特別之處如下:
所述步驟2)具體包括以下步驟:
2)-1:圖像預處理:為了消除圖像噪聲,且保證邊界不模糊,根據局部區域內圖像狀態的不同,對其相鄰的像素選擇,進行高斯濾波處理,使用灰度直方圖均衡化方法進行圖像模型化處理,最後使用全局閾值的算法完成圖像的二值化;
2)-2:特徵提取:對原始圖像獲取菸葉的色調均值、飽和度均值和亮度均值,同時從二值化後的圖像中獲取相關形狀特徵一周長、面積、原型度係數、長度、寬度、長寬比,用灰度共生矩陣獲得菸葉的紋理特徵一能量、角二階矩、對比度、相關性、一致性、灰度平均值、灰度均方差。
[0025]所述步驟3)具體包括以下步驟:
3)-1:特徵降維:使用主成分分析的算法,對菸葉的相關特徵從高維數據投影到低維空間,降低了數據的複雜性,保證了數據的有效性,提高了算法的速率;
3)-2:模型選擇:根據現有的特徵的數量和分布,智能選擇模型的假設空間,同時確定模型學習的策略和算法,模型假設空間為支持向量機(SVM)或神經網絡或K近鄰模型或決策樹;
3)-3:模型訓練:通過菸葉訓練數據和驗證數據,根據學習策略,從假設空間中選擇最優模型,用數值計算的方法求解最優模型的參數,從而保證誤差最小化。
[0026]所述步驟4)具體包括以下步驟:
4)-1:菸葉知識庫構建:歸納菸葉專家的領域知識和國家標準知識,預處理和系統化,使其可進行決策;
4)-2:推理機制管理:使用4)-1構建的菸葉知識庫來獲得相應的專家知識,再通過推理及來進行具體的推演,以得出菸葉分級決策建議。
[0027]所述步驟5)具體包括以下步驟:
5)-1:數據存儲:使用網絡附加存儲,即採用網絡(TCP / IP、ATM、FDDI)技術,通過網絡交換機連接存儲系統和伺服器主機,建立專用於數據存儲的存儲私網,可由所有的網絡用戶共享,很好的支持多用戶的並發存儲處理,從而全面改進了以前低效的存儲方式;
5)-2:數據檢索:在海量菸葉的特徵描述的基礎上,使用分布式相似度計算方法,該方法基於Map/Reduce的計算模型,即首先對每一塊數據進行獨立而並行的處理,然後這些獨立的處理塊的結果會被重新組合成不同的排序的集合,這些集合最後由統一的作業模塊進行處理,最後完成了實時菸葉信息的檢索。
[0028]實施例五:
如圖1所示,基於海量菸葉數據的自動定級系統,具體包括以下組成部分:
首先使用攝像頭和視頻採集卡在採集區域對菸葉進行採集。將攝像頭裝置在一個固定支架上,攝像頭鏡頭與菸葉的距離為0.5米,菸葉需要平整的置放在該區域內,這樣能夠保證獲取滿意的圖像,為之後的工作提供基礎。我們採用的是CBC公司的LCH-P49A工業攝像頭,它具有背光補償,自動白平衡,自動增益控制等功能。其攝像頭使用1/4〃CXD(3.2X2.4mm),水平清晰度500線。鏡頭的參數可調,焦距範圍為4_9mm,最大光圈口徑比為1:1.6,水平視角範圍為51.8° -23.8°,垂直視角可調範圍為38.3° -17.8°。該攝像頭有許多可調節的參數,解析度較高,使用它捕捉的圖像質量很好,是一個比較符合設計初衷的選擇。針對攝像頭,我們使用了 Microview V211視頻採集卡。它是基於PCI總線,採集PAL制、NTSC制標準黑白/彩色信號的兩路高畫質實時專業圖像採集卡,支持多路視頻輸入並實時採集顯示,單卡支持兩路768 X 288 X 24 bit X 25場/秒實時採集、顯示,不佔用CPU資源,支持一機多卡。
[0029]因為要處理大量的圖像處理和算法分析的工作,PCl是配置較高的圖形圖像工作站。我們使用的工作站型號為XASUN EX580s,它提供32核計算能力超級圖形工作站,為超大規模數據計算、圖形圖像處理、複雜3D模型實時生成、4K視頻實時編輯等高端應用,提供超級計算能力、海量圖形圖像處理、超高解析度的3D可視化,高密集數據存儲與高速讀寫性能,同時具有綠色環境要求的靜音、零輻射。PCl對菸葉圖像進行分析和預處理,保留視覺關心的圖像部分,去除噪聲,然後提取菸葉的相關細節特徵,保證數據的稀疏性和相關性;從菸葉特徵資料庫中,獲取不同種類的菸葉特徵數據,進行模型的構建,且為之後的決策提供模型。輸出圖像和特徵發送至PC2存儲和搜尋引擎和PC5專家菸葉定級規則庫;
PC2作為數據存儲和搜索伺服器,我們使用了企業資料庫伺服器IBM xSeries 2558685-A1D,它是IBM公司推出的一款性能超強的伺服器,適合大中型企業作為資料庫伺服器使用。該伺服器採用塔式設計,支持4路Intel Xeon MP處理器,支持24GB DDR RECC內存的擴展;集成Ultra 160 SCSI控制器,最大可將容量擴充到1.76TB ;集成雙千兆網卡,採用冗餘雙熱插拔電源供電。PC2存儲和搜尋引擎將PCl傳來的菸葉圖像存儲到相應的菸葉圖像資料庫集群中,將PCl傳來的菸葉特徵信息存儲到相應的菸葉特徵資料庫集群中;
PC4也是一臺企業級資料庫伺服器,它所存儲的分類模型資料庫是通過菸葉圖像資料庫和特徵資料庫中的數據集,訓練和修正相應不同等級的菸葉模型。
[0030]PC4模型構造的過程:通過統計特徵點的特徵向量集合島,在每一維上都近似符合高斯分布。假設各維特徵之間相互獨立,目標圖像上的N個特徵點的特徵向量集合
【權利要求】
1.一種基於海量菸葉數據的自動定級系統,其特徵在於包括以下組成部分,通過千兆交換機⑶連接: 攝像頭和視頻採集卡(2):用於採集菸葉(I)圖像; PCl圖像採集與處理器(3):通過使用攝像頭(2)和視頻採集卡對真實場景進行採集、預處理和特徵提取,構建相關菸葉的分類模型; PC2存儲和搜尋引擎處理器(4):負責系統數據查詢、存儲和搜索相關菸草圖像和特徵數據,管理專家菸葉定級規則庫; PC3通信與系統監控處理器(5):是系統的通信和控制中心,還完成定級信息音頻輸出控制、定級信息顯示控制以及硬體設備狀態監控等任務; 音頻系統(6):分級信息音頻輸出; 顯示系統(7):分級信息視頻輸出; 菸葉圖像資料庫集群(9):多個存儲採集的菸葉圖像資料庫; 菸葉特徵資料庫集群(10):多個存儲採集的菸葉特徵資料庫; PC4分類模型資料庫存儲器(11):用於存儲和訓練各種不同菸葉的分類模型; PC5專家菸葉定級規則庫存儲器(12):用於存儲國家標準和專家相關定級經驗,並且完成菸葉定級工作。
2.根據權利要求1所述的基於海量菸葉數據的自動定級系統,其特徵在於如下: 1)所述攝像頭和視頻採集卡(2): 採用的是CBC公司的LCH-P49A工業攝像頭,它具有背光補償,自動白平衡,自動增益控制等功能;其攝像頭使用1/4"CXD(3.2X2.4mm),水平清晰度500線;鏡頭的參數可調,焦距範圍為4-9mm,最大光圈口徑比為1:1.6,水平視角範圍為51.8° -23.8°,垂直視角可調範圍為38.3° -17.8°,該攝像頭有許多可調節的參數,解析度較高,使用它捕捉的圖像質量很好,是一個比較符合設計初衷的選擇; 針對攝像頭,使用了 Microview V211視頻採集卡,它是基於PCI總線,採集PAL制、NTSC制標準黑白/彩色信號的兩路高畫質實時專業圖像採集卡,支持多路視頻輸入並實時採集顯示,單卡支持兩路768X288X24 bit X 25場/秒實時採集、顯示,不佔用CPU資源,支持一機多卡; 2)所述PCl圖像採集與處理器(3): PCl是配置較高的圖形圖像工作站,使用的工作站型號為XASUN EX580s,它提供32核計算能力超級圖形工作站,為超大規模數據計算、圖形圖像處理、複雜3D模型實時生成、4K視頻實時編輯等高端應用,提供超級計算能力、海量圖形圖像處理、超高解析度的3D可視化,高密集數據存儲與高速讀寫性能,同時具有綠色環境要求的靜音、零輻射; 3)所述PC2存儲和搜尋引擎處理器(4)、PC4分類模型資料庫存儲器(11)、PC5專家菸葉定級規則庫存儲器(12): 採用企業資料庫伺服器IBM xSeries 255 8685-A1D,它是IBM公司推出的一款性能超強的伺服器,適合大中型企業作為資料庫伺服器使用;該伺服器採用塔式設計,支持4路Intel Xeon MP處理器,支持24GB DDR RECC內存的擴展;集成Ultra 160 SCSI控制器,最大可將容量擴充到1.76TB ;集成雙千兆網卡,採用冗餘雙熱插拔電源供電; 4)所述PC3通信與系統監控處理器(5):PC3是一臺高速計算機; 5)所述顯示系統(7): 顯示系統是一臺LG 42LN5180 42英寸LED液晶電視,解析度為1920*1080。
3.一種基於海量菸葉數據的自動定級方法,採用根據權利要求1所述的基於海量菸葉數據的自動定級系統進行操作,其特徵在於操作步驟如下: 1):圖像採集:使用攝像頭和視頻採集卡(2),採集待檢測區域的菸葉圖像; 2):特徵獲取:對菸葉圖像進行分析和預處理,保留視覺關心的圖像部分,去除噪聲,然後提取菸葉的相關細節特徵,保證數據的稀疏性和相關性; 3):模型構建:從菸葉特徵資料庫中,獲取不同種類的菸葉特徵數據,進行模型的構建,且為之後的決策提供模型; 4):菸葉定級:對菸葉圖像和特徵數據,進行分析,通過專家菸葉定級規則庫來獲得專家知識,以及獲取相應的菸葉模型,再通過推理及來進行具體的推演,以得出相應菸葉的級別; 5):數據存儲:將菸葉圖像 和特徵數據,分別存儲於相應的菸葉圖像資料庫和菸葉特徵資料庫存儲器中; 6):定級結果輸出:將本次菸葉分級的結果通過音頻輸出到喇叭,且輸出到液晶顯示屏,提供給用戶獲取結果。
4.根據權利要求3所述的一種基於海量菸葉數據的自動定級方法,其特徵在於所述步驟2)具體包括以下步驟: 2)-1:圖像預處理:為了消除圖像噪聲,且保證邊界不模糊,根據局部區域內圖像狀態的不同,對其相鄰的像素選擇,進行高斯濾波處理,使用灰度直方圖均衡化方法進行圖像模型化處理,最後使用全局閾值的算法完成圖像的二值化; 2)-2:特徵提取:對原始圖像獲取菸葉的色調均值、飽和度均值和亮度均值,同時從二值化後的圖像中獲取相關形狀特徵一周長、面積、原型度係數、長度、寬度、長寬比,用灰度共生矩陣獲得菸葉的紋理特徵一能量、角二階矩、對比度、相關性、一致性、灰度平均值、灰度均方差。
5.根據權利要求3所述的一種基於海量菸葉數據的自動定級方法,其特徵在於所述步驟3)具體包括以下步驟: 3)-1:特徵降維:使用主成分分析的算法,對菸葉的相關特徵從高維數據投影到低維空間,降低了數據的複雜性,保證了數據的有效性,提高了算法的速率; 3)-2:模型選擇:根據現有的特徵的數量和分布,智能選擇模型的假設空間,同時確定模型學習的策略和算法,模型假設空間為支持向量機(SVM)或神經網絡或K近鄰模型或決策樹; 3)-3:模型訓練:通過菸葉訓練數據和驗證數據,根據學習策略,從假設空間中選擇最優模型,用數值計算的方法求解最優模型的參數,從而保證誤差最小化。
6.根據權利要求3所述的一種基於海量菸葉數據的自動定級方法,其特徵在於所述步驟4)具體包括以下步驟: 4)-1:菸葉知識庫構建:歸納菸葉專家的領域知識和國家標準知識,預處理和系統化,使其可進行決策;4)-2:推理機制管理:使用4)-1構建的菸葉知識庫來獲得相應的專家知識,再通過推理及來進行具體的推演,以得出菸葉分級決策建議。
7.根據權利要求3所述的一種基於海量菸葉數據的自動定級方法,其特徵在於所述步驟5)具體包括以下步驟: 5)-1:數據存儲:使用網絡附加存儲,即採用網絡(TCP / IP、ATM、FDD I)技術,通過網絡交換機連接存儲系統和伺服器主機,建立專用於數據存儲的存儲私網,可由所有的網絡用戶共享,很好的支持多用戶的並發存儲處理,從而全面改進了以前低效的存儲方式; 5)-2:數據檢索:在海量菸葉的特徵描述的基礎上,使用分布式相似度計算方法,該方法基於Map/Reduce的計算模型,即首先對每一塊數據進行獨立而並行的處理,然後這些獨立的處理塊的結果會被重新組合成不同的排序的集合,這些集合最後由統一的作業模塊進行處理,最後完成了實時菸葉信息的檢索。
【文檔編號】G06K9/62GK103743486SQ201410001552
【公開日】2014年4月23日 申請日期:2014年1月2日 優先權日:2014年1月2日
【發明者】陳一民, 鄒一波, 黃晨, 張典華, 張雲華, 李澤宇 申請人:上海大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀