一種基於圖片內容播放音樂的方法及裝置製造方法

2023-08-06 00:51:31 3

一種基於圖片內容播放音樂的方法及裝置製造方法
【專利摘要】本公開是關於一種基於圖片內容播放音樂的方法及裝置，該方法包括：獲取圖庫中的目標圖片和所述目標圖片的圖片標識；提取所述目標圖片的圖像特徵；利用預先生成的場景判定模型判定出所述目標圖片的圖像特徵對應的場景標籤；確定與所述場景標籤對應的場景音樂標識；建立所述圖片標識與所述場景音樂標識的對應關係；在接收到打開所述圖片標識對應的目標圖片的指令時，播放所述場景音樂標識對應的音樂文件。本公開提供的方案可以根據圖片內容播放適合的音樂，從而降低用戶的操作複雜度，並節省用戶的時間。
【專利說明】—種基於圖片內容播放音樂的方法及裝置

【技術領域】
[0001]本發明涉及通信【技術領域】，更具體的說，涉及基於圖片內容播放音樂的方法及裝置。

【背景技術】
[0002]人們在瀏覽相冊或圖庫中的圖片時，通常會播放一些音樂。有時，用戶為了更好的體驗圖片中的氛圍，通常會選擇一些與當前查看的圖片相匹配的音樂。例如，用戶在瀏覽自己在海邊遊玩的圖片時，會播放一些歡快的音樂，使自己更好的融入圖片中愉悅的場景。又如，用戶在瀏覽朋友婚禮的圖片時，會播放一些與婚禮有關的音樂，如婚禮進行曲等。再如，用戶在瀏覽恐怖圖片時，會播放一些詭異或驚悚的音樂，以烘託恐怖氣氛，使用戶充分的體驗恐怖氛圍。
[0003]在研究和實踐過程中，發明人發現上述相關技術至少存在以下問題:
[0004]由於用戶在瀏覽圖片時，在一段時間內可能會查看多張不同內容的圖片。例如，用戶在10分鐘之內查看了海邊遊玩的圖片、朋友婚禮的圖片和恐怖圖片，所以用戶在查看多張不同內容的圖片時，經常需要手動的去切換適合當前圖片的音樂，以使自己更好的融入當前圖片的場景。但是經常的去手動切換與當前瀏覽的圖片相匹配的音樂，會增加用戶的操作複雜度；而且，用戶可能很難在短時間內查找到與當前瀏覽的圖片相匹配的音樂，所以用戶在查找與當前瀏覽的圖片相匹配的音樂類型時可能會浪費大量的時間。
[0005]因此，如何根據圖片內容播放適合的音樂，成為目前亟需解決的問題。

【發明內容】

[0006]為克服相關技術中存在的問題，本公開提供一種基於圖片內容播放音樂的方法及裝置，根據圖片內容播放適合的音樂，從而降低用戶的操作複雜度，並節省用戶的時間。
[0007]根據本公開實施例的第一方面，提供一種基於圖片內容播放音樂的方法，包括:
[0008]獲取圖庫中的目標圖片和所述目標圖片的圖片標識；
[0009]提取所述目標圖片的圖像特徵；
[0010]利用預先生成的場景判定模型判定出所述目標圖片的圖像特徵對應的場景標籤;
[0011 ] 確定與所述場景標籤對應的場景音樂標識；
[0012]建立所述圖片標識與所述場景音樂標識的對應關係；
[0013]在接收到打開所述圖片標識對應的目標圖片的指令時，播放所述場景音樂標識對應的音樂文件。
[0014]可選的，所述方法還包括:
[0015]創建場景標籤；
[0016]獲取與每個場景標籤對應的指定場景圖片；
[0017]提取所述每個場景標籤對應的指定場景圖片的圖像特徵；
[0018]利用預設機器學習方法對所述每個場景標籤對應的指定場景圖片的圖像特徵進行訓練，生成所述場景判定模型。
[0019]可選的，所述方法還包括:
[0020]判斷所述場景標籤是否為人臉圖像；
[0021]在所述場景標籤為所述人臉圖像時，利用預先生成的人臉判定模型判定出所述目標圖片的圖像特徵對應的表情標籤，確定與所述表情標籤對應的表情首樂標識，建立所述圖片標識與所述表情音樂標識的對應關係，在接收到打開所述圖片標識對應的目標圖片的指令時，播放所述表情音樂標識對應的音樂文件；
[0022]在所述場景標籤不為所述人臉圖像時，執行所述確定與所述場景標籤對應的音樂標識的步驟。
[0023]可選的，所述方法還包括:
[0024]創建表情標籤；
[0025]獲取與每個表情標籤對應的指定表情圖片；
[0026]提取所述每個場景標籤對應的指定表情圖片的圖像特徵；
[0027]利用預設機器學習方法對所述每個場景標籤對應的指定表情圖片的圖像特徵進行訓練，生成所述人臉判定模型。
[0028]可選的，在所述建立所述圖片標識與所述場景音樂標識的對應關係之後，所述方法還包括:
[0029]判斷所述圖庫中是否存在未被所述場景判定模型判定過的圖片；
[0030]在所述圖庫中存在未被所述場景判定模型判定過的圖片時，將所述圖庫中未被所述場景判定模型判定過的圖片確定為目標圖片，並獲取所述目標圖片的圖片標識，執行所述提取所述目標圖片的圖像特徵的步驟；
[0031]在所述圖庫中不存在未被所述場景判定模型判定過的圖片時，執行所述在接收到打開所述圖片標識對應的目標圖片的指令時，播放所述場景音樂標識對應的音樂文件的步驟。
[0032]根據本公開實施例的第二方面，提供一種基於圖片內容播放音樂的裝置，包括:
[0033]第一獲取模塊，用於獲取圖庫中的目標圖片和所述目標圖片的圖片標識；
[0034]第一提取模塊，用於提取所述目標圖片的圖像特徵；
[0035]判定模塊，用於利用預先生成的場景判定模型判定出所述目標圖片的圖像特徵對應的場景標籤；
[0036]確定模塊，用於確定與所述場景標籤對應的場景音樂標識；
[0037]建立模塊，用於建立所述圖片標識與所述場景音樂標識的對應關係；
[0038]播放模塊，用於在接收到打開所述圖片標識對應的目標圖片的指令時，播放所述場景音樂標識對應的音樂文件。
[0039]可選的，所述裝置還包括:
[0040]場景標籤創建模塊，用於創建場景標籤；
[0041]第二獲取模塊，用於獲取與每個場景標籤對應的指定場景圖片；
[0042]第二提取模塊，用於提取所述每個場景標籤對應的指定場景圖片的圖像特徵；
[0043]場景訓練模塊，用於利用預設機器學習方法對所述每個場景標籤對應的指定場景圖片的圖像特徵進行訓練，生成所述場景判定模型。
[0044]可選的，所述裝置還包括:
[0045]第一判斷模塊，用於判斷所述場景標籤是否為人臉圖像；
[0046]第一執行模塊，用於在所述場景標籤為所述人臉圖像時，利用預先生成的人臉判定模型判定出所述目標圖片的圖像特徵對應的表情標籤，確定與所述表情標籤對應的表情音樂標識，建立所述圖片標識與所述表情音樂標識的對應關係，在接收到打開所述圖片標識對應的目標圖片的指令時，播放所述表情音樂標識對應的音樂文件；在所述場景標籤不為所述人臉圖像時，執行所述確定模塊。
[0047]可選的，所述裝置還包括:
[0048]表情標籤創建模塊，用於創建表情標籤；
[0049]第三獲取模塊，用於獲取與每個表情標籤對應的指定表情圖片；
[0050]第三提取模塊，用於提取所述每個場景標籤對應的指定表情圖片的圖像特徵；
[0051]人臉訓練模塊，用於利用預設機器學習方法對所述每個場景標籤對應的指定表情圖片的圖像特徵進行訓練，生成所述人臉判定模型。
[0052]可選的，所述裝置還包括:
[0053]第二判斷模塊，用於判斷所述圖庫中是否存在未被所述場景判定模型判定過的圖片;
[0054]第二執行模塊，用於在所述圖庫中存在未被所述場景判定模型判定過的圖片時，將所述圖庫中未被所述場景判定模型判定過的圖片確定為目標圖片，並獲取所述目標圖片的圖片標識，執行所述第一提取模塊；在所述圖庫中不存在未被所述場景判定模型判定過的圖片時，執行所述播放模塊。
[0055]根據本公開實施例的第三方面，提供一種基於圖片內容播放音樂的裝置，包括:
[0056]處理器；
[0057]用於存儲處理器可執行指令的存儲器；
[0058]其中，所述處理器被配置為:
[0059]獲取圖庫中的目標圖片和所述目標圖片的圖片標識；
[0060]提取所述目標圖片的圖像特徵；
[0061]利用預先生成的場景判定模型判定出所述目標圖片的圖像特徵對應的場景標籤;
[0062]確定與所述場景標籤對應的場景音樂標識；
[0063]建立所述圖片標識與所述場景音樂標識的對應關係；
[0064]在接收到打開所述圖片標識對應的目標圖片的指令時，播放所述場景音樂標識對應的音樂文件。
[0065]本公開的實施例提供的技術方案可以包括以下有益效果:利用預先生成的場景判定模型判定出目標圖片的圖像特徵對應的場景標籤，再利用場景標籤與場景音樂標識的對應關係建立圖片標識與場景音樂標識的對應關係，一旦接收到打開圖片標識對應的目標圖片的指令，便會播放場景音樂標識對應的音樂文件。因此，本公開提供的方案可以根據圖片內容播放適合的音樂，從而降低用戶的操作複雜度，並節省用戶的時間。
[0066]應當理解的是，以上的一般描述和後文的細節描述僅是示例性和解釋性的，並不能限制本公開。

【專利附圖】

【附圖說明】
[0067]此處的附圖被併入說明書中並構成本說明書的一部分，示出了符合本發明的實施例，並與說明書一起用於解釋本發明的原理。
[0068]圖1是根據一示例性實施例示出的一種基於圖片內容播放音樂的方法的流程圖。
[0069]圖2是根據一示例性實施例示出的一種基於圖片內容播放音樂的方法的流程圖。
[0070]圖3是根據一示例性實施例示出的一種基於圖片內容播放音樂的裝置的示意圖。
[0071]圖4是根據一示例性實施例示出的另一種基於圖片內容播放音樂的裝置的示意圖。
[0072]圖5是根據一示例性實施例示出的又一種基於圖片內容播放音樂的裝置的示意圖。
[0073]圖6是根據一示例性實施例示出的又一種基於圖片內容播放音樂的裝置的示意圖。
[0074]圖7是根據一示例性實施例示出的又一種基於圖片內容播放音樂的裝置的示意圖。
[0075]圖8是根據一示例性實施例示出的一種基於圖片內容播放音樂的裝置的框圖。

【具體實施方式】
[0076]這裡將詳細地對示例性實施例進行說明，其示例表示在附圖中。下面的描述涉及附圖時，除非另有表示，不同附圖中的相同數字表示相同或相似的要素。以下示例性實施例中所描述的實施方式並不代表與本發明相一致的所有實施方式。相反，它們僅是與如所附權利要求書中所詳述的、本發明的一些方面相一致的裝置和方法的例子。
[0077]實施例一
[0078]圖1是根據一示例性實施例示出的一種基於圖片內容播放音樂的方法的流程圖，如圖1所示，圖1所示的基於圖片內容播放音樂的方法可以用於終端中。本公開提供的基於圖片內容播放音樂的方法可以根據圖片內容播放適合的音樂，從而降低用戶的操作複雜度，並節省用戶的時間，進而提高了用戶的體驗度。該方法包括以下步驟。
[0079]在步驟Sll中，獲取圖庫中的目標圖片和目標圖片的圖片標識。
[0080]其中，圖庫中可以存放至少一張目標圖片。目標圖片可以為各種格式的圖片類型，例如，目標圖片可以為BMP或JPG等各種類型的圖片。目標圖片的圖片標識為唯一確定目標圖片的標識，例如，目標圖片的圖片標識可以為目標圖片的名稱。
[0081]在步驟S12中，提取目標圖片的圖像特徵。
[0082]其中，目標圖片的圖像特徵可以為目標圖片的H0G(Histogram of OrientedGradient，方向梯度直方圖)特徵，當然，圖像特徵也可以為其他類型的特徵，所以圖像特徵並不局限於HOG特徵。
[0083]在步驟S13中，利用預先生成的場景判定模型判定出目標圖片的圖像特徵對應的場景標籤。
[0084]其中，場景標籤可以為多種類型的標籤，例如，場景標籤可以包括寵物、風景和人像等類型，場景標籤可以由用戶預先自行設定。場景判定模型為預先生成的一種判定模型，場景判定模型用於識別出目標圖片的圖像特徵對應哪一種場景標籤，例如，目標圖片為一張小貓的圖片，那麼場景判定模型便可以識別出目標圖片的圖像特徵對應的場景標籤為寵物。又如，目標圖片為一張中年男子的圖片，那麼場景判定模型便可以識別出目標圖片的圖像特徵對應的場景標籤為人像。再如，目標圖片為一張桂林山水的圖片，那麼場景判定模型便可以識別出目標圖片的圖像特徵對應的場景標籤為風景。
[0085]另外，場景判定模型可以通過以下步驟進行生成:第一步，創建場景標籤；第二步，獲取與每個場景標籤對應的指定場景圖片；第三步，提取每個場景標籤對應的指定場景圖片的圖像特徵；第四步，利用預設機器學習方法對每個場景標籤對應的指定場景圖片的圖像特徵進行訓練，生成所述場景判定模型。
[0086]下面舉例說明上述生成場景判定模型的步驟。首先，創建三個場景標籤，這三個場景標籤分別為寵物、風景和人像。其次，分別收集寵物圖片、風景圖片和人像圖片各一萬張，其中，收集到的一萬張寵物圖片可以包括貓類、狗類、蛇類、寵物鼠類和魚類等與寵物相關的圖片，收集到的一萬張風景圖片可以包括高山、河水、沙漠、海邊、樹木、草地、瀑布、彩虹、雲彩和名勝古蹟等與風景相關的圖片，收集到的一萬張人像圖片可以包括兒童面部圖像、老人面部圖像、少女面部圖像和成人面部圖像等與人像相關的圖片。再次，將收集到的三萬張圖片縮放到統一大小，例如，將這三萬張圖片均縮放到解析度為200X200的大小。然後，分別提取出縮放後的三萬張圖片的圖像特徵，例如，分別提取出縮放後的三萬張圖片的HOG特徵。最後，利用預設機器學習方法對三個場景標籤分別對應的一萬張場景圖片的圖像特徵進行訓練以生成場景判定模型，例如，預設機器學習方法可以為SVM(Support VectorMachine,支持向量機)方法,通過SVM方法可以訓練出一個場景判定模型,這個場景判定模型可以識別出與寵物、風景和人像相近似的圖片，並判定出該圖片屬於上述三種場景標籤中的哪種場景標籤。
[0087]在步驟S14中，確定與場景標籤對應的場景音樂標識。
[0088]其中，場景音樂標識可以為音樂文件的名稱，也可以為一個具有多個音樂文件的音樂文件夾的名稱。場景標籤與場景音樂標識的對應關係可以是用戶預先建立好的，例如，假設場景標籤包括寵物標籤、風景標籤和人像標籤，用戶分別建立寵物標籤與場景音樂標識A的對應關係、風景標籤與場景首樂標識B的對應關係和人像標籤與場景首樂標識C的對應關係。在用戶建立場景標籤與場景音樂標識的對應關係的過程中，用戶可以選擇一些與場景標籤相匹配的場景音樂標識，例如，對於寵物標籤，可以選擇音樂節奏較為歡快、愉悅的音樂類型；又如，對於風景標籤，可以選擇一些古典音樂類型。
[0089]在步驟S15中，建立圖片標識與場景首樂標識的對應關係。
[0090]其中，在選擇好場景音樂標識後，建立圖片標識與場景音樂標識的對應關係，以便於在打開圖片標識對應的目標圖片時，能夠播放場景音樂標識對應的音樂文件。
[0091]在步驟S16中，在接收到打開圖片標識對應的目標圖片的指令時，播放場景音樂標識對應的音樂文件。
[0092]其中，每個場景音樂標識均對應有一個或多個音樂文件。如果一個場景音樂標識對應有一個音樂文件，那麼在接收到打開圖片標識對應的目標圖片的指令時，播放場景音樂標識對應的一個音樂文件；如果一個場景音樂標識對應有對個音樂文件，那麼在接收到打開圖片標識對應的目標圖片的指令時，依次播放場景音樂標識對應的多個音樂文件。
[0093]在圖1所示的實施例中，本公開利用預先生成的場景判定模型判定出目標圖片的圖像特徵對應的場景標籤，再利用場景標籤與場景音樂標識的對應關係建立圖片標識與場景音樂標識的對應關係，一旦接收到打開圖片標識對應的目標圖片的指令，便會播放場景音樂標識對應的音樂文件。因此，本公開提供的方案可以根據圖片內容播放適合的音樂，從而降低用戶的操作複雜度，並節省用戶的時間。
[0094]在本公開的一個可選的實施例中，在步驟S15之後，且在步驟S16之前，本公開提供的方法還可以包括以下步驟:判斷圖庫中是否存在未被場景判定模型判定過的圖片；在圖庫中存在未被場景判定模型判定過的圖片時，將圖庫中未被場景判定模型判定過的圖片確定為目標圖片，並獲取目標圖片的圖片標識，執行步驟S12;在圖庫中不存在未被場景判定模型判定過的圖片時，執行步驟S16。這樣做的目的是，可以使圖庫中所有的圖片均與不同的場景音樂標識建立對應關係，從而保證用戶在打開圖庫中的任意一個圖片時，都會播放與場景音樂標識對應的音樂文件。
[0095]實施例二
[0096]圖2是根據一示例性實施例示出的另一種基於圖片內容播放音樂的方法的流程圖，如圖2所示，圖2所示的基於圖片內容播放音樂的方法可以用於終端中。其中，本實施例是在實施例一的基礎上進行的改進，所以本實施例中與實施例一的相同之處請參見實施例一即可。本公開提供的基於圖片內容播放音樂的方法可以對具有人臉圖像的目標圖片單獨的進行人臉表情的判定，根據不同的人臉表情播放出與人臉表情相適應的音樂文件，從而提高了用戶的體驗度。該方法包括以下步驟。
[0097]在步驟S21中，獲取圖庫中的目標圖片和目標圖片的圖片標識。
[0098]在步驟S22中，提取目標圖片的圖像特徵。
[0099]在步驟S23中，利用預先生成的場景判定模型判定出目標圖片的圖像特徵對應的場景標籤。
[0100]在步驟S24中，判斷場景標籤是否為人臉圖像，如果是，則執行步驟S25 ;否則，執行步驟S26。
[0101]在步驟S25中，利用預先生成的人臉判定模型判定出目標圖片的圖像特徵對應的表情標籤，確定與表情標籤對應的表情首樂標識，建立圖片標識與表情首樂標識的對應關係，在接收到打開圖片標識對應的目標圖片的指令時，播放表情音樂標識對應的音樂文件。
[0102]其中，由於人臉圖像的表情較為多樣，所以為了使不同表情的人臉圖像對應不同的音樂，需要再劃分出幾種表情標籤，以使人臉判定模型判定出目標圖片的圖像特徵對應的表情標籤。例如，表情標籤可以包括大笑、驚奇和生氣等標籤，表情標籤可以由用戶預先自行設定。人臉判定模型為預先生成的一種判定模型，人臉判定模型用於識別出目標圖片的圖像特徵對應哪一種表情標籤，例如，目標圖片為一張處於大笑狀態的人臉圖片，那麼人臉判定模型便可以識別出目標圖片的圖像特徵對應的表情標籤為大笑。
[0103]另外，人臉判定模型可以通過以下步驟進行生成:第一步，創建表情標籤；第二步，獲取與每個表情標籤對應的指定表情圖片；第二步，提取每個場景標籤對應的指定表情圖片的圖像特徵；第四步，利用預設機器學習方法對每個場景標籤對應的指定表情圖片的圖像特徵進行訓練，生成所述人臉判定模型。
[0104]下面舉例說明上述生成人臉判定模型的步驟。首先，創建三個表情標籤，這三個表情標籤分別為大笑、驚奇和生氣。其次，分別收集人臉大笑圖片、人臉驚奇圖片和人臉生氣圖片各一萬張，其中，收集到的一萬張人臉大笑圖片可以包括兒童的人臉大笑圖片、少女的人臉大笑圖片、成年人的人臉大笑圖片和老人的人臉大笑圖片等與人臉大笑相關的圖片，收集到的一萬張人臉驚奇圖片可以包括兒童的人臉驚奇圖片、少女的人臉驚奇圖片、成年人的人臉驚奇圖片和老人的人臉驚奇圖片等與人臉驚奇相關的圖片，收集到的一萬張人臉驚奇圖片可以包括兒童的人臉生氣圖片、少女的人臉生氣圖片、成年人的人臉生氣圖片和老人的人臉生氣圖片等與人臉驚奇相關的圖片。再次，將收集到的三萬張圖片縮放到統一大小，例如，將這三萬張圖片均縮放到解析度為120X120的大小。然後，分別提取出縮放後的三萬張圖片的圖像特徵，例如，分別提取出縮放後的三萬張圖片的gabor紋理特徵。最後，利用預設機器學習方法對三個表情標籤分別對應的一萬張人臉表情圖片的圖像特徵進行訓練以生成人臉判定模型，例如，預設機器學習方法可以為SVM方法，通過SVM方法可以訓練出一個人臉判定模型，這個人臉判定模型可以識別出與大笑、驚奇和生氣相近似的圖片，並判定出該圖片屬於上述三種表情標籤中的哪種表情標籤。
[0105]另外，表情音樂標識可以為音樂文件的名稱，也可以為一個具有多個音樂文件的音樂文件夾的名稱。表情標籤與表情音樂標識的對應關係是預先建立好的，例如，假設表情標籤包括大笑標籤、驚奇標籤和生氣標籤，分別建立大笑標籤與表情音樂標識A的對應關係、驚奇標籤與表情首樂標識B的對應關係和生氣標籤與表情首樂標識C的對應關係。在建立表情標籤與表情音樂標識的對應關係的過程中，可以選擇一些與表情標籤相匹配的表情音樂標識，例如，對於大笑標籤，可以選擇音樂節奏較為喜慶的音樂類型。在選擇好表情音樂標識後，建立圖片標識與表情音樂標識的對應關係，以便於在打開圖片標識對應的目標圖片時，能夠播放表情音樂標識對應的音樂文件。而且，每個表情音樂標識均對應有一個或多個音樂文件。如果一個表情音樂標識對應有一個音樂文件，那麼在接收到打開圖片標識對應的目標圖片的指令時，播放表情音樂標識對應的一個音樂文件；如果一個表情音樂標識對應有對個音樂文件，那麼在接收到打開圖片標識對應的目標圖片的指令時，依次播放表情音樂標識對應的多個音樂文件。
[0106]在步驟S26中，確定與場景標籤對應的場景音樂標識。
[0107]在步驟S27中，建立圖片標識與場景首樂標識的對應關係。
[0108]在步驟S28中，在接收到打開圖片標識對應的目標圖片的指令時，播放場景音樂標識對應的音樂文件。
[0109]在圖2所示的實施例中，本公開提供的方案在目標圖片的圖像特徵對應的場景標籤為人臉圖像時，可以確定出該目標圖片的圖像特徵對應的表情標籤，從而在接收到打開圖片標識對應的目標圖片的指令時，播放表情音樂標識對應的音樂文件，所以本公開可以對具有人臉圖像的目標圖片單獨的進行人臉表情的判定，最終根據不同的人臉表情播放出與人臉表情相適應的音樂文件，進而提高了用戶的體驗度。
[0110]實施例三
[0111]圖3是根據一示例性實施例示出的一種基於圖片內容播放音樂的裝置的示意圖。本公開提供的基於圖片內容播放音樂的裝置可以根據圖片內容播放適合的音樂，從而降低用戶的操作複雜度，並節省用戶的時間，進而提高了用戶的體驗度。參照圖3，該裝置包括第一獲取模塊11、第一提取模塊12、判定模塊13、確定模塊14、建立模塊15和播放模塊16。其中:
[0112]第一獲取模塊11，用於獲取圖庫中的目標圖片和目標圖片的圖片標識。
[0113]第一提取模塊12，用於提取目標圖片的圖像特徵。
[0114]判定模塊13，用於利用預先生成的場景判定模型判定出目標圖片的圖像特徵對應的場景標籤。
[0115]確定模塊14,用於確定與場景標籤對應的場景音樂標識。
[0116]建立模塊15,用於建立圖片標識與場景音樂標識的對應關係。
[0117]播放模塊16，用於在接收到打開圖片標識對應的目標圖片的指令時，播放場景音樂標識對應的音樂文件。
[0118]圖4是根據一示例性實施例示出的另一種基於圖片內容播放音樂的裝置的示意圖。參照圖4，該裝置包括場景標籤創建模塊21、第二獲取模塊22、第二提取模塊23、場景訓練模塊24、第一獲取模塊25、第一提取模塊26、判定模塊27、確定模塊28、建立模塊29和播放模塊210。其中:
[0119]場景標籤創建模塊21，用於創建場景標籤。
[0120]第二獲取模塊22，用於獲取與每個場景標籤對應的指定場景圖片。
[0121]第二提取模塊23，用於提取每個場景標籤對應的指定場景圖片的圖像特徵。
[0122]場景訓練模塊24，用於利用預設機器學習方法對每個場景標籤對應的指定場景圖片的圖像特徵進行訓練，生成所述場景判定模型。
[0123]第一獲取模塊25，用於獲取圖庫中的目標圖片和目標圖片的圖片標識。
[0124]第一提取模塊26，用於提取目標圖片的圖像特徵。
[0125]判定模塊27，用於利用預先生成的場景判定模型判定出目標圖片的圖像特徵對應的場景標籤。
[0126]確定模塊28,用於確定與場景標籤對應的場景音樂標識。
[0127]建立模塊29，用於建立圖片標識與場景音樂標識的對應關係。
[0128]播放模塊210，用於在接收到打開圖片標識對應的目標圖片的指令時，播放場景音樂標識對應的音樂文件。
[0129]圖5是根據一示例性實施例示出的又一種基於圖片內容播放音樂的裝置的示意圖。參照圖5，該裝置包括第一獲取模塊31、第一提取模塊32、判定模塊33、第一判斷模塊34、第一執行模塊35、確定模塊36、建立模塊37和播放模塊38。其中:
[0130]第一獲取模塊31，用於獲取圖庫中的目標圖片和目標圖片的圖片標識。
[0131]第一提取模塊32，用於提取目標圖片的圖像特徵。
[0132]判定模塊33，用於利用預先生成的場景判定模型判定出目標圖片的圖像特徵對應的場景標籤。
[0133]第一判斷模塊34，用於判斷場景標籤是否為人臉圖像。
[0134]第一執行模塊35，用於在場景標籤為人臉圖像時，利用預先生成的人臉判定模型判定出目標圖片的圖像特徵對應的表情標籤，確定與表情標籤對應的表情首樂標識，建立圖片標識與表情首樂標識的對應關係，在接收到打開圖片標識對應的目標圖片的指令時，播放表情音樂標識對應的音樂文件。在場景標籤不為人臉圖像時，執行確定模塊36。
[0135]確定模塊36,用於確定與場景標籤對應的場景音樂標識。
[0136]建立模塊37,用於建立圖片標識與場景音樂標識的對應關係。
[0137]播放模塊38，用於在接收到打開圖片標識對應的目標圖片的指令時，播放場景音樂標識對應的音樂文件。
[0138]圖6是根據一示例性實施例示出的又一種基於圖片內容播放音樂的裝置的示意圖。參照圖6，該裝置包括表情標籤創建模塊41、第三獲取模塊42、第三提取模塊43、人臉訓練模塊44、第一獲取模塊45、第一提取模塊46、判定模塊47、第一判斷模塊48、第一執行模塊49、確定模塊410、建立模塊411和播放模塊412。其中:
[0139]表情標籤創建模塊41，用於創建表情標籤。
[0140]第三獲取模塊42，用於獲取與每個表情標籤對應的指定表情圖片。
[0141]第三提取模塊43，用於提取每個場景標籤對應的指定表情圖片的圖像特徵。
[0142]人臉訓練模塊44，用於利用預設機器學習方法對每個場景標籤對應的指定表情圖片的圖像特徵進行訓練，生成所述人臉判定模型。
[0143]第一獲取模塊45，用於獲取圖庫中的目標圖片和目標圖片的圖片標識。
[0144]第一提取模塊46，用於提取目標圖片的圖像特徵。
[0145]判定模塊47，用於利用預先生成的場景判定模型判定出目標圖片的圖像特徵對應的場景標籤。
[0146]第一判斷模塊48，用於判斷場景標籤是否為人臉圖像。
[0147]第一執行模塊49，用於在場景標籤為人臉圖像時，利用預先生成的人臉判定模型判定出目標圖片的圖像特徵對應的表情標籤，確定與表情標籤對應的表情首樂標識，建立圖片標識與表情首樂標識的對應關係，在接收到打開圖片標識對應的目標圖片的指令時，播放表情音樂標識對應的音樂文件。在場景標籤不為人臉圖像時，執行確定模塊36。
[0148]確定模塊410,用於確定與場景標籤對應的場景音樂標識。
[0149]建立模塊411,用於建立圖片標識與場景音樂標識的對應關係。
[0150]播放模塊412，用於在接收到打開圖片標識對應的目標圖片的指令時，播放場景音樂標識對應的音樂文件。
[0151]圖7是根據一示例性實施例示出的又一種基於圖片內容播放音樂的裝置的示意圖。參照圖7，該裝置包括第一獲取模塊51、第一提取模塊52、判定模塊53、確定模塊54、建立模塊55、第二判斷模塊56、第二執行模塊57和播放模塊58。其中:
[0152]第一獲取模塊51，用於獲取圖庫中的目標圖片和目標圖片的圖片標識。
[0153]第一提取模塊52，用於提取目標圖片的圖像特徵。
[0154]判定模塊53，用於利用預先生成的場景判定模型判定出目標圖片的圖像特徵對應的場景標籤。
[0155]確定模塊54,用於確定與場景標籤對應的場景音樂標識。
[0156]建立模塊55,用於建立圖片標識與場景音樂標識的對應關係。
[0157]第二判斷模塊56，用於判斷圖庫中是否存在未被場景判定模型判定過的圖片。
[0158]第二執行模塊57，用於在圖庫中存在未被場景判定模型判定過的圖片時，將圖庫中未被場景判定模型判定過的圖片確定為目標圖片，並獲取目標圖片的圖片標識，執行第一提取模塊52。在圖庫中不存在未被場景判定模型判定過的圖片時，執行播放模塊58。
[0159]播放模塊58，用於在接收到打開圖片標識對應的目標圖片的指令時，播放場景音樂標識對應的音樂文件。
[0160]實施例四
[0161]圖8是根據一示例性實施例示出的一種基於圖片內容播放音樂的裝置800的框圖。例如，裝置800可以是行動電話，計算機，數字廣播終端，消息收發設備，遊戲控制臺，平板設備，醫療設備，健身設備，個人數字助理等。
[0162]參照圖8，裝置800可以包括以下一個或多個組件:處理組件802，存儲器804，電源組件806，多媒體組件808，音頻組件810，輸入/輸出(I/O)的接口 812，傳感器組件814，以及通信組件816。
[0163]處理組件802通常控制裝置800的整體操作，諸如與顯示，電話呼叫，數據通信，相機操作和記錄操作相關聯的操作。處理組件802可以包括一個或多個處理器820來執行指令，以完成上述的方法的全部或部分步驟。此外，處理組件802可以包括一個或多個模塊，便於處理組件802和其他組件之間的交互。例如，處理組件802可以包括多媒體模塊，以方便多媒體組件808和處理組件802之間的交互。
[0164]存儲器804被配置為存儲各種類型的數據以支持在裝置800的操作。這些數據的示例包括用於在裝置800上操作的任何應用程式或方法的指令，聯繫人數據，電話簿數據，消息，圖片，視頻等。存儲器804可以由任何類型的易失性或非易失性存儲設備或者它們的組合實現，如靜態隨機存取存儲器(SRAM)，電可擦除可編程只讀存儲器(EEPROM)，可擦除可編程只讀存儲器(EPROM)，可編程只讀存儲器(PROM)，只讀存儲器(ROM)，磁存儲器，快閃記憶體，磁碟或光碟。
[0165]電源組件806為裝置800的各種組件提供電力。電源組件806可以包括電源管理系統，一個或多個電源，及其他與為裝置800生成、管理和分配電力相關聯的組件。
[0166]多媒體組件808包括在裝置800和用戶之間的提供一個輸出接口的屏幕。在一些實施例中，屏幕可以包括液晶顯示器(LCD)和觸摸面板(TP)。如果屏幕包括觸摸面板，屏幕可以被實現為觸控螢幕，以接收來自用戶的輸入信號。觸摸面板包括一個或多個觸摸傳感器以感測觸摸、滑動和觸摸面板上的手勢。觸摸傳感器可以不僅感測觸摸或滑動動作的邊界，而且還檢測與觸摸或滑動操作相關的持續時間和壓力。在一些實施例中，多媒體組件808包括一個前置攝像頭和/或後置攝像頭。當裝置800處於操作模式，如拍攝模式或視頻模式時，前置攝像頭和/或後置攝像頭可以接收外部的多媒體數據。每個前置攝像頭和後置攝像頭可以是一個固定的光學透鏡系統或具有焦距和光學變焦能力。
[0167]音頻組件810被配置為輸出和/或輸入音頻信號。例如，音頻組件810包括一個麥克風(MIC)，當裝置800處於操作模式，如呼叫模式、記錄模式和語音識別模式時，麥克風被配置為接收外部音頻信號。所接收的音頻信號可以被進一步存儲在存儲器804或經由通信組件816發送。在一些實施例中，音頻組件810還包括一個揚聲器，用於輸出音頻信號。
[0168]I/O接口 812為處理組件802和外圍接口模塊之間提供接口，上述外圍接口模塊可以是鍵盤，點擊輪，按鈕等。這些按鈕可包括但不限於:主頁按鈕、音量按鈕、啟動按鈕和鎖定按鈕。
[0169]傳感器組件814包括一個或多個傳感器，用於為裝置800提供各個方面的狀態評估。例如，傳感器組件814可以檢測到裝置800的打開/關閉狀態，組件的相對定位，例如組件為裝置800的顯示器和小鍵盤，傳感器組件814還可以檢測裝置800或裝置800 —個組件的位置改變，用戶與裝置800接觸的存在或不存在，裝置800方位或加速/減速和裝置800的溫度變化。傳感器組件814可以包括接近傳感器，被配置用來在沒有任何的物理接觸時檢測附近物體的存在。傳感器組件814還可以包括光傳感器，如CMOS或CXD圖像傳感器，用於在成像應用中使用。在一些實施例中，該傳感器組件814還可以包括加速度傳感器，陀螺儀傳感器，磁傳感器，壓力傳感器或溫度傳感器。
[0170]通信組件816被配置為便於裝置800和其他設備之間有線或無線方式的通信。裝置800可以接入基於通信標準的無線網絡，如WiFi，2G或3G，或它們的組合。在一個示例性實施例中，通信組件816經由廣播信道接收來自外部廣播管理系統的廣播信號或廣播相關信息。在一個示例性實施例中，通信組件816還包括近場通信(NFC)模塊，以促進短程通信。例如，在NFC模塊可基於射頻識別(RFID)技術，紅外數據協會(IrDA)技術，超寬帶(UWB)技術，藍牙(BT)技術和其他技術來實現。
[0171]在示例性實施例中，裝置800可以被一個或多個應用專用集成電路(ASIC)、數位訊號處理器(DSP)、數位訊號處理設備(DSro)、可編程邏輯器件(PLD)、現場可編程門陣列(FPGA)、控制器、微控制器、微處理器或其他電子元件實現，用於執行上述方法。
[0172]在示例性實施例中，還提供了一種包括指令的非臨時性計算機可讀存儲介質，例如包括指令的存儲器804，上述指令可由裝置800的處理器820執行以完成上述方法。例如，非臨時性計算機可讀存儲介質可以是ROM、隨機存取存儲器(RAM)、CD-ROM、磁帶、軟盤和光數據存儲設備等。
[0173]一種非臨時性計算機可讀存儲介質，當存儲介質中的指令由移動終端的處理器執行時，使得移動終端能夠執行一種基於圖片內容播放音樂的方法，方法包括:獲取圖庫中的目標圖片和目標圖片的圖片標識；提取目標圖片的圖像特徵；利用預先生成的場景判定模型判定出目標圖片的圖像特徵對應的場景標籤；確定與場景標籤對應的場景音樂標識；建立圖片標識與場景音樂標識的對應關係；在接收到打開圖片標識對應的目標圖片的指令時，播放場景音樂標識對應的音樂文件。
[0174]本領域技術人員在考慮說明書及實踐這裡公開的發明後，將容易想到本發明的其它實施方案。本申請旨在涵蓋本發明的任何變型、用途或者適應性變化，這些變型、用途或者適應性變化遵循本發明的一般性原理並包括本公開未公開的本【技術領域】中的公知常識或慣用技術手段。說明書和實施例僅被視為示例性的，本發明的真正範圍和精神由下面的權利要求指出。
[0175]應當理解的是，本發明並不局限於上面已經描述並在附圖中示出的精確結構，並且可以在不脫離其範圍進行各種修改和改變。本發明的範圍僅由所附的權利要求來限制。
【權利要求】
1.一種基於圖片內容播放音樂的方法，其特徵在於，包括: 獲取圖庫中的目標圖片和所述目標圖片的圖片標識；提取所述目標圖片的圖像特徵；利用預先生成的場景判定模型判定出所述目標圖片的圖像特徵對應的場景標籤；確定與所述場景標籤對應的場景音樂標識；建立所述圖片標識與所述場景音樂標識的對應關係；在接收到打開所述圖片標識對應的目標圖片的指令時，播放所述場景音樂標識對應的首樂文件。
2.根據權利要求1所述的基於圖片內容播放音樂的方法，其特徵在於，所述方法還包括: 創建場景標籤；獲取與每個場景標籤對應的指定場景圖片；提取所述每個場景標籤對應的指定場景圖片的圖像特徵；利用預設機器學習方法對所述每個場景標籤對應的指定場景圖片的圖像特徵進行訓練，生成所述場景判定模型。
3.根據權利要求1所述的基於圖片內容播放音樂的方法，其特徵在於，所述方法還包括: 判斷所述場景標籤是否為人臉圖像；在所述場景標籤為所述人臉圖像時，利用預先生成的人臉判定模型判定出所述目標圖片的圖像特徵對應的表情標籤，確定與所述表情標籤對應的表情音樂標識，建立所述圖片標識與所述表情音樂標識的對應關係，在接收到打開所述圖片標識對應的目標圖片的指令時，播放所述表情音樂標識對應的音樂文件；在所述場景標籤不為所述人臉圖像時，執行所述確定與所述場景標籤對應的音樂標識的步驟。
4.根據權利要求3所述的基於圖片內容播放音樂的方法，其特徵在於，所述方法還包括: 創建表情標籤；獲取與每個表情標籤對應的指定表情圖片；提取所述每個場景標籤對應的指定表情圖片的圖像特徵；利用預設機器學習方法對所述每個場景標籤對應的指定表情圖片的圖像特徵進行訓練，生成所述人臉判定模型。
5.根據權利要求1所述的基於圖片內容播放音樂的方法，其特徵在於，所述方法還包括: 判斷所述圖庫中是否存在未被所述場景判定模型判定過的圖片；在所述圖庫中存在未被所述場景判定模型判定過的圖片時，將所述圖庫中未被所述場景判定模型判定過的圖片確定為目標圖片，並獲取所述目標圖片的圖片標識，執行所述提取所述目標圖片的圖像特徵的步驟；在所述圖庫中不存在未被所述場景判定模型判定過的圖片時，執行所述在接收到打開所述圖片標識對應的目標圖片的指令時，播放所述場景音樂標識對應的音樂文件的步驟。
6.一種基於圖片內容播放音樂的裝置，其特徵在於，包括: 第一獲取模塊，用於獲取圖庫中的目標圖片和所述目標圖片的圖片標識；第一提取模塊，用於提取所述目標圖片的圖像特徵；判定模塊，用於利用預先生成的場景判定模型判定出所述目標圖片的圖像特徵對應的場景標籤；確定模塊，用於確定與所述場景標籤對應的場景音樂標識；建立模塊，用於建立所述圖片標識與所述場景音樂標識的對應關係；播放模塊，用於在接收到打開所述圖片標識對應的目標圖片的指令時，播放所述場景首樂標識對應的首樂文件。
7.根據權利要求6所述的基於圖片內容播放音樂的裝置，其特徵在於，所述裝置還包括: 場景標籤創建模塊，用於創建場景標籤；第二獲取模塊，用於獲取與每個場景標籤對應的指定場景圖片；第二提取模塊，用於提取所述每個場景標籤對應的指定場景圖片的圖像特徵；場景訓練模塊，用於利用預設機器學習方法對所述每個場景標籤對應的指定場景圖片的圖像特徵進行訓練，生成所述場景判定模型。
8.根據權利要求6所述的基於圖片內容播放音樂的裝置，其特徵在於，所述裝置還包括: 第一判斷模塊，用於判斷所述場景標籤是否為人臉圖像；第一執行模塊，用於在所述場景標籤為所述人臉圖像時，利用預先生成的人臉判定模型判定出所述目標圖片的圖像特徵對應的表情標籤，確定與所述表情標籤對應的表情音樂標識，建立所述圖片標識與所述表情音樂標識的對應關係，在接收到打開所述圖片標識對應的目標圖片的指令時，播放所述表情音樂標識對應的音樂文件；在所述場景標籤不為所述人臉圖像時，執行所述確定模塊。
9.根據權利要求8所述的基於圖片內容播放音樂的裝置，其特徵在於，所述裝置還包括: 表情標籤創建模塊，用於創建表情標籤；第三獲取模塊，用於獲取與每個表情標籤對應的指定表情圖片；第三提取模塊，用於提取所述每個場景標籤對應的指定表情圖片的圖像特徵；人臉訓練模塊，用於利用預設機器學習方法對所述每個場景標籤對應的指定表情圖片的圖像特徵進行訓練，生成所述人臉判定模型。
10.根據權利要求6所述的基於圖片內容播放音樂的裝置，其特徵在於，所述裝置還包括:第二判斷模塊，用於判斷所述圖庫中是否存在未被所述場景判定模型判定過的圖片；第二執行模塊，用於在所述圖庫中存在未被所述場景判定模型判定過的圖片時，將所述圖庫中未被所述場景判定模型判定過的圖片確定為目標圖片，並獲取所述目標圖片的圖片標識，執行所述第一提取模塊；在所述圖庫中不存在未被所述場景判定模型判定過的圖片時，執行所述播放模塊。
11.一種基於圖片內容播放音樂的裝置，其特徵在於，包括: 處理器；用於存儲處理器可執行指令的存儲器；其中，所述處理器被配置為: 獲取圖庫中的目標圖片和所述目標圖片的圖片標識；提取所述目標圖片的圖像特徵；利用預先生成的場景判定模型判定出所述目標圖片的圖像特徵對應的場景標籤；確定與所述場景標籤對應的場景音樂標識；建立所述圖片標識與所述場景音樂標識的對應關係；在接收到打開所述圖片標識對應的目標圖片的指令時，播放所述場景音樂標識對應的音樂文件。
【文檔編號】G11B31/00GK104268547SQ201410432877
【公開日】2015年1月7日申請日期:2014年8月28日優先權日:2014年8月28日
【發明者】張濤, 陳志軍, 秦秋平申請人:小米科技有限責任公司

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

一種基於圖片內容播放音樂的方法及裝置製造方法

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法