新四季網

機器人裝置及其控制方法

2023-05-10 07:29:51 1

專利名稱:機器人裝置及其控制方法
技術領域:
本發明涉及機器人裝置(robot)及其控制方法,並且適合於應用到寵物機器人裝置。
背景技術:
最近,本專利申請人已經提出並開發了4條腿行走的寵物機器人裝置,它根據來自用戶和所處環境的指示行動。這樣的寵物機器人裝置形狀象普通家庭中飼養的狗或貓,並根據來自用戶和所處環境的指示自由行動。在下面說明中,一組動作被定義為『行為』。
想像一下,如果對這樣的寵物機器人裝置配備象真狗或真貓那樣能夠『成長』的功能,那麼用戶可以從寵物機器人裝置當中得到更親近和滿足的感覺,從而提高了寵物機器人裝置的娛樂性。
在給寵物機器人裝置配備『成長』功能的同時,如果再將一些新的設計合併在其中,使得在寵物機器人裝置不再成長或者在重新開始成長之前等待很長時間這種情況下,仍能夠使用戶對寵物機器人裝置的行為和動作保持興趣和防止用戶對其感到厭煩,那麼,人們就會從寵物機器人裝置身上得到多得多的樂趣。
發明公開本發明就是在考慮了上述情況之後作出的,因此,本發明的目的是提供一種從用戶角度來講可以提高娛樂性的機器人裝置以及對它的控制方法。
為了解決上述主題,為本發明的機器人裝置配備了行為和/或動作生成裝置,用於根據行為和/或動作模型生成行為和/或動作;以及行為和/或動作模型轉換裝置,用於根據來自外界的輸入歷史和它自身的行為和/或動作歷史的至少一個在給定定時上將行為和/或動作模型轉換成更高級的行為和/或動作模型,仿佛寵物機器人裝置正在『成長』一樣使行為和動作得到轉換。因此,可以實現這樣的機器人裝置,對用戶來說,其娛樂質量(娛樂性)得到極大提高。
此外,還為本發明的機器人裝置配備了行為和/或動作生成裝置,用於根據行為和動作模型生成行為和/或動作;第一轉換裝置,用於按照一組第一給定條件,將行為和/或動作逐級轉換成更高級的行為和/或動作;和第二轉換裝置,用於根據來自外界的輸入歷史和它自身的行為和/或動作歷史的至少一個,按照一組第二給定條件將行為和/或動作模型轉換成同級或更低級的行為和/或動作,從而防止用戶對機器人裝置的行為和動作感到厭倦。因此,可以實現這樣的機器人裝置,對用戶來說,其娛樂質量(娛樂性)進一步得到提高。
並且,還為本發明的機器人裝置配備了行為和/或動作生成裝置,用於根據行為和/或動作模型生成行為和/或動作;以及行為和/或動作轉換裝置,用於按照給定評估函數對其自身的行為進行評估,再根據該評估所得的評估結果在給定定時上將行為和/或動作轉換成更高成長級的行為和/或動作模型。這樣,仿佛機器人裝置正在成長一樣使行為和動作得到變換。因此,可以實現這樣的機器人裝置,對用戶來說,其娛樂質量(娛樂性)極大地得到提高。
並且,還為本發明含有多種行為和/或動作模型以生成多種行為和/或動作的機器人裝置配備了行為和/或動作生成裝置,用於根據行為模式的相應行為和/或動作模型,生成行為和/或動作;和轉換裝置,用於轉換每種行為模式相應的行為和/或動作模型,用該裝置行為模式相應的每種行為和/或動作模型可以用為每種行為和/或動作模型預置的不同規則來轉換,使得機器人裝置的個性可以多樣化。因此,可以實現這樣的機器人裝置,其娛樂質量(娛樂性)極大地得到提高。
並且,本發明用於機器人裝置的控制方法包括第一步驟,根據行為和/或動作模型生成行為和/或動作;和第二步驟,根據來自外界的輸入歷史和其自身的行為和/或動作歷史的至少一個在給定定時上將行為和/或動作模型轉換成更高級的行為和/或動作模型,仿佛機器人裝置正在成長一樣使行為和動作可以得到轉換。因此,可以實現這樣的控制方法,藉此機器人裝置的娛樂質量(娛樂性)得到顯著提高。
並且,本發明用於機器人裝置的控制方法包括第一步驟,根據行為和/或動作模型生成行為和/或動作;和第二步驟,按照第一給定條件將行為和/或動作模型轉換成更高成長級的行為和/或動作模型,和根據來自外界的輸入歷史和其自身的行為和/或動作歷史的至少一個,按照第二給定條件將行為和/或動作模型轉換成相同或更低成長級的行為和/或動作模型,從而有效地防止用戶對機器人裝置的行為和動作感到厭倦。因此,可以實現這樣的控制方法,它顯著地提高了機器人裝置的娛樂性。
並且,本發明用於機器人裝置的控制方法包括第一步驟,根據行為和動作模型生成行為和/或動作;和第二步驟,按照給定評估函數對其自身的行為進行評估,再根據該評估所得的評估結果在給定定時上將行為和/或動作轉換成更高成長級的行為和動作模型,仿佛機器人裝置正在成長一樣使行為和動作得到轉換。因此,可以實現這樣用於機器人裝置的控制方法,其娛樂性得到顯著提高。
並且,本發明用於含有多種行為和/或動作模型以生成多種行為模式的機器人裝置的控制方法,包括第一步驟,根據對應行動模式的每種行為和/或動作生成行為和/或動作;和第二步驟,響應來自外界的影響轉換相應行為模式的每種行為和/或動作模型,或按照為每種行為和/或動作模型預置的不同規則轉換每種行為模式相對應的行為和/或動作模型,使得機器人裝置的個性可以多樣化。因此,可以實現這樣的用於機器人裝置的控制方法,它極大地提高了娛樂質量(娛樂性)。
附圖簡述

圖1是具體實施本發明的寵物機器人裝置的外部結構的透視圖;圖2是寵物機器人裝置的電路結構的方塊圖;圖3是成長模型的示意圖;圖4是有助於描述控制器的處理的方塊圖;圖5是有助於描述在感情/本能模型化單元中的數據處理的示意圖;圖6是概率自動機(probability automation)的示意圖;圖7是狀態變換的示意圖;圖8是有助於描述定向圖的示意圖;圖9是用於全身的定向圖的示意圖;圖10是用於頭部的定向圖的示意圖;圖11是用於腿部的定向圖的示意圖;圖12是用於尾部的定向圖的示意圖;圖13是第1成長要素列表和第1成長要素計數表的示意圖;圖14是第2成長要素列表和第2成長要素計數表的示意圖;圖15是成長控制處理過程的流程圖;圖16是其它實施例的示意圖;
圖17是其它實施例的示意圖;圖18是在第2實施例中成長模型的示意圖;圖19是有助於描述第2實施例中控制器的處理的方塊圖;圖20是有助於描述對伴隨著成長的行為模式的記憶的獲取和忘記的示意圖;圖21是有助於描述不同文檔的示意圖;圖22是有助於描述用於行為和動作模型的轉換方法的示意圖;圖23是有助於描述其它實施例的示意圖;圖24是第3實施例中行為模式轉換和後退模型的示意圖;圖25是有助於描述第3實施例中控制器的處理的方塊圖;圖26是第1行為模式要素列表和第1行為模式要素計數表的示意圖;圖27是第2行為模式要素列表和第2行為模式要素計數表的示意圖;圖28是後退要素列表和後退要素計數表的示意圖;圖29是後退狀態和後退狀態列表的示意圖;圖30是行為模式轉換處理過程的流程圖;圖31是後退處理過程的流程圖;圖32是其它實施例的示意圖;圖33是有助於描述第4實施例中控制器的處理的方塊圖;圖34是有助於為每種行為模式配備的數種行為和動作模型的示意圖;圖35是學習速度表的示意圖。
實施本發明的最佳模式下面舉例說明本發明的幾個優選實施例。(1)第一實施例(1-1)在實施本發明的第一模式中寵物機器人裝置的結構圖1中的「1」顯示第一實施例中寵物機器人裝置的整體概貌,其中腿部單元3A-3D與主體單元2相連接,分別處在左前、右前、左後和右後位置上;和頭部單元4和尾部單元分別位於前端和後端。
在這種情況中,如圖2所示,主體單元2容納了控制器10,控制寵物機器人裝置1的整體操作;電池11,作為寵物機器人1的電源;和內部傳感器單元15,由電池傳感器12、熱敏傳感器13和加速度傳感器14組成。
此外,位於頭部單元4的指定位置上的是外部傳感器單元19,包括分別用作寵物機器人裝置1的「耳朵」的麥克風14、用作『眼睛』和觸摸傳感器18的CCD(電荷耦合器件)攝像機17、和用作『嘴巴』的揚聲器。
致動器211~21n處在每個腿部單元3A~3D的關節上、每個腿部單元3A~3D與主體單元2的連接點上、頭部單元4與主體單元2的連接點上、以及尾部單元5與主體單元2的連接點上。
外部傳感器單元19的麥克風收集通過聲音命令器(圖中未示出)按音階(scale)給出的命令聲音,諸如『行走』、『躺下』或『追球』之類,所得的話音信號S1A饋送到控制器10。CCD攝像機拍攝周圍環境的照片,所得的圖像信號S1B傳送到控制器10。
從圖1可明顯看出,位於頭部單元4的上部的觸摸傳感器18檢測接收到的壓力,這個壓力是由於用戶通過諸如『撫摸』或『拍打』施加的物理影響產生的,檢測的結果作為壓力檢測信號S1C饋送到控制器。
內部傳感器單元15的電池傳感器12檢測電池11的剩餘能力,檢測的結果作為電池餘量檢測信號S2A傳送到控制器10。熱敏傳感器13檢測寵物機器人裝置1內部的溫度,其結果作為溫度檢測信號S2B傳送到控制器10。加速器傳感器14沿著3軸(X、Y和Z)方向檢測加速度,其結果作為加速度檢測信號S2C傳輸到控制器10。根據外部傳感器19給出的話音信號S1A、圖像信號S1B和壓力檢測信號S1C(下文將這兩個信號放在一起稱為外部信息信號S1)、內部傳感器單元15提供的電池餘量檢測信號S2A、溫度檢測信號S2B和加速度檢測信號S2C等(下文將它們放在一起稱為內部信息信號S2),控制器判斷外部和內部狀態以及來自用戶的命令或影響是否存在。
控制器10根據上述的判斷結果和預先存儲在存儲器10A中的控制程序確定下一個行為,並根據所得的結果驅動致動器211~21n,以便讓寵物機器人裝置1完成各種行為和動作,例如,上下左右晃動頭部單元4、搖動尾部單元5的尾巴5A、和驅動腿部單元3A~3D行走。
同時,控制器10按要求產生話音信號S3,這個話音信號S3饋送到揚聲器20,以便根據此話音信號S3向外發出聲音和使位於假定是寵物機器人裝置1的眼睛的位置上的LED(發光二極體,圖中未示出)閃爍。
按照這種方式,寵物機器人裝置1被設計成能夠響應它內部和外部的狀態以及來自用戶的命令和影響來自動地動作。除了上述操作之外,還可以將寵物機器人裝置1設計成,根據諸如用戶施加的影響和聲音命令之類輸入操作的歷史和它自身的行為和動作的歷史,轉換它的行為和動作使它仿佛象真的動物那樣不斷『成長』。
也就是說,從圖3可知,寵物機器人裝置1的成長過程包括『幼年』、『少年』、『青年』和『成年』四個階段。預先存儲在控制器10的存儲器10A中的是由各種控制參數和控制程序組成的行為和動作模型,它們形成了與四個項目有關的行為和動作的基礎每個『成長階段』的『步態』、『動作』、『行為』和『(吠叫)聲音』。
然後,控制器10控制每個致動器211~21n和話音輸出,以便根據在初始階段『幼年』的行為和動作模型,例如,對於『步態』,寵物機器人裝置1用窄的行走步伐、短的行走周期、低的腿部運動蹣跚行走;對於『動作』,寵物機器人1隻有象『行走』、『站立』和『躺下』之類『單調』動作的舉止;對於行為,寵物機器人裝置1隻完成『單調』的行為,如重複同一動作;對於『聲音』,通過降低話音信號S3的放大倍數,寵物機器人裝置用小而短的聲音吠叫。
同時,根據構成預定『成長』的多種要素(下文稱為『成長要素』),例如,通過聲音命令的命令輸入、由利用聲音命令輸入的與『撫摸』和『拍打』對應的命令輸入和完成預定行為和動作的成功次數構成的強化學習、通過觸摸傳感器18輸入的不與『撫摸』和『拍打』對應的傳感器輸入、諸如『玩球』之類的預定行為和動作,以及其它要素,控制器10監視並計數這些成長要素的出現次數。
根據這些成長要素出現頻次的累計總和,當每種成長要素出現次數的累計和的總計值(下文稱之為『成長要素綜合經驗值』)超過預置閾值時,控制器10轉換要使用的行為和動作模型,從用於『少年』的行為和動作模型到一組更高級的用於『青年』的行為和動作模型。
然後,控制器10根據用於『少年』的行為和動作模型,控制每個致動器211~21n和從揚聲音器20輸出的聲音,使得寵物機器人裝置1,對於『步態』,通過使每個致動器211~21n旋轉得更快,步伐周期更長,和腿升得更高,行走得更堅定一點。
對於『動作』,通過提高動作次數以『程度更高和更複雜』的動作運動;對於『行為』,通過根據前一行為決定下一行為使行為表現得『有點目的性』;和對於『聲音』,通過延長/放大話音信號的長度/幅度以『稍長』一點和稍大聲一點的『聲音』吠叫。
進一步,每當成長要素的綜合經驗值超過為『青年』或『成年』預定的每個閾值時,控制器10按照相同的方式依次將行為和動作模型轉換成用於『青年』或『成年』的更高作成長級的行為和動作模型。同時,每個致動器211~21n的旋轉速度根據相應的行為和動作模型而變化,以便使行走周期更長,腿升得更高,或者逐漸增大饋送到揚聲器20的話音聲音33的長度和放大倍數。也就是說,對於每種行為或動作致動器211~21n的旋轉次數是可變的。
結果,隨著成長階段不斷升級(從『幼年』到『少年』、從『少年』到『青年』、再從『青年』到『成年』),寵物機器人裝置1的『步態』從『蹣跚行走』轉換到『更堅定地行走』、『動作』從『單調的』『轉換到』程度更高的、複雜的『和『行為』從『單純的』轉換到『行為表現得有目的』,和『聲音』從小且短『逐級變化到『長且響』。
按照這種方式,寵物機器人裝置1按照來自外界的輸入和它自身的行為和動作的歷史被設計成分四個階段,即『幼年』、『少年』、『青年』和『成年』成長。
在此實施例中,從圖3可明顯看出,為『幼年』、『少年』、『青年』和『成年』的每個『成長階段』預備了數種行為和動作模型。
例如,在實際中,作為用於『少年』的行為和動作模型,提供行為和動作模型(少年1),按照該模型進行特定行為模式的行為和動作來表示迅速但粗野動作;和提供另一組行為和動作模型(童年2),進行特定行為模式的行為和動作來表示優雅和緩慢『文靜』動作。
對於『青年』的行為和動作模型,提供三組行為和動作模型青年1,進行與『少年』的『粗野』行為模式相比更迅速和更粗的『狂怒』動作的行為和動作的行為和動作模型;青年2,安排緩慢和流暢動作『正常』行為模式的行為和動作的行為和動作模型;青年3,安排帶有少量積極移動的動作緩慢得多的『平靜』行為模式的行為和動作的行為和動作模型。
進一步提供作為用於『成年』的行為和動作模型。成年1,安排具有更粗魯和更迅速移動特性的『攻擊性』行為模式的行為和動作,不遵從來自用戶的命令的動作進行行為和動作模型;成年2,安排具有更優雅和更緩慢移動特性的『有點粗野』行為模式,遵從來自用戶的命令進行動作的行動和動作模型;成年3,安排具有更優雅和更緩慢移動特性並且有少量動作的『有點平靜』行為模式的行為和動作,總是遵從來自用戶的命令進行動作的行為和動作模型;和成年4,安排具有緩慢得多移動特性並且帶有更少量動作的『文靜』作為模式的行為和動作,總是遵從來自用戶的命令進行動作的行為和動作模型。
將控制器10設計成,在升級『成長階段』的過程中,根據每個成長要素發生頻次數的累計和,從下一『成長階段』的行為和動作模型中選擇行為和動作模型之一,所述的行為和動作模型取代前面使用的行為和動作模型用於下一運動。
在這種情況中,在變換到『少年』之後的下一『成長階段』的過程中,當前『成長階段』的行為和動作模型只可以變換到下一『成長階段』的預定行為和動作模型,也就是,只能在與圖3所示的箭頭相連接的行為和動作模型中。因此,舉例來說,如果對『少年』選擇了安排『粗野』行為和動作的行為和動作模型『少年1』,那麼,就不允許寵物機器人裝置1變換到用於『青年』的、進行『文靜』行為和動作的行為和動作模型『青年3』。
按照這種方式,寵物機器人裝置1被設計成,隨著它不斷成長,它的『行為模式』根據來自用戶的影響和命令和它自身的行為和動作的歷史來轉換。(1-2)控制器10的處理下面描述寵物機器人裝置1的控制器10的具體處理。
如圖4所示,控制器10的處理內容從功能上分成如下幾部分*狀態識別機構單元30,用於識別外部和內部環境*感情/本能模型化單元31,用於根據狀態識別機構單元30識別的結果確定感情和本能的狀態*行為確定機構單元32,用於根據狀態識別機構單元30識別的結果和感情/本能模型化單元31的輸出確定下一行為或運動*姿勢變換機構單元33,用於根據寵物機器人裝置1進行由行為確定機構單元32確定的行為和動作制訂一系列動作的計劃*設備控制機構單元34,用於根據姿勢變換機構單元33所制訂的計劃控制致動器211~21n,和*成長控制機構單元35,用於控制『成長』。
現在對狀態識別機構單元30、感情/本能模型化單元31、行為確定機構單元32、姿勢變換機構單元33、設備控制機構單元34和成長控制機構單元35加以說明。
(1-2-1)狀態識別機構單元30的構成狀態識別機構單元30根據外部信息信號S1和內部信息信號S2識別特定狀態,其結果傳送到感情/本能模型化單元31和行為確定機構單元32。
在實際中,狀態識別機構單元30不斷監視外部傳感器單元19的麥克風16給出的話音信號S1A,並根據諸如『行走』、『躺下』或『追球』之類作為話音信號S1A的頻譜給出的命令,識別當檢測到相同音階的頻譜作為從聲音命令器輸出的命令聲音時給出的命令,其結果傳送到感情/本能模型化單元31和行為確定機構單元32。
狀態識別機構單元30也不斷監視CCD攝像機17(圖2)給出的圖像信號S1B,並且根據圖像信號S1B識別,例如,如果在圖像內檢測到『紅色、圓形的球』或『與地面垂直並高於地面的平面』,則認為『有一個球』或『有一牆壁』的狀態,其結果傳送到感情/本能模型化單元31和行為確定機構單元32。
並且,狀態識別機構單元30還不斷監視觸摸傳感器18(圖2)給出的壓力檢測信號SIC,並根據短時間間隔(例如,小於2秒)的壓力檢測信號S1C識別當檢測到壓力大於給定閾值時『拍打(責打)』的狀態,和對於長時間間隔(例如,大於2秒)當檢測到壓力小於給定閾值時『撫摸(表揚)』的狀態,其結果傳送到感情/本能模型化單元31和行為確定機構單元32。
狀態識別機構單元30還不斷監視外部傳感器單元15的加速度傳感器14(圖2)給出的加速度檢測信號S2C,並且根據加速度信號S2C識別當檢測到加速度大於例如預置的給定大小的加速度時『接受大中擊』的狀態,而當檢測到加速度是關於大於前者的重力加速度時『(從桌面等)掉下來』的狀態,其結果傳送到感情/本能模型化單元31和行為確定機構單元32。
此外,狀態識別機構單元30不斷監視溫度傳感器13(圖2)給出的溫度檢測信號S2B,並根據溫度檢測信號S2B識別當檢測到溫度大於給定值時『內部溫度已經上升』的狀態,其結果傳送到感情/本能模型化單元31和行為確定機構單元32。(1-2-2)感情/本能模型化單元31的處理如圖5所示,感情/本能模型化單元31包括基本感情/動作組40,由與下列六(6)種感情或動作的每一種相對應的感情模型組成『喜歡』、『悲傷』、『驚訝』、『恐懼』、『厭惡』和『憤怒』;和基本欲望組41,由與四(4)種欲望『食慾』、『愛情慾』、『求知慾』和『運動欲』之一相對應的作為欲望模型配備的欲望單元41A~41D和與感情/動作單元40A~40F和欲望單元41A~41D的每一個相對應地配備的強度增大/減小功能單元42A~42H。
感情/動作單元40A~40F的每一個用例如從0至100的等級指示相應感情或動作的強度,它以當前強度為基礎,根據強度增大/減小函數42A~42H給出的強度信息S11A~S11F而不斷變化。
與感情/動作單元40A~40F一樣,欲望單元41A~41D的每一個也用從0至100的等級指示相應欲望的強度,它以當前強度為基礎,根據強度增大/減小功能單元42G~42K給出的強度信息S12G~S12F而不斷變化。
感情/本能模型化單元31通過組合感情/動作單元40A~40F的強度確定感情的狀態,和通過組合欲望單元41A~41D的強度確定本能的狀態。感情和本能的狀態作為感情/本能狀態信息S12輸出到行為確定機構單元32上。
強度增大/減小功能單元42A~42G是用於根據狀態識別機構單元31給出的狀態識別信息S10和指示寵物機器人裝置1本身的當前或過去行為的內容的行為信息S13生成和輸出強度信息S11A~S11G的功能單元,強度信息S11A~S12G用於按照如上所述的預置參數增大或減小感情/動作單元40A~40F和欲望單元41A~41D的每一個的強度。
因此,對於每種行為和動作模型(幼年1、少年1、少年2、青年1~青年3、成年1~成年4),通過對強度增大/減小函數42A~42G的參數設置不同的值,就可以將諸如『惱怒』或『安靜』之類的特徵賦予寵物機器人裝置1。(1-2-3)行為確定機構單元32的處理行為確定機構單元32含有在存儲器10A內的多個行為模型,每一個對應於行為和動作模型(幼年1、少年1、少年2、青年1~青年3、成年1~成年4)的某一個。
並且,根據狀態識別機構單元30給出的狀態識別信息10、感情/本能模型化單元31的感情/動作單元40A~40F和欲望單元41A~41D的每一個的強度、和相應的行為模型,行為確定機構單元32確定下一行為或動作,其結果作為確定的行為信息14輸出到姿勢變換機構單元33和成長控制機構單元35上。
在該例中,行為確定機構單元32在用概率確定中,利用稱為概率自動機的算法作為確定下一行為或動作的手段,如圖6所示的特定節點(狀態)NDA0應該根據變換概率P0~Pn變換到包括其自身的下一行為或動作的節點NDA0~NDAn中的哪一個,變換概率P0~Pn的每一個被設置成與節點NDA0~NDAn相連接的弧線ARA0~ARAn。
更具體地說,存儲器10A存儲如圖7所示的、作為行為模型用於每個節點NDA0~NDAn的狀態變換表50,行為確定機構單元32根據這個狀態變換表50確定下一行為或運動。
在此狀態變換表50中,作為節點NDA0~NDAn中變換條件的輸入事件(認別結果)按優先級列舉在『輸入事件』行上,並且在與『數據名』和『數據範圍』列相對應的列上描述了關於變換條件的條件。
因此,在圖7所示的狀態變換表50上的節點ND100中,給定識別結果『檢測到一個球(BALL)』,這個識別本身和在給定球的『尺寸』是在『從0至1000(0,1000)』的範圍內的同時給出的事件是當前節點ND100變換到另一個節點的條件。同樣,給定識別結果『檢測到一個障礙物(OBSTACLE)』,這個識別結果本身和在離障礙物的『距離(DISTANCE)』是在『從0至100(0,100)』的範圍內的同時給出的事件是當前節點ND100變換到另一個節點的條件。
因此,如果沒有識別結果輸入到節點ND100,但如果由行為確定機構單元32周期性地參照的感情/本能模型化單元31的感情/動作單元40A~40F和欲望單元41A~41D的強度中,『喜歡(JOY)』、『驚訝(SURPRISE)』或『悲傷(SADNESS)』任何一個的、感情/動作單元40A~40F的強度是『在從50至100(50,100)的範圍內』,那麼它也可以變換到另一個節點上。
對於狀態變換表50,允許變換到的節點的節點名被列舉在『到其它節點的變換概率』列的『當前節點可以變換到的節點』行上,以及變換概率列舉在『到其它節點的變換概率』列的『輸出動作』行上,當列在『輸入事件名』、『數據值』和『數據範圍』的每行上的所有條件都得到滿足時,使當前節點變換到其它節點的任何一個。在『到其它節點的變換概率』列中每行上的變換概率之和是100[%]。
因此,在這種情況下,給定識別結果,例如,『已經檢測到球(BALL)』和球的『尺寸』是在從0至1000(0,1000)的範圍內,節點可以以『30%』的概率從NODE100變換到『NODE120』(節點120),同時輸出『ACTION1(動作1)』的行為和動作。
行為模型的每一個由如狀態變換表50所述的相同節點連接的多個節點組成。
這樣,行為確定機構單元32在當狀態識別機構單元30給出狀態識別信息10時或當自發現最後的行為之後經過了預定時間間隔時的時候,利用存儲在存儲器10A中的適當行為模型的相應節點的狀態過濾表50來以概率確定下一行為或動作(在『輸出行為』行上描述的行為或動作),其結果作為行為命令信息S14輸出到姿勢變換機構33單元和成長控制機構單元35。(1-2-4)姿勢變換機構單元33的處理給定來自行為確定機構單元32的行為命令信息S14,姿勢變換機構單元33根據確定的行為信息S14為寵物機器人裝置1做出行為或動作制訂有關一系列行為的計劃,並將基於行為計劃的行為命令信息S15輸出到控制機構單元34。
在這種情況下,如圖8所示,姿勢變換機構單元33利用定向圖作為制定行動計劃的手段,定向圖以節點NDB0~NDB2表示寵物機器人裝置1可能採取的姿勢,在節點NDB0~NDB2中可以變換到另一個節點的節點由表示行為的定向弧線ARB0~ARB2相連,定向圖還表示作為自作用弧線ARC0~ARC2的、終止在節點NDB0~NDB2中的一個節點的行為。
為此目的,存儲器10A以資料庫形式存儲數據文件(下文稱這些文件為『網絡定義文件(network definition file)),資料庫包含寵物機器人裝置1可以採取的所有行為的開始姿勢和終止姿勢,它是定向圖的源,並且姿勢變換機構單元33根據網絡定義文件為全身、頭部、腿部和尾部的每個部分建立定向圖60~63(如圖9~12所示)。
從圖9~12可明顯看出,寵物機器人裝置1可能採取的姿勢大體上分成四(4)個組「站立(0 Standing)」、「坐下(0 Sitting)」、「躺下(0 Sleeping)」和「機座(0 Station)」「機座」是採用充電架(圖中未顯出)讓電池11(圖2)充電的姿勢。每一組姿勢已含有所有「成長階段」公用的基本姿勢(用◎標記)和用於『幼年』、『少年』、『青年』和『成年』的一種或數種通常姿勢(用0標記)。
例如,在圖9~12中由虛線圍起來的部分代表用於『幼年』的通常姿勢,從圖9可知,預備了「o Sleeping(睡覺)b(幼年)」、「0 Sleeping b2」~
」作為用於『少年』「躺下」的通常姿勢,和「0 Sitting b」和「0Sitting b2」作為「坐下」的通常姿勢。
並且,給定來自行為確定機構單元32的行為命令信息S14,諸如『站立』、『行走』、『伸手』、『搖頭』或『擺尾』,姿勢變換機構單元33利用相應的定向圖60~63並沿著定向弧線的方向,搜索到當前節點指定的姿勢所對應的節點的路徑,或者指定行為所對應的定向弧線或自作用弧線。然後,行為命令作為行為命令信息S15輸出到設備控制機構單元34,據此,寵物機器人裝置1按順序做出與所獲得路徑上每個定向弧線相對應的行為。
例如,如果寵物機器人裝置1處在「0 Sitting b」的狀態,並且當將做出出現在節點「0 Sleeping b4」上的行為(與自作用弧線a1相對應的行為)的行為命令從行為確定機構單元32給予姿勢變換機構單元33時,那麼,姿勢變換機構單元33搜索在用於全身的定向圖60上從節點「0 Sitting b」到節點「0 Sleeping b4」的路徑,然後在控制機構單元34將行為命令作為行為命令信息S15按順序輸出,以便讓當前姿勢從節點「0 Sitting b」變換到節點「0 Sleeping b5」,從節點「0 Sleeping b5」變換到節點「0 Sleepingb3」和從節點「0 Sleeping b3」變換到「0 Sleeping b4」,最後,在控制機構單元34上作為行為命令信息S15的行為命令通過指向由節點「0 Sleepingb4」指定的行為的自作用弧線a1返回到節點「0 Sleeping b4」。
在這個階段可能存在這樣的情況,當前節點可能變換到的兩個節點用數條定向弧線相連接,按照寵物機器人裝置1的「成長階段」和「行為模式」變換行為(「粗野」行為、『文靜』的行為等)。在這種情況下,姿勢變換機構單元33在成長控制機構單元35(待後再述)的控制下選擇作為與寵物機器人裝置1此時所處的和已經獲得的「成長階段」和「行為模式」相對應的路徑的定向弧線。
類似地,有可能存在這樣的情況,提供數條自作用弧線從某一節點返回到相應節點,以按照「成長階段」和「行為模式」變換動作。在這種情況下,姿勢變換機構單元33也選擇作為與寵物機器人裝置1此時所處的和已經獲得的「成長階段」和「行為模式」相對應的路徑的定向弧線。
在如上所述的姿勢變換期間,停留在途中的時間間隔幾乎是『0』,使得變換可以通過在姿勢變換期間用於另一個『成長階段』的節點來完成。
因此,姿勢變換機構單元33搜索從當前節點到下一節點的,是定向弧線或自作用弧線的最短路徑,而不管當前的「成長階段」。
在將行為命令賦予頭部單元、腿部單元或尾部單元的情況下,姿勢變換機構單元33根據用於全身的定向圖60,將寵物機器人裝置1的姿勢還原成基本姿勢(用◎標記)的另一種,然後,利用與頭部單元、腿部單元或尾部單元相對應的定向圖61~63輸出行為命令信息S15,讓頭部單元、腿部單元或尾部單元變換姿勢。(1-2-5)設備控制機構單元34的處理控制機構單元34根據姿勢變換機構單元33給出的行為命令信息S15來生成控制信號S16,並且根據該控制信號S16驅動每個致動器211~21n,讓寵物機器人裝置1做出指定行為和動作。(1-2-6)成長控制機構單元35的處理根據狀態識別機構單元30給出的外部信息信號S2和內部信息信號S1,將作為狀態識別信號S20識別的各種狀態提供給成長控制機構單元35。如上所示,各種狀態除了包括傳輸到感情/本能模型化單元31和行為確定機構單元32的特定狀態外,還包括通過觸摸傳感器18輸入的、但沒有強到與例如『撫摸』或『拍打』等同的輸入。
成長控制機構單元35在存儲器10A內還含有如圖13A所示的列表70A(稱為第一成長要素列表)和如圖13B所示的計數表70B(稱為第一成長要素計數表),列表70A包含在提升根據狀態識別機構單元30給出的狀態識別信息S20的各種狀態的「成長階段」過程中應該參考的前述成長要素,計數表70B計數這些成長要素出現頻次的累計數。
給定來自狀態識別機構單元30的狀態識別信息20,成長控制機構單元35根據關於第一成長要素列表70A的狀態識別信息20判斷要獲取的狀態是否是成長要素,並且如果發現這個狀態是成長要素,則成長計數表70B中的相應計數值(經驗值)增『1』。
此外,成長控制機構單元35還在存儲器10A內含有如圖14A所示的列表71A(稱為第二成長要素列表)和如圖14B所示的計數表71B(稱為第二成長要素計數表),列表71A包含在提升要根據行為確定機構單元32給出的行為命令信息S14獲得的各種行為的「成長階段」過程中應該參考的前述成長要素,計數表71B計數這些成長要素出現頻次的累計數。
給定來自行為確定機構單元32的行為命令信息S14,成長控制機構單元35根據關於第二成長要素列表的行為命令信息S14判斷要獲取的行為或動作是否是成長要素,並且如果發現這個行為是成長要素,則第二成長計數表71B中的相應計數值(經驗值)增加『1』。
並且,當第一和第二成長要素計數表70B和71B中的計數值按如上所述增加時,成長控制機構單元35將計數器(下文稱為『綜合成長經驗值計數器』)的計數值遞增『1』,並判斷是否是分別從第一和第二計數表70B和71B得來的「成長階段」,和判斷綜合成長經驗值計數值的計數值是否已經達到了為當前『成長階段』預置成終止條件的計數值。
如果綜合成長經驗值計數器的計數值已經達到了為當前『成長階段』預置成終止條件的計數值,那麼,成長控制機構單元35根據第一和第二成長要素計數表70B和71B中的每個計數值確定在下一『成長階段』內的、當前行為或動作應該變換到的行為或動作,其結果傳輸到感情/本能模型化單元31、行為確定機構單元32和姿勢變換機構單元33。但是,如果寵物機器人裝置1處在初始階段,那麼,將命令賦予感情/本能模型化單元31、行為確定機構單元32和這姿勢變換機構單元33以選擇用於『少年』的行為和動作模型。
結果是,感情/本能模型化單元31根據命令變換信息S22將圖5所示的強度增大/減小函數42A~42G的每一個的參數改變成指定的行為或動作的值。行為確定機構單元32把要使用的行為模型變換成根據命令變換信息S22指定的行為和動作模型的行為模型。姿勢變換機構單元33改變設置,以便在任何定向弧線或自作用弧線必須從與數個後續行為和動作模型相對應的定向弧線和自作用弧線中選擇這樣一種情況下,根據命令變換信息S22選擇指定的行為和動作模型的定向弧線和自作用弧線。
從上文可知,行為和動作模型包括與特定「成長狀態」中的「行為模式」相對應的、在感情/本能模型化單元31中的強度增大/減小函數42A~42B的每一個的參數值、在行為確定機構單元32中的行為模型、和在姿勢變換機構單元33中的定向弧線或自作用弧線。
按照這種方式,控制器讓寵物機器人裝置1生成能夠自動動作的行為,如按要求提升『成長階段』。(1-3)成長控制處理過程RT1成長控制機構單元35根據如圖15所示的成長控制處理過程RT1控制寵物機器人裝置1的『成長階段』。
在首次打開電源之後,在步驟SP1,成長控制機構單元35開始執行這個成長控制處理過程RT1,並在隨後的步驟SP2判斷狀態識別信息S10是否是從狀態識別機構單元30給出的。
如果在步驟SP2獲得否定結果,那麼成長控制機構單元35前進到步驟SP3,並判斷行為確定信息S14是否是從行為確定機構單元32(圖4)給出的。如果在步驟SP3獲得否定結果,則成長控制機構單元35返回到步驟SP2,並重複SP2-SP3-SP2的循環操作直到在步驟SP2或在步驟SP3獲得肯定結果為止。
當在適當的時候在步驟SP2獲得肯定結果時,成長控制機構單元35前進到步驟SP4,並根據狀態識別機構單元30給出的狀態識別信息S10判斷要獲取的狀態是否是成長要素。
如果在步驟SP4獲得否定結果,則成長控制機構單元35返回到步驟SP2,而如果獲得肯定結果,則成長控制機構單元35前進到步驟SP5並將與第一成長要素列表70A(圖13A)相對應的計數值和綜合經驗值計數器的計數值增加『1』。
隨後,成長控制機構單元35前進到步驟SP6,並判斷綜合經驗值計數器的值達到為當前『成長階段』預置成終止條件的計數值。
如果在步驟SP6獲得否定結果,則成長控制機構單元35返回到步驟SP2,而如果獲得肯定結果,就前進到步驟SP7並確定在後續『成長階段』中的、當前行為和動作模型應該變換到的行為和動作模型,其結果傳輸到感情/本能模型化單元31、行為確定機構單元32和姿勢變換機構單元33,然後,成長控制機構單元35返回步驟SP2。
如果在步驟SP3獲得肯定結果,則成長控制機構單元35前進到步驟8,並根據行為確定機構單元32給出的行為確定信息S13判斷要獲取的行為是否是成長要素。
如果在步驟SP8獲得否定結果,則成長控制機構單元35返回步驟SP2,而如果獲得肯定結果,則成長控制機構單元35前進到步驟SP5並將與第二成長要素列表71A(圖14A)相對應的計數值和綜合經驗值計數器的計數值分別增加『1』,並前進到步驟SP6執行與上文相似的處理。(1-4)在本實施例中的操作和效果如上所述構成的寵物機器人裝置1隨著用戶對其施加諸如『拍打』或『撫摸』之類的動作、或利用聲音命令器向其發出命令、或它自己玩球逐漸成長,其行為和動作象成人一樣。
隨後,寵物機器人裝置1可以給予用戶更高層次的親近感或滿足感,超過機器人裝置剛會行走的概念。
此外,隨著寵物機器人1不斷『成長』,其『行為模式』隨著來自用戶的輸入歷史和其自身的行為和動作的歷史而改變,因此,可以給予用戶更高層次的娛樂性。
藉助於上述結構,寵物機器人裝置1的行為和動作根據由用戶施加在上面的動作和命令和寵物機器人裝置本身的行為和動作得到變換,仿佛它正在成長一樣,使得寵物機器人裝置1可以給予用戶更高層次的親近感和滿足感。因此,可以實現對用戶來說其娛樂質量得到顯著提高的寵物機器人裝置。(1-5)實施本發明的其它模式在前述第一實施例的模式中,對本發明應用於由圖1所示構成的四腳機器人裝置的情況作了說明。但是,本發明並不僅限於此,而是可以廣泛應用於各種其它結構的機器人裝置。
在前述第一實施例的模式中,對控制器10、致動器211~21n(圖2)和揚聲器(圖2)等用作行為和動作生成裝置,根據行為和動作模型生成行為和動作的情況作了說明。但是,本發明並不僅限於此,而是取決於具體實施本發明的機器人裝置的模式,各樣各樣其它結構可以用作行為和動作生成裝置。
並且,在前述第一實施例的模式中,對控制器10的成長控制裝置35用作行為和/或動作變換裝置,根據來自外界的輸入歷史和它自身的行為和/或動作的歷史兩者中的至少一個,在給定定時將行為和/或動作模型變換成更高成長級的行為和/或動作模型的情況作了說明。但是,本發明並不僅限於此,而是取決於具體實施本發明的機器人裝置的模式,各樣各樣其它結構可以用作行為和/或動作變換裝置。
此外,在前述第一實施例的模式中,對機器人裝置1一個階段一個階段地「成長」的情況作為說明。但是,本發明並不僅限於此,而是可以將機器人裝置設計成每當作出成長要素的行為或動作時,通過檢測成長要素的狀態和通過按順序改變控制參數的值,不分階段地「成長」。
此外,在前述第一實施例的模式中,對機器人裝置分四(4)個階段『幼年』、『少年』、『青年』和『成年』『成長』的情況作了說明。但是,本發明並不僅限於此,而是可以將『成長階段』的數目設置成除數目四(4)之外的其它數目。
在這種情況下,與圖16所示的成長階段模型相似,例如,當變換允許條件在某一小區(cell)72得到滿足時,可以將機器人裝置1設計成按照這樣的方式『成長』,使它移動到各小區72中與它相鄰的、成長級比它自己成長級高的小區72。
此外,在前述第一實施例的模式中,對通過觸摸傳感器18(圖2)的接觸輸入的歷史和通過CCD攝像機17(圖2)拍攝的照片和利用聲音命令器的命令輸入的歷史等用作來自外界的輸入歷史的情況作了說明。但是,本發明並不僅限於此,而是用戶可以通過除上述手段之外還有的其它手段或者只通過除上述手段之外的其它手段來使用輸入歷史。
此外,在前述第一實施例的模式中,對為『幼年』之後的每個『成長階段』預備數個成長和動作模型的情況作了說明。但是,本發明並不僅限於此,而是可以為每個階段只預備一個行為和動作模型。
此外,在前述第一實施例的模式中,對指定了『步態』、『動作』、『行為』和『聲音』四個項目作為變量隨著『成長』而改變的情況作了說明。但是,本發明並不僅限於此,而是除前述項目之外的其它項目也可以用作變量隨著『成長』而改變。
此外,在前述第一實施例的模式中,對將寵物機器人裝置1設計成根據綜合經驗值而『成長』的情況作了說明,其中綜合經驗值是根據每個成長要素的出現頻次的累計和的綜合值計算出來的。但是,本發明並不僅限於此,而是可以應用許多其它計算手段計算綜合經驗值。
此外,在前述第一實施例的模式中,對寵物機器人裝置1的『成長階段』根據來自外界的輸入歷史和它自身的行為和動作的歷史而提升的情況作為說明,但是,本發明並不僅限於此,而是來自外界的歷史和它自身的行為和動作的歷史兩者中單獨的一個可以用作提升『成長階段』的要素。同樣,除輸入歷史和它自身行為和動作的歷史之外的其它要素也可以附加到提升『成長階段』的手段中。
在附加除了輸入歷史和它自身行為和動作的歷史之外其它要素的情況下,所經過的時間和其它事情在實際中可以被認作要素。例如,在使用經過的時間來提升『成長階段』時,可行的做法可以是為經過的時間提供成長要素計數表,每當經過給定時間間隔時就計數其中的值,並且還利用成長要素計數表的計數值作為更新綜合經驗值的材料。
並且,可行的做法還可以是讓寵物機器人裝置1利用給定評價函數來評價它自己的某一行為和動作的成就度,例如,從能夠用腳行走的少年成長到能夠將球踢得很遠的成年的狀態,其結果可以用作提升『成長階段』的要素。
例如,如圖17所示,可以想像,讓寵物機器人裝置1通過由成長控制機構單元32(圖4)為動作『踢球』定義的、並且可從下列表達式獲得的評價函數f(d,Q)評價動作『踢球』的成就度「F」F=a×d×cos(θ)這裡,d是作為坐標原點的寵物機器人裝置1的坐標中心與所踢的球73之間的距離,θ是踢球的方向,和a是一個正係數。
如果前述成就度F超過為當前『成長階段』預置的閾值,那麼,可以提升到下一『成長階段』。到球73的距離d可以通過單獨配置的距離傳感器來測量,並且基於編碼器(圖中未示出)輸出的方位角θ量度沿著球滾動方向旋轉頭部單元4的致動器21i(i是1~n的任一個)的輸出軸的旋轉角。在這種情況下,沿著直線將球踢得越遠,成就度F就越大。
除了動作『踢球』之外各種各樣其它行為和動作可以用作要評價的對象,例如,『行走』(評價行走的速度)。
這種行為和動作的成就度被不斷地計算出來,可以根據成就度的最大值確定下一『成長階段』或『行為模式』(幼年1、少年1、少年2、青年1~青年3、成年1~成年4),成就度的最大值是在(寵物機器人裝置1)根據前述輸入歷史和它自身的行為和動作的歷史的『成長』的處理過程中獲得的。(2)實施本發明的第二模式(2-1)在實施本發明的第二模式中寵物機器人裝置80的結構。
圖1中的「80」顯示了第二實施例中寵物機器人裝置的整體概貌,它以與第一實施例中的寵物機器人1相似的方式構成,除了對變換行為和動作模型應用不同的方法之外。
更具體地說,如圖18所示,為寵物機器人裝置80配備了五(5)個『成長階段』『誕生期』、『幼年』、『少年』、『青年』和『成年』。
對於寵物機器人裝置80,控制器81(圖2)的處理內容劃分成如圖19所示的單元,其中對與圖4中的單元相應的那些單元有相同的標號,也就是說,控制器81按照與構造第一實施例中的控制器相同的方式構成。除了具有大量狀態空間的行為確定機構單元82之外,在行為確定機構單元82的狀態空間中存儲著寵物機器人裝置80可能實現的所有行為模式。
行為確定機構單元82按照這樣的方式為每個階段建立行為和動作模型,利用狀態空間的一部分作為核心,在核心中為寵物機器人裝置80建立基本行為,例如『行走』、『睡覺』和『站立』等,只有很小一部分核心用於『誕生期』。此後,每當寵物機器人裝置80成長時,就讓它變換到要增加的新的部分狀態空間(可能發生新的行為和生成一系列行為模式的部分狀態空間),並分開不再使用的部分狀態空間(決不可能發生行為和不產生一系列行為模式的部分狀態空間)。
在寵物機器人裝置80中,其中變換到狀態空間的變換概率隨著不斷成長而改變的方法用作使它變換到要增加的新的部分狀態空間和刪除不必要部分狀態空間的手段。
例如,在圖20中,假定事件「找球」是從NODEA變換到NODEB的變換條件和諸如「接近和踢球」之類的一系列事件是從NODEB變換到一系列節點組82的變換條件,當在NODEA上找到球時,行為模式PA1『追趕和踢球,以變換概率P1發生。但是,在變換概率P1是0的情況下,行為模式PA1決不會發生。
為了讓寵物機器人裝置80具體實施這樣的行為模式PA1,將變換概率P1在初始階段中設置為『0』,並且當它到達相應的『成長階段』時改變到比『 0』大得多的預置值。
與此相反,為了讓寵物機器人裝置80到達某一『成長階段』時忘記行為模式PA1,當到達此『成長階段』時從NODEA到NODEB的變換概率變為『0』。
對於寵物機器人裝置80,在每種行為和動作模型中提供了如圖21所示的文件84A~84D(下文稱為「差分文件」(differential file′),每種文件對應於『幼年』、『少年』、『青年』和『成年』的各個『成長階段』,作為在必要位置改變變換概率的具體手段。
存儲在差分文件84A~84D中的是(與圖20所示的NODEA等效)節點的節點名(編號),當『成長階段』提升時,其變換概率應該變化到使新行為按上述發生;節點在狀態變換表50(圖7)中的位置,其中變換概率應該發生變化;和在相應位置中的可變變換概率。
在初始階段,行為確定機構單元82利用用於『誕生期』的行為和動作模型生成行為,而當以後成長控制機構單元35發出通知按如前所述獲得『成長』時,在為相應差分文件84A~84D中定義的每個節點指定的每個位置上的變換概率根據用於相應『成長階段』的差分文件84A~84D改變到預定值。
在圖7和圖21通過舉例說明的情況中,當達到『幼年』成長階段時,在定義了節點NODE100的狀態變換表50中的變換概率的區域(「輸出行為」行下邊和在「數據範圍」列的右邊的部分)中位於第1行、第1列的變換概率變化到20%,在狀態變換表中位於第1行、第n列的變換概率變化到30%,如此等等。同時,行為確定機構單元82還改變在用於『幼年』的文件84A中定義的其它節點NODE320、NODE720…的相應變換概率。
像這樣的情況,包含在其值要改變的變換概率中的是其中直到某一時間的變換概率是「0」(也就是,禁止變換到是一系列行為模式中原來那一個的節點)的情況,或者在改變之後的變換概率變成「0」(也就是,禁止變換到是一系列行為模式中原來那一個的節點)的情況。如前所述,可能出現如下情況,變換概率從「0」改變到給定值,改變之後的變換概率值變成「0」,一系列行為模式發生在新的「成長階段」,或者一系列行為模式可能不會發生。
即使在必要的變換概率按照這種方式發生改變的情況下,在差分文件84A~84D的每一個中的每個變換概率的值被設計成使得改變之後的、包括在狀態變換表50的相應行中的每個變換概率之和變成100%。
因此,如圖22通過舉例方式所示的,用於每個『成長階段』的行為和運動模型的狀態空間隨著寵物機器人裝置80不斷成長按順序擴展。(2-2)在實施本發明的這種模式中的操作和效果。
如前所述構成的寵物機器人裝置80生成用於每種『成長階段』的行為和動作模型並根據按如下這樣的方式生成的行為和動作模型做出行為,即對於所有行為模式存儲其中的巨大擴展狀態空間之中的、作為核心的、進行基本行為的狀態空間的部分,只有包含核心的小部分用於『誕生期』,並且除了核心之外,不再使用的狀態空間部分隨著寵物機器人裝置80不斷成長而被分離,或者隨著寵物機器人裝置80不斷成長允許變換到另一個附加的狀態空間部分。
對於寵物機器人裝置80,由於在每個『成長階段』中行為和動作模型的狀態空間如此連續地變化以致於緩和了某一『成長』之前和之後輸出行為的不連續性,因此,可以更自然地表示『成長』。並且,對於寵物機器人裝置80,由於狀態空間生成基本行為的部分對於所有『成長階段』是公用的,基本行為的學習結果可以按順序傳到下一『成長階段』。
此外,對於寵物機器人裝置80,由於狀態空間中生成基本行為的部分對於所有『成長階段』是公用的,因此,可以容易地完成為每個『成長階段』生成行為和動作模型的工作,與每種『成長階段』單獨預備行為和動作模型的第一種模式相比,總體上縮減了行為模型的數據量。
此外,在寵物機器人裝置80中,由於隨著寵物機器人裝置80不斷成長,通過刪除用於一系列不必要行為模式的狀態空間部分和通過允許變換到用於一系列必要行為模式的狀態空間而生成用於每個『成長階段』的行為和動作模型,因此,一系列行為模式的每一個被模塊化了,使行為確定機構單元82能更容易地完成生成工作。
如前所述構成的,對於所有行為模式存儲其中的巨大狀態空間之中的、進行基本行為的、作為核心的部分狀態空間,只有包含核心的部分用於『誕生期』,由於除了核心之外,不再使用的狀態空間部分被分離出來和通過允許變換到新附加的狀態空間部分來生成用於每個『成長階段』的行為和動作模型,因此,用於每個『成長階段』的狀態和動作模型的狀態空間可以連續變化,從而縮減了某一成長之前和之後輸出行為的不連續性。這樣,可以更自然地表示『成長』,並可以實現娛樂質量得到極大提高的寵物機器人裝置。(2-3)實施本發明的其它方式在前述第二實施例中,對生成基本行為的部分狀態空間公用於所有『成長階段』的情況作了說明。但本發明並不僅限於此。每個『成長階段,可以劃分成數個部分,生成基本行為的部分狀態空間可以公用於每個『成長階段』的分部分的每一個。
此外,在前述第二實施例中,對關於用於每個『成長階段』的行為和動作模型的狀態空間按順序擴展的情況作了說明。但是,本發明並不僅限於此,而是關於用於每個『成長階段』的行為和動作模型的狀態空間可以按順序縮小,或者在仍然擴展的同時關於行為和動作模型的狀態空間可以在任何『成長階段』縮小。(3)實施本發明的第三模式(3-1)在第三模式中寵物機器人裝置90的結構圖1中的「90」顯示了實施本發明的第三模式中的寵物機器人。除了下列情況之外,寵物機器人裝置90按照與構成第一實施例中的寵物機器人裝置1相同的方式構成,寵物機器人裝置90除了如第一實施例所述的成長功能外,還配備了如圖24所示的功能,在與按照用戶執行的輸入操作的歷史和它自身的行為和動作的歷史所要求的相同『成長階段』中變換行為模式(幼年1、少年1、少年2、青年1~青年3、成年1~成年4),和降級『成長階段』(即,將行為模式『變換到在較低成長級的』『成長階段』中的行為模式,下文稱這個功能為『行為模式變換/『降級功能』)。
這意味著在寵物機器人裝置90的情況下,除了計數圖13A、13B所述的每個成長要素之外,還將控制器91(圖2)設計成對諸如『看見寵物機器人裝置90喜歡的顏色』、『玩球』、『將球拿開』和『(寵物機器人裝置90)獨處時間』之類與預定『行為模式變換』有關的多個要素進行不斷監視和計數生成。
在本實施例的情況下,下列每一個也被當作行為模式變換要素,並與成長要素的計數分開計數利用聲音命令器的命令輸入;強化學習,包括與通過觸摸傳感器18(圖2)的動作『撫摸』和『拍打』相對應的傳感器輸入和做出預定行為和動作的成功次數;不與通過觸摸傳感器18的動作『撫摸』和『拍打』相對應的傳感器輸入;和象『玩球』那樣給定行為和動作的前述成長要素的每一個。
然後,當這些行為模式變換要素的累加和的總計值(下文稱之為行為模式『變換要素的行為模式的綜合經驗值』)超過預定閾值時,控制器91與『成長』無關地將使用的行為和動作模型變換成在同一『成長階段』中的另一個行為和動作模型。
正是具體實施每種行為模式變換要素的出現頻次的累計數確定了其它行為和動作模型的哪一個行為和動作模型用作下一個行為和動作模型。例如,在直到那個時刻使用的行為和動作模型是用於『青年』的『通常』行為模式的行為和動作模型(青年2)的情況下,當行為模式變換要素中諸如『拍打』或『寵物機器人裝置90獨處的時間』之類損壞預定行為模式的行為模式變換要素的出現頻次的累計和大於其它行為模式變換要素的出現頻次的累計和時,選擇用於『青年』的『發怒』行為模式的行為和動作模型(青年1)。與此相反,當行為模式變換要素中諸如『撫摸』或『看見寵物機器人裝置90喜歡的顏色』之類改善預定行為模式的行為模式變換要素的出現頻次的累計和大於其它行為模式變換要素的出現頻次的累計和時,選擇用於『青年』的『文靜』行為模式的行為和動作模型(青年3)。
允許當前使用的行為和動作模型變換到相同『成長階段』內的其它行為模型被預定為,即被限制在,由箭頭線連接的行為和動作模型內。
因此,例如,在正在使用的行為和動作模型是用於『成年』的『有點文靜』行為模式的行為和動作模型(成年3)的情況下,只可以選擇『有點粗野』行為模式的行為和動作模型(成年2)或『文靜』行為模式的行為和動作模型(成年4)兩者之一作為下一行為和動作模型,而決不能使用用於『發怒』行為模式的行為和動作模型(成年1)作為下一行為和動作模型。
同時,除了前述行為模式變換要素的每一個之外,控制器91還對諸如『從桌上掉下』、『跌倒』、或『受到巨大衝擊』之類與『成長階段的後退』(下文稱為『後退要素』)有關的多個預定要素不斷監視計數生成。
然後,根據具體實施每個後退要素的出現頻次的累計數,當任何具體實施後退要素的出現頻率的累計數超過為後退要素的每一個預置的閾值時,控制器91將要使用的行為和動作模型變換成成長級比直到那個時刻使用的行為和動作模型的『成長階段』的成長級低的『成長階段』的行為和動作模型。
在將當前『成長階段』變換成成長級較低的『成長階段』的過程中,為每個後退要素預定了當前『成長階段』降級到哪個階段(或者,到哪個『成長階段』的行為和動作模型)。舉例來說,在出現『從桌上掉下來,等』事件的情況下,如果出現頻次的累計數是『1』,那麼,『成長階段』降級兩個階段(對於『少年』為一個階段)。如果事件『跌倒』出現頻次的累計數超過閾值,則成長階段降級一個階段。
在降級『成長階段』的過程中,隨機選擇在該『成長階段』內的行為和動作模型。
因此,在直到那個時刻所使用的行為和動作模型是關於用於『成年』的『攻擊性』行為模式的行為和動作模型(成年1)的情況下,由於後退可以選擇用於『青年』的『文靜』行為模式的行為和動作模型(青年3)。
如上所述,可以將寵物機器人裝置90設計成甚至在沒有『成長』的時候,也根據通過用戶的動作和命令的輸入歷史和它自身的行為和動作的歷史,或者震動等按順序變換它的『行為模式』,就象真正的動物那樣,取決於如何飼養和由於受到強烈震動等仿佛記憶已經衰退,變換著它的行為模式。(3-2)控制器91的處理寵物機器人裝置90的控制器91處理的內容可以像圖25所示的那樣按功能劃分,其中與圖4的單元相應的那些單元被指定相同的標號。除了成長控制機構單元92之外,控制器91按照與構造第一實施例的控制器相同的方式構成。
「行為模式的變換」和「成長階段的降級」是在此成長控制機構單元92的控制下進行的。
實際上,成長控制機構單元92按如下與對前述第一實施例中那樣的『成長』的控制處理並行地執行對具有相同『成長階段』的行為模式的變換和『成長階段』的後退的控制處理。
成長控制機構單元92在存儲器90A中存儲如圖26A所示的、其中定義了所述行為模式變換要素的列表93A(下文稱為『第一行為模式變換要素列表』)和圖26B所示的計數表93B(下文稱為『第一行為模式變換要素計數表』),列表93A中的要素,是根據在同一『成長階段』內變換行為模式過程中應該涉及到的狀態識別機構單元30給出的狀態識別信息S20從各種各樣的狀態中選擇出來的,計數表93B計數這些行為模式變換要素出現頻次的累計數的每一個。
一旦從狀態識別機構單元30接收到狀態識別信息S20,成長控制機構單元92就判斷根據狀態識別信息S20獲得的狀態是否是根據第一行為模式變換要素列表93A的行為模式變換要素,如果發現該狀態是行為模式變換要素,則第一行為模式變換要素計數表93B的相應計數值(經驗值)增加『 1』。
成長控制機構單元92在存儲器90A中還存儲如圖27A所示的、其中定義了所述行為模式變換要素的列表94A(下文稱為『第二行為模式變換要素列表』)和圖27B所示的計數表94B(下文稱為『第二行為模式變換要素計數表』),列表94A中的要素是根據在同一『成長階段』內變換行為模式過程中應該涉及到的行為確定機構單元32給出的行為命令信息S14從各種行為和動作中選擇的,計數表94B計數這些行為模式變換要素出現頻次的累計數的每一個。
一旦從行為確定機構單元32接收到行為命令信息S14,成長控制機構單元92就判斷根據行為命令信息S14獲得的行為或動作是否是根據第二行為模式變換要素列表94A的行為模式變換要素,如果發現該行為或動作是成長要素,則第二行為模式變換要素計數表94B內的相應計數值(經驗值)增加『1』。
此外,當第一或第二行為模式變換要素計數表93B、94B內的值按如上所述增加時,成長控制機構單元92將計數器(下文稱為『行為模式變換綜合經驗值計數器』)的計數值增加『1』,以判斷行為模式是否應該在同一『成長階段』內變換,該成長階段是獨立於第一和第二行為模式變換要素計數表93B、94B準備的,然後,判斷行為模式變換綜合經驗值計數器的計數值是否超過作為變換『行為模式』的條件預置的計數值。
如果行為模式變換綜合經驗值計數器的計數值達到了作為變換『行為模式』的條件預置的計數值,那麼,成長控制機構單元92根據第一和第二行為模式變換要素計數表93B和94B中的計數值的每一個確定行為和動作模型應該變換到同一『成長階段』內的哪個行為和動作模型,其結果作為變換命令信息S22傳輸到感情/本能模型化單元31、行為確定機構單元32和姿勢變換機構單元33。
因此,感情/本能模型化單元31根據變換命令信息S22將強度增大/減小功能單元42A~42G的每一個的參數改變成指定行為和動作模型的值。並且,行為確定機構單元32根據變換命令信息S22將要使用的行為模型變換成指定的行為和動作模型。
姿勢變換機構單元33根據變換命令信息S22改變設置,使得在必須從與多個行為和動作模型相對應的定向弧線和自作用弧線中選擇定向弧線或自作用弧線之一的情況下,選擇與指定行為和動作模型相對應的定向弧線或自作用弧線。
這樣,成長控制機構單元92根據用戶所作的動作的歷史、利用聲音命令器輸入命令的操作輸入、或它自身的行為和動作的歷史控制行為模式在同一『成長階段』內的變換。
同時,成長控制機構單元92在存儲器90A中存儲如圖28A所示的、其中定義了所述後退要素的列表95A(下文稱為『後退要素列表』)和圖28B所示的計數表95B(下文稱為『後退要素計數表』),列表95A中的要素是根據在降級『成長階段』的過程中應該涉及到的狀態識別機構單元30給出的狀態識別信息S20從各種狀態中選擇的,計數表95B計數這些後退要素出現頻次的累計數的每一個。
一旦從狀態識別機構單元30接收到狀態識別信息S20,成長控制機構單元92就判斷根據狀態識別信息S20獲得的狀態是否是根據後退要素列表95A的後退要素,如果發現該狀態是後退要素,則後退要素計數表95內的相應計數值(經驗值)增加『1』。
此外,成長控制機構單元92在存儲器90A中存儲如圖29所示的列表96(稱為『後退條件和階段數列表』),包含為後退要素的每一個預置的閾值和在後退要素出現頻次的累計和超過閾值的情況下『成長階段』的後退階段數。
當在後退要素計數表95B內的後退要素的任何一個的計數值增加時,成長控制機構單元92參照後退條件和階段數列表96判斷後退要素的計數值是否超過為後退要素預置的閾值。
如果後退要素的計數值超過相應的閾值,那麼,成長控制機構單元92根據後退條件和階段數列表96隨機地確定行為和動作模型應該變換到在降低了為行為和動作模型的生成要素預定的階段數之多的『成長階段』中的哪個行為和動作模型,其結果作為變換命令信息S22傳輸到感情/本能模型化單元31、行為確定機構單元32和姿勢變換機構單元33。
因此,感情/本能模型化單元31根據變換命令信息S22將增大/減小功能單元42A~42G的每一個的參數變換成指定行為和動作模型的值。行為確定機構單元32根據變換命令信息S22把要使用的行為模型變換成指定的行為模型。此外,姿勢變換機構單元33還改變設置,使得在必須從與多個行為和動作模型相對應的定向弧線和自作用弧線中選擇定向弧線或自作用弧線的任一個這樣一種情況下,選擇與指定行為和動作模型相對應的定向弧線或自作用弧線。
如上所述,成長控制機構單元92根據來自外部傳感器19的外部信息信號S2和來自內部傳感器15的內部信息信號S1來控制『成長階段』的降級。(3-3)行為模式變換處理過程RT2和後退處理過程RT3成長控制機構單元92按照圖30所示的行為模式變換處理過程RT2執行在同一『成長階段』中的行為模式變換的處理。
也就是說,每次當變換行為和動作模型時,成長控制機構單元92從步驟SP10開始執行行為模式變換處理過程RT2,並在隨後的步驟SP11判斷狀態識別信息S10是否是從狀態識別機構單元30發出的。
如果在此步驟SP11獲得否定結果,則成長控制機構單元92前進到步驟SP12,並判斷行為確定信息S14是否是從行為確定機構單元32發出的。如果在此步驟SP12獲得否定結果,則成長控制機構單元92返回到步驟SP11,並重複SP11-SP12-SP11的循環直到在步驟SP11或SP12兩者之一獲得肯定結果為止。
當在步驟SP11在適當的時候獲得肯定結果時,成長控制機構單元92前進到步驟SP13,並判斷根據狀態識別機構單元30給出的狀態識別信息S10獲得的狀態是否是行為模式變換要素。
如果在此步驟SP13獲得否定結果,則成長控制機構單元92返回到步驟SP11,而如果獲得肯定結果,則成長控制機構單元92前進到步驟SP15並使第一行為模式變換要素計數表93B(圖26B)中的相應計數值和用於行為模式變換的綜合經驗值計數器的計數值分別增加『1』。
如果在步驟SP12獲得肯定結果,則成長控制機構單元92前進到步驟SP14,並判斷根據行為確定機構單元32給出的行為確定信息S14獲得的行為或動作是否是行為模式變換要素。
然而,如果在此步驟SP14獲得否定結果,則成長控制機構單元92返回到步驟SP11,而如果獲得肯定結果,則成長控制機構單元92前進到步驟SP15,並使第二行為模式變換要素計數表94B(圖27B)中的相應計數值和行為模式變換綜合經驗值計數器的計數值分別增加『1』。
在步驟SP15終止處理之後,成長控制機構單元92前進到步驟SP16,並判斷行為模式變換綜合經驗值計數器的計數值是否達到作為變換當前行為和動作模型的條件預置的計數值。
如果在此步驟SP16獲得否定結果,則成長控制機構單元92返回步驟SP11,而如果獲得肯定結果,則成長控制機構單元92前進到步驟SP17並確定行為和動作模型應該變換到同一『成長階段』中的哪個行為和動作模型,其結果傳輸到感情/本能模型化單元31、行為確定機構單元32和姿勢變換機構單元33。
此外,成長控制機構單元92前進到步驟SP10,並復位第一和第二行為模式變換要素計數表93B、94B,使得第一和第二行為模式變換要素計數表93B、94B中的所有計數值都變成『0』。然後,成長控制機構單元92前進到步驟SP19,並終止行為模式變換處理過程RT2。
同時,成長控制機構單元92根據圖31所示的後退處理過程RT3,與上述處理過程並行地執行降級『成長階段』的控制處理。
也就是說,每次當變換行為和動作模型時,成長控制機構單元92開始執行後退處理過程RT3,然後前進到後續步驟SP21等待要從狀態識別機構單元30提供的狀態識別信息S10。
當在步驟SP21,在適當的時候獲得肯定結果時,成長控制機構單元92前進到步驟SP22,並判斷根據狀態識別信息S30給出的狀態識別信息S10獲得的狀態是否是後退要素。
如果在步驟SP22獲得否定結果,則成長控制機構單元92返回到步驟SP21,而如果獲得肯定結果,則成長控制機構單元92前進到步驟SP23,使後退要素計數表95B(圖28B)中的相應計數值增加『1』。
然後,成長控制機構單元92前進到步驟SP24,參照後退條件和階段數列表96(圖29)判斷後退要素的計數值是否達到作為後退條件預置的計數值。
如果在此步驟SP24獲得否定結果,則成長控制機構單元92返回到步驟SP21,而如果獲得肯定結果,則成長控制機構單元92前進到步驟SP25,隨機地確定行為和動作模型應該變換到在成長級降低了為後退要素預置的階段數之多的『成長階段』中哪個行為和動作模型,其結果傳輸到感情/本能模型化單元31、行為確定機構單元32和姿勢變換機構單元33。
此外,成長控制機構單元92然後前進到步驟SP26,復位後退要素計數表95B,使得後退要素計數表95B中的所有計數值都變成『0』。然後,成長控制機構單元92前進到步驟SP27,並終止後退處理過程RT3。(3-4)在實施本發明的這個模式中的操作和效果如上所述構成的寵物機器人裝置90分幾個階段成長從其行為和動作稚氣的階段一直成長到其行為和動作像成年人的階段,仿佛真正的動物隨時間不斷成長那樣『成長』。
寵物機器人裝置90不僅在『不斷成長』過程中,取決於用戶如何與其相處和它所處的環境,以及根據它自身行為和動作的歷史等變換其行為模式,而且在其它場合下,取決於用戶如何與其相處和它所處的環境,以及根據它自身行為和動作的歷史,逐漸變換其行為模式。同時,當寵物機器人裝置90受到例如強震動時,也可以發生成長級後退。
因此,對於寵物機器人裝置90,不僅其行為模式可以得到變換,而且其成長級還可以降級,這取決於用戶如何與其相處和它所處的環境,以及根據它自身行為和動作的歷史,而與它是否『正在成長』無關,這樣可以保持用戶對它的興趣和給予他/她更大的親近感和滿足感。
對於到此為止所述的那樣構成的寵物機器人裝置90,不僅其行為模式可以得到變換,而且其成長級還可以降級,這取決於用戶如何與其相處和它所處的環境,以及根據它自身行為和動作的歷史,而與它是否『正在成長』無關,這樣可以保持用戶對它的興趣和給予他/她更大的親近感和滿足感。因此,可以實現娛樂質量(娛樂性)顯著提高的寵物機器人裝置。(3-5)實施本發明的其它模式在前述實施本發明的第三模式中,對本發明應用於四條腿行走的寵物機器人裝置90的情況作了說明。但是,本發明並不僅限於此,而是可以廣泛應用於各種其它結構的機器人裝置。還可以應用於在監視器屏幕上通過計算機製圖手段製作的動畫角色等。
在前述實施本發明的第三模式的情況下,對根據行為和動作模型產生行為和動作的行為和/或動作生成裝置包括控制器10、致動器211~21n、揚聲器20和位於眼睛位置上的LED等的情況作了說明。但是,本發明並不僅限於此,而是可以根據本發明應用的機器人裝置的模式應用於各種各樣其它結構。
並且,在前述實施本發明的第三模式的情況下,同一個控制器90(成長控制機構單元92)包括將行為和動作模型依次變換到更高成長級的行為和動作模型的第一變換裝置和根據來自外界的輸入歷史和它自身的行為和動作的歷史的至少一個將行為和動作模型變換到相同或更低成長級的另一種行為和動作模型的第二變換裝置的情況作了說明,但是,本發明並不僅限於此,而是這些變換裝置可以以分立單元的形式構成。
此外,在前述實施本發明的第三模式的情況下,對行為模式和成長級根據來自外界的輸入歷史和它自身的行為和動作的歷史變換的情況作了說明。但是,本發明並不僅限於此,而是寵物機器人裝置1的行為模式和成長級可以通過除根據來自外界的輸入歷史或它自身的行為和動作的歷史兩者之一的『成長』之外的其它時候,或者通過除了來自外界的輸入歷史或它自身的行為和動作的歷史之外還有其它要素的組合而變換。此外,行為模式和成長級還根據它自身行為的歷史或它自身動作的歷史之一進行變換。
此外,在前述實施本發明的第三模式的情況下,對將寵物機器人90設計成分階段『成長』的情況作了說明。但是,本發明並不僅限於此,而是可以將寵物機器人裝置90設計成每當進行成長要素的行為或動作時通過檢測成長要素的狀態或通過逐漸改變控制參數值不分階段地『成長』。
此外,在前述實施本發明的第三模式的情況下,對將寵物機器人裝置90設計成分四個階段『成長』或『降級』『幼年」、『少年』、『青年』和『成年』的情況作了說明。但是,本發明並不僅限於此,而是『成長階段』的段數可以設置成除四(4)之外的其它數。
在這種情況下,如同圖32通過例子所示的成長階段模型那樣,當變換允許條件在某一小區97得到滿足時,可以按照寵物機器人裝置90變換到『等於』、『低於』或『高於』它自身成長級的小區97這樣一種方式實現『成長』、『後退』和『行為模式的變換』。
此外,在前述實施本發明的第三模式的情況下,對應用通過觸摸傳感器18的接觸輸入、通過CCD(電荷耦合器件)攝像機的照片和利用聲音命令器的命令聲音輸入等的歷史作為來自外界的輸入歷史的情況作了說明。但是,本發明並不僅限於此,而是除了上述手段之外還有其它手段,或者只有其它手段可以用於產生輸入歷史。
此外,在前述實施本發明的第三模式的情況下,對為『少年』之後的每個『成長階段』準備了多個行為和動作模型的情況作了說明。但是,本發明並不僅限於此,而是可以為每個『成長階段』只準備一個行為和動作模型。
此外,在前述實施本發明的第三模式的情況下,對將『步態』、『動作』、『行為』和『聲音』四(4)個項目指定為變量隨著『不斷成長』而改變的情況作了說明。但是,本發明並不僅限於此,而是其它項目或要素也可以用作變量隨著『不斷成長』而改變。
此外,在前述實施本發明的第三模式的情況下,對寵物機器人裝置90的行為模式根據行為模式變換綜合經驗值變換(變換行為和動作模型)的情況作了說明,其中行為模式變換綜合經驗值是根據每個行為模式變換要素出現頻次的累計和計算的。但是,本發明並不僅限於此,而是變換寵物機器人裝置90的行為模式的定時可以通過除此之外的其它條件來確定。
類似地,在前述實施本發明的第三模式的情況下,對『成長階段』根據每個後退要素出現頻次的累計和降低的情況作了說明。但是,本發明並不僅限於此,而是降級寵物機器人裝置90的『成長階段』的定時可以通過除此之外的其它條件來確定。
此外,在前述實施本發明的第三模式的情況下,對在同一『成長階段』內變換行為和動作模型時只允許在圖24中箭頭線相連的行為和動作模型內變換的情況作了說明。但是,本發明並不僅限於此,而是可以允許在沒有用箭頭線相連的行為和動作模型內變換。
此外,在前述實施本發明的第三模式的情況下,對只有來自外界的輸入歷史用作後退要素的情況作為說明。但是,本發明並不僅限於此,而是還可以設想成除此之外還有它自身的行為和動作的歷史、或者只有它自身的行為和動作的歷史用作後退要素。(4)實施本發明的第四模式(4-1)第四實施例的寵物機器人裝置的結構在圖1中,標號「100」是在實施本發明的第四模式中的寵物機器人裝置的整體概貌,其中除了下列兩點之外,以與構成實施本發明的第一模式中的寵物機器人裝置1相同方式構成配備了多種行為和動作模型,通過它們為每個『成長階段』確定關於每種行為模式(圖3中的幼年1、少年1、少年2、青年1~青年3、成年1~成年4)的下一行為;具有通過用戶施加物理影響變換行為和動作的出現頻次的功能(下文稱這個功能為『學習功能』)。
這意味著,在寵物機器人裝置100的情況,控制器101(圖2)處理的內容按圖33所示劃分,其中與圖4的單元相對應的那些單元用相同標號表示。
控制器101的行為確定機構單元102含有用於預選的幾個條件的每個項目的獨立行為和動作模型1031~103n,諸如『處理球』、『自動檢測』、『感情表達』和『避開障礙物』等。每個獨立的行為和動作模型1031~103n都與圖6和圖7所描述的相同。
行為確定機構單元102首先利用在當狀態識別信號S10從狀態識別機構單元30發出時、或者當自從最後的行為出現之後已經經過了給定時間間隔時這樣的時候與每個行為模式對應的行為和動作模型確定下一行為,然後,根據通過狀態識別機構單元30獲得的識別結果等,利用按照預定順序具有高優先級的行為和動作模型1031~103n從所確定的行為中選擇一種行為,其結果(所選行為)作為行為確定信息S14分別傳輸到感情/本能模型化單元31、姿勢變換機構單元33和學習控制機構單元104。
按照這些方式,可以將寵物機器人裝置100設計成能夠利用關於每種行為模式的多種行為和動作模型1031~103n具體實施來自同一輸入的各種行為和動作。
同時,狀態識別機構單元30根據觸摸傳感器18給出的壓力檢測信號S1C(圖2)識別『撫摸』或『拍打』的事件,其結果傳輸到學習控制機構單元104。
此時,學習控制機構單元104根據行為確定機構單元102給出的行為確定信息S14知道寵物機器人裝置100的當前和過去行為。然後,假定來自狀態識別機構單元30的識別結果是寵物機器人裝置100在具體實施各種行為的同時已經受到「撫摸」,學習控制機構單元104將這個結果傳輸到行為確定機構單元102。
因此,根據這個通知,行為確定機構102將在剛好在此之前為相應行為模式的每種行為和動作模型1031~103n選擇的節點NDA0~NDAn(圖6)的狀態變換表50(圖7)上的、與那時輸出的行為或動作相對應的變換概率升高預定值,而隨著前者將同一行上的其它變換概率降低預定值,使總和仍然是100%。
同時,假定來自狀態識別機構單元30的識別結果是寵物機器人裝置在具體實施各種行為的同時已經受到「撫摸」,學習控制機構單元104將這個結果傳輸到行為確定機構單元102。
因此,根據這個通知,行為確定機構單元102將在剛好在此之前為相應行為模式的每種行為和動作模型1031~103n選擇的節點NDA0~NDAn(圖6)的狀態變換表50(圖7)上的、與那時輸出的行為或動作相對應的變換概率升高預定值,而隨著前者將同一行上的其它變換概率降低預定值,使總和仍然是100%。
在按如上所述的那樣控制下,對於施加的『撫摸』動作,與此動作相對應的變換概率上升,從而使寵物機器人裝置100更易於具體實施那樣的動作,而對於施加的『拍打』動作,與此動作相對應的變換概率下降,從而使寵物機器人裝置100更難具體實施那樣的動作。這樣,可以讓寵物機器人裝置100仿佛像真正的動物那樣通過飼養員訓養不斷學習遵守紀律變換其行為。
因此,寵物機器人裝置100能夠按照用戶在身體上施加的動作獲得學習而變換其行為和動作。
此外,在由此構成的寵物機器人裝置100的情況下,學習速度隨著每種行為模式(幼年1、少年1、少年2、青年1~青年3、成年1~成年4)和每種行為模式的每種行為和動作模型1031~103n而改變。
這意味著行為確定機構單元102在存儲器101A(圖2)中包括了為行為和動作模型1031~103n的每一種調整學習速度的表(下文稱為『學習速度表』)。
如果學習控制機構單元104發出通知寵物機器人裝置100在具體實施一行為的同時已經受到了『撫摸』,那麼,行為確定機構單元102根據相應行為模式的每種行為和動作模型1031~103n將相應節點NDA0~NDAn(圖6)的狀態變換表50(圖7)上與那時輸出的行為或動作相對應的變換概率升高與學習速度表105所指定的相同的值,而隨著前者降低同一行上其它變換概率的值。
舉例來說,如果那時的行為模式是用於『青年』的『通常』行為模式(青年2),那麼,行為確定機構單元102根據關於『處理球』的行為和動作模型1031將相應節點NDA0~NDAn的狀態變換表50上的相應變換概率升高『 5』,根據關於『自動檢測』的行為和動作模型1032將相應節點NDA0~NDAn的狀態變換表50上的相應變換概率升高『2』,和根據關於「電池管理」的行為和動作模型103n將相應節點NDA0~NDAn的狀態變換表50上的相應變換概率升高『1』。
而如果學習控制機構單元104發出通知寵物機器人裝置100在具體實施行為的同時已經受到了『拍打』,那麼,行為確定機構單元102根據相應行為模式的每種行為和動作模型1031~103n將相應節點NDA0~NDAn(圖6)的狀態變換表50(圖7)上與那時輸出的行為或動作相對應的變換概率降低與學習速度表105所指定的相同的值,而根據前者升高同一行上其它變換概率的值。
舉例來說,如果那時的行為模式是用於『成年』的『攻擊』行為模式(成年1),那麼,行為確定機構單元102根據關於『處理球』的行為和動作模型1031將相應節點NDA0~NDAn的狀態變換表50上的相應變換概率降低『2』,根據關於『自動檢測』的行為和動作模型1032將相應節點NDA0~NDAn的狀態變換表50上的相應變換概率降低『6』,和根據關於『電池管理』的行為和動作模型103n只將相應節點NDA0~NDAn的狀態變換表50上的相應變換概率降低『0』(在這種情況下,變換概率沒有改變)。
正如到目前為止所描述的,對於寵物機器人裝置100,根據來自用戶的身體影響,通過改變每種行為模式以及尤其是每種行為模式的行為和動作模型1031~103n的學習速度,來改變在相應NDA0~NDAn的狀態變換表50上的相應變換概率。(4-2)在此實施例中的操作和效果對於到目前為止所述的那樣構成的寵物機器人裝置100,其學習速度對於每種行為和動作模型1031~103n隨著行為模式(幼年1、少年1、少年2、青年1~青年3、成年1~成年4)而改變。
因此,通過將『成長』和『學習』結合起來,寵物機器人裝置100能夠表現出各種各樣的個性。
試想一下這樣的結構,通過將學習功能組合到寵物機器人裝置100中,為每種行為模式預備多種行為和動作模型1031~103n,並對於每種行為和動作模型1031~103n按照行為模式改變學習速度,這樣將『成長』和『學習』組合在一起可以表現各種各樣的個性。(4-3)實施本發明的其它模式在前述第四實施例中,對本發明應用於如圖1所示四條腿行走的寵物機器人裝置的情況作了說明。但是,本發明並不僅限於此,而是可以廣泛應用於各種各樣能夠『發出』和『接收』的其它機器人裝置。
並且,在前述第四實施例中,對為每種行為模式預備數種行為和動作模型1031~103n和為每種行為和動作模型1031~103n設置不同的學習速度的情況作了說明。但是,本發明並不僅限於此,而是甚至在例如如第一實施例的情況那樣為每種行為模式只預備一種行為和動作模型的情況下,也可以為每種行為模式設置不同的學習速度。
此外,在前述實施例中,對學習速度可以對每種行為和動作模型1031~103n進行改變的情況作了說明。但是,本發明並不僅限於此,而是要學習的項目可以對每種行為和動作模型1031~103n進行改變,使得在某一行為和動作模型1031~103n中通過學習例如『踢球』項目(事件)使實施的頻次發生改變(即,變換概率上升或降低)但在其它行為和動作模型1031~103n中不發生改變。
此外,在前述實施例中,對某一行為的實施頻次通過學習來改變的情況作了說明。但是,本發明並不僅限於此,而是可以為例如改變控制參數的某一行為和動作提供學習功能,使得由於通過來自用戶的身體影響所獲得的知識,可以以好得多的方式做出行為或動作。(例如,能夠交換幾組控制參數的學習功能,這幾組控制參數是為例如『行走』 件準備的,使得通過來自用戶的影響,例如『撫摸』,使應用於『走得差的方式』的參數可以改變成應用於『走得好的方式』的參數,或者通過例如『拍打』,使其向相反方向改變)。
工業應用性本發明可以應用於諸如寵物機器人裝置之類的娛樂性機器人裝置。
權利要求
1.一種機器人裝置,其特徵在於,包括行為和/或動作生成裝置,用於根據行為和/或動作模型生成行為和/或動作,和行為和/或動作模型變換裝置,用於根據來自外界的輸入歷史和其自身的行為和/或動作的歷史兩者的至少一個,在給定定時將所述行為和/或動作模型變換成較高成長級的所述行為和/或動作模型。
2.如權利要求1所述的機器人裝置,其特徵在於,所述行為和/或動作模型變換裝置分階段變換所述行為和/或動作模型。
3.如權利要求2所述的機器人裝置,其特徵在於,為所述階段的每一個配備多個所述行為和/或動作模型,在變換所述行為和/或動作的過程中,所述行為和/或動作變換裝置根據來自外界的輸入歷史和它自身的行為和/或動作的歷史兩者的至少一個,從用於下一階段的所述行為和/或動作模型中選擇要變換到的行為和/或動作模型。
4.如權利要求2所述的機器人裝置,其特徵在於,所述行為和/或動作變換裝置將所述行為和/或動作模型的一部分公用於所述各階段的每一個。
5.如權利要求2所述的機器人裝置,其特徵在於,所述行為和/或動作變換裝置通過放大或縮小來改變根據所述階段的每一個從所述行為和動作模型用來生成所述行為和/或動作的狀態空間,變換所述行為和/或動作模型。
6.如權利要求1所述的機器人裝置,其特徵在於,所述行為和/或動作模型包括狀態節點和用弧線表示行為和/或動作的狀態變換模型。
7.如權利要求1所述的機器人裝置,其特徵在於,所述行為和/或動作變換裝置根據為多個所述弧線的每一個設置的概率和/或權重係數選擇所述弧線。
8.一種機器人裝置,其特徵在於,包括行為和/或動作生成裝置,用於根據行為和/或動作模型生成行為和/或動作;第一變換裝置,用於按照第一給定條件按順序將所述行為和/或動作模型變換到更高成長級的所述行為和/或動作模型;和第二變換裝置,用於根據來自外界的輸入歷史和其自身的行為和/或動作的歷史兩者的至少一個,按照第二給定條件將所述行為和/或動作模型變換到相等或較低成長級的其它行為和/或動作模型。
9.如權利要求6所述的機器人裝置,其特徵在於,為所述成長級的每一個預備了一個或多個所述行為和/或動作模型,在變換所述行為和動作模型過程中,所述第二變換裝置從相應成長級的所述行為和/或動作模型中選擇一個所述行為和/或動作模型,該模型變換到適當行為和/或動作模型。
10.一種機器人裝置,其特徵在於,包括行為和/或動作生成裝置,用於根據行為和/或動作模型生成行為和/或動作,行為和/或動作變換裝置,用於根據通過根據給定評估功能評估其自身行為所得的評估結果,在給定定時將所述行為和/或動作模型變換成更高成長級的所述行為和/或動作模型。
11.一種含有多種行為模式的多個行為和/或動作模型的機器人裝置,包括行為和/或動作生成裝置,用於根據相應所述行為模式的所述行為和/或動作模型的每一個,生成行為和/或動作,和變換裝置,用於根據來自外界的影響,變換相應所述行為模式的所述行為和/或動作模型的每一個,所述變換裝置通過為所述行為和/或動作模型的每一個預置的不同規則來變換相應所述行為模式的所述行為和/或動作模型的每一個。
12.一種機器人裝置的控制方法,其特徵在於,包括第一步驟,根據行為和/或動作模型生成行為和/或動作,和第二步驟,根據來自外界的輸入歷史和它自身的行為和動作的歷史兩者的至少一個,在給定定時將所述行為和/或動作模型變換成較高成長級的所述行為和/或動作模型。
13.如權利要求12所述的機器人裝置的控制方法,其特徵在於,所述第二步驟中所述行為和動作模型分階段變換。
14.如權利要求12所述的機器人裝置的控制方法,其特徵在於,為所述階段的每一個配備多個所述行為和/或動作模型,所述第二步驟中,根據來自外界的輸入歷史和它自身的行為和動作的歷史兩者的至少一個,從所述階段中的所述行為和/或動作模型中選擇接下來要變換到的所述行為和/或動作模型之一。
15.如權利要求13所述的機器人裝置的控制方法,其特徵在於,所述第二步驟中,所述行為和/或動作模型的部分公用於所述階段的每一個。
16.如權利要求13所述的機器人裝置的控制方法,其特徵在於,所述第二步驟中,通過放大或縮小來改變根據所述階段的每一個用來生成所述行為和/或動作模型的行為和動作的狀態空間,變換所述行為和/或動作模型。
17.如權利要求12所述的機器人裝置的控制方法,其特徵在於,所述行為和/或動作模型包括狀態節點和用弧線表示行為和/或動作的狀態變換模型。
18.如權利要求17所述的機器人裝置的控制方法,其特徵在於,所述第二步驟根據為多個所述弧線的每一個預置的概率和/或權重係數從所述弧線中選擇一根弧線。
19.一種機器人裝置的控制方法,其特徵在於,包括第一步驟,根據行為和動作模型生成行為和/或動作,第二步驟,按照第一給定條件按順序將所述行為和/或動作模型變換到更高成長級的所述行為和/或動作模型,和根據來自外界的輸入歷史和其自身的行為和/或動作的歷史兩者的至少一個,按照第二給定條件將所述行為和/或動作模型變換到相等或較低成長級的不同行為和/或動作模型。
20.如權利要求19所述的機器人裝置的控制方法,其特徵在於,為所述成長級的每一個預備一個或多個所述行為和/或動作模型,所述第二步驟中,從相應所述成長級的所述行為和/或動作模型中選擇所述行為和/或動作模型之一。
21.一種機器人裝置的控制方法,其特徵在於,包括第一步驟,根據行為和/或動作模型生成行為和/或動作,和第二步驟,根據通過根據給定評估功能評估其自身行為所得的評估結果,在給定定時將所述行為和動作模型變換成更高成長級的所述行為和動作模型。
22.一種機器人裝置的控制方法,其特徵在於,為多種行為模式配備了多個行為和/或動作模型,和包括第一步驟,根據相應行為模式的所述行為和/或動作模型生成行為和/或動作,第二步驟,根據來自外界的影響變換相應所述行為模式的所述行為和/或動作模型的每一個,其特徵在於,在所述第二步驟中,通過為所述行為和/或動作模型的每一個預置的不同規則來變換相應行為模式的所述行為和/或動作模型的每一個。
全文摘要
在生成機器人裝置的行為和動作時用作基礎的行為和/或動作模型根據來自外界的輸入歷史和機器人裝置自身的行為和動作的歷史,在預定定時逐步變換成另一個成長級更高的行為和/或動作模型。因此,通過將成長與學習相結合提供了娛樂性得到進一步提高的寵物機器人裝置。
文檔編號G06F19/00GK1304345SQ00800822
公開日2001年7月18日 申請日期2000年5月10日 優先權日1999年5月10日
發明者高村成一, 坂部典昭 申請人:索尼公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀