用於人工智慧個人助理的系統和方法
2023-12-02 21:52:01 3
專利名稱:用於人工智慧個人助理的系統和方法
技術領域:
本發明涉及人到計算機化的音頻和視頻圖像的界面領域。
發明內容
每一天,我們中的大多數花費一天的很大一部分時間去做大量重複性工作-人工智慧個人助理(HIPA)將使得那些日常工作變得容易-HIPA能夠為使你的生活更好而負責。例如,HIPA可以是在終端用戶和位於亞洲的呼叫中心之間的直接的VoIP(IP語音)或者視頻連接。不管所請求任務的複雜性,所有註冊用戶將享受高質量的HIPA體驗。如果需要,用戶可以無縫升級到具有更多專業知識的各種專長的另一個或更多操作者,從瀏覽和回復用戶的電子郵件,到輔助旅行計劃中的用戶或者幫助用戶的小孩完成他或她的六年級家庭作業。任何時候HIPA以最輕微的方式(即從你的音調,語言)檢測到來自用戶的任一級別的挫敗或不滿,HIPA操作者將會無縫地升級你的連接或會話到所要求領域的指導專家。在這個轉移期間,用戶將不會真的知道該轉移,因為用戶仍然將對同樣的聲音談話,且將觀看他或她的HIPA裡的相同3D人工圖像。鑑於如此處描述的實施本發明的目前已知最佳方式的描述和優選實施例的工業應用,本發明的這些和其它目的和優勢對本領域的技術人員來說將變得清楚。附圖簡要說明實施例以示例的方式闡述,並且不受附圖的限制,附圖中相似的標註表示相似的元件。圖I顯示根據一實施例的人工智慧個人助理系統。圖2顯示根據一實施例的用於人工智慧個人助理系統的示例用戶終端。
具體實施例方式以下的描述和附圖是說明性的,不應理解為限制。描述了許多具體細節以提供一個透徹的理解。然而,在一些例子中,沒有對公知的或傳統的細節進行描述以避免模糊了說明。在本公開中,對一個實施例或實施例的引用不一定是對同一實施例的引用;且該引用指至少一個引用。在這裡標題的使用僅僅為了便於引用,不應以任何方式解釋為限制本公開或下面的權利要求。說明書中對「一個實施例」或「實施例」的引用指的是該實施例中描述的具體的特徵、結構或特性被包含在本發明公開的至少一個實施例中。在說明書中多處出現的短語「在一個實施例中」並不一定都指同樣的實施例,也不是互相排除其它實施例在外的獨立的或可替代的實施例。而且,描述的各種特徵可能被一些實施例呈現而沒有被其餘的實施例呈現。同樣地,描述的各種需求可能是一些實施例的需求而不是其它實施例的需求。不受限制的HIPA帶寬在一個實施例中,用戶的HIPA能夠同時瀏覽用戶沒有打開的語音郵件消息,按照呼叫者、優先級和主題將它們記錄(document)到一個匯總的郵件中,瀏覽和概述來自在用 戶的簡介(之前已設置好並且可以動態修改)裡列為重要人物的人的重要郵件。HIPA的個人簡介和它的動態的工作量可伸縮特徵允許用戶決定多快生成結果。所述結果可以與用戶能夠與他或她的界面HIPA通信一樣快地被提供。就一個簡單的任務,一個HIPA可以獨立工作,但是一旦任務變為時間集中或者要求完成數個任務,任務會被動態地分配給多個提供有實質上無帶寬限制的HIPA。這使得用戶能夠視乎複雜性、專長和要求完成任務的時間分配可同時被操作的一系列簡單到很複雜任務。類似於一個多處理器計算機,當工作量或需完成的任務的數量開始增加和更多耗時或者複雜的任務被分成斷片(pieces)時,其它的處理器(即多個HIPA)自動啟動。因此,這些斷片中的每個能夠被例如亞洲的多個操作者操作,然後結果無縫匯集(funneled)反饋給單個HIPA界面,如同任務在第一個地方被拆分為多個獨立的組分用以以最有效率的方式處理它們那樣輕而易舉。當用戶繼續在和看似是一個人交流時,所有這些被完成,這時實際上多個HIPA在對一個任務工作。多個HIPA任務處理和用戶簡介/偏好是顧客體驗成功的關鍵。顧客簡介允許用戶的HIPA動態擴展其能力的帶寬遠遠超出這顆行星上提供的任何其它的助理類型服務。服務的成本應基於組合的操作者的秒數,而不考慮有多少個操作者來參與完成這項任務。幾乎所有任務都被拆分成斷片以減少完成所有任務所花費的時間量。視乎所需要的任務,一個使用一個HIPA的用戶可以涉及多達I至30+個人。決定任務應如何遍布多個操作者的過程可以取決於多個變量中的一個,例如(I)顧客的需求;⑵任務的數量;以及⑶任務的專業化(即旅遊研究,瀏覽電子郵件,列印報告等等)。HIPA體驗可使用軟體將顧客對他們的HIPA的用戶需求動態解析成可無縫導向至例如在亞洲的個人操作者的最有效的組分,所述個人操作者能夠處理被拆分的部分/組分,然後,所述軟體將斷片重新組裝/重新編譯成一格式,該格式將完成用戶的初始任務請求(以類似於計算機處理器如何解譯軟體編碼且將編碼的部分分成處理器的各種專業部件的方式,所述專業部件例如專用於存儲器、視頻、i/o處理器管理和多線程管理)。概念I、零售商店櫥窗展示在一個實施例中,顧客可能在晚上商店關門後沿著布魯爾街行走,並且注意到一位女士正在試穿來自一家聲譽好的時尚服裝生產商的新上衣的互動視頻。當顧客走過時,他或她被傳感器檢測到,然後,一位衣著漂亮的H I PA模特面對顧客並且說「今晚很高興見到您」(腳本以天為時間變化)。「我可以給您介紹我們新的漂亮的春季圍巾收藏嗎? $99起。」新圍巾的擬真照片顯示以3D形式湧現在HIPA的一側。模特接著試戴上其中的一條圍巾。她接著詢問潛在顧客他們是否願意看她試戴展示出的另外一條圍巾。如果用戶說好,然後她詢問是哪一條,並且每一條會被依次高亮顯示片刻。潛在顧客說「第三條或者有藍色圖樣的綠色圍巾」,然後模特就會無縫地試戴上它。當HIPA戴上圍巾後,她會開始描述該產品,並且渲染(romance)擁有這排時裝中的圍巾的價值,以及它如何能突出任意整套服裝。她然後會詢問顧客,他們是否願意從她這購買一條圍巾。如果他們說是,她然後會問他們是否願意明天直接遞送到他們家或者工作所在地。然後,她會簡單地要他們告訴她他們的名字,和通過將他們的信用卡舉向櫥窗上安裝的微型攝像機提供給她提供支付細節。HIPA能夠在信用卡的靜止圖像上快速地拉近攝像並記錄下卡號,然後視乎信用卡,也可以要求顧 客展示信用卡的背面。如果顧客說不(對她關於圍巾的初始問題),她然後會詢問顧客,他們是否願意觀看最新的手提包或者任何其他類別,她將將該類別列在櫥窗顯示屏上,並繼續帶他們進行突出各種部門和重點產品的商店的3D旅行。2、虛擬商店指南 在另一個實施例中,顧客將進入一間零售店,HIPA通過展示最新廣告的裝備(outfit)且可能是以現實生活場景的特徵歡迎顧客。然後,HIPA將詢問顧客,他們是否注意到了 X商店裡各種部門的一些當前特價商品,並且詢問他們是否會對進一步的細節或者幫助或者任何其它事項感興趣,包括a)具體部門的位置b)靠顧客提供對項目(item)的口頭描述,HIPA通過展示產品的圖像能夠確認具體產品的價格。HIPA也能夠提供可用庫存以及廣告項目的細節。HIPA也將有能力運用零售/宣傳專業機構預先編排好的零售業知曉的最好的銷售技巧直接向顧客銷售項目。c)幫忙為朋友挑選禮物。HIPA在百貨商店的每一方面上都訓練有素,完全了解庫存清單、產品位置、庫存清單的每一項的供應商產品規格和特點、許多零售項目的視頻圖像且在許多情況下為3D渲染。最重要的是,HIPA關於每一項目具有大量預先編排的特別賣點和短語的庫,用關閉該銷售的非常有針對性的方法顯示。HIPA的銷售經驗將是特別的,由世界上的最好的零售顧問撰稿。顧客將會感覺到他們仿佛是在被服務而不是被推銷。HIPA也會在顧客尋找特定產品或部門的位置時詢問他們是否需要幫助。HIPA也會詢問顧客他們是否想要一份高亮顯示他們感興趣的特定區域和/或任一特定廣告或特定產品細節的地圖,和/或清晰地指示了他們的部門的位置或與他們目前位置有關的感興趣項目的非常乾淨簡單的3D地圖。HIPA會詢問顧客的名字,並且會要求他們拿起高亮顯示顧客的感興趣區域的他們的個性化地圖,該地圖也可包含那些部門的特色產品。它們也包括由HIPA提供的特定項目或禮物選擇。當顧客離開商店指南區域時,通過使他們撥打HIPA說出或在屏幕上顯示出的電話號碼,HIPA也將向顧客提供持續的HIPA體驗,或者,如果顧客向她提供他們的電話號碼,HIPA可呼叫他們繼續進行會話,因為許多手機用戶不對呼入的分鐘付費。百貨商店通過以下方式創造動機以鼓勵顧客使用HIPA :廣告宣傳一旦使用這種服務,HIPA將在整個一天內提供給用戶隨便在各種部門的獨家供應。這將允許顧客在整個商店無縫地繼續與HIPA會話,例如通過行動電話、PDA或其它這種裝置、或通過裝配有HIPA、VoIP功能的屏幕和遍布商店設置的傳感器和/或麥克風。通過使顧客根據品牌和描述識別產品以及使HIPA獲得來自百貨商店和製造商的無限制的產品信息和賣點,HIPA將給顧客提供關於任一項目或部門的指引和產品信息。更重要的是,HIPA將具有由世界最好的零售銷售專家創作且由每一個製造商修改和認可的世界最好的預先罐裝封閉腳本。使用HIPA就類似於與世界上最好的銷售夥伴購物。這並不意味著顧客會被過度推銷。它意味著顧客有機會由一個能提供關於顧客需求的更多信息和使體驗更有效和興奮的人指引。例如,當顧客正在看迪賽(Diesel)牛仔褲,他們會被告知它們完全在義大利製造,且全部仍手工縫製,並用3」巖石洗滌。3、虛擬結帳在另一個實施例中,當HIPA用戶想要購買任何東西或者使其遞送出去時,HIPA用 戶自己現在將有能力在任何時候或任何地點處理付款和結帳。如今,零售成為了低服務水平的同義詞,顧客發現非常難尋求任何幫助,即便是當他們僅僅需要某人來拿他們的錢。視特定商店的偏好而定,在商店中的任何地方(利用行動電話或PDA或其它這類裝置)或者在眾多指定的虛擬HIPA結帳臺,選定的顧客將能夠自己結帳,而無需走到確確實實的收銀處。HIPA能被用來有效率地購買項目,而不用尋找無人值守的收銀臺或者使顧客吃力地、浪費時間地找到收銀臺或者不用找出銷售職員比慢更慢的收銀臺,或者收銀臺前的排隊太長以致於顧客不能等,並簡單地放下他們想要購買的項目而走出商店。顧客服務至上的零售店/百貨商店將提供虛擬HIPA結帳服務給他們最有價值的顧客,向他們提供執行虛擬結帳/付款作為一種優選服務的能力,提高整個零售體驗。他們僅需簡單地找出他們想要付款的產品和/或走到具有一個或更多HIPA結帳顯示屏的指定的虛擬結帳區域。這些站臺被攝像機良好覆蓋,且HIPA也將要求顧客識別他們的位置並識別他們手上所有已付款和未付款的產品。HIPA也能根據顧客現有簡介在視覺上辨別顧客。整個交易的詳細視頻錄像也被記錄並成為顧客簡介的一部分。特定零售店指定的HIPA操作者(在另一端控制HIPA的人,該人在結帳程序專門訓練過)如果需要也能夠請零售人員提供幫助。如果HIPA操作者不確定顧客是否根據要求的指定零售店指南引導他們自己,他們也可能宣稱存在系統問題。這避免了顧客和零售商的任何形式的尷尬。百貨商店可能允許顧客只是通過口頭描述產品或者讀出百貨商店的SKU號碼或者UPC號碼,在任一通道的任何地方結帳(藉助行動電話或PDA或任何這類裝置,或通過遍布商店設置的上述虛擬HIPA站臺)。顧客也將能詢問其它顏色和可用庫存以及也可以安排產品遞送。HIPA也能比較產品以及基於可用庫存而提出建議。當然,HIPA將具有在任何時候供其支配的豐富的產品知識產品庫和銷售技巧。4、在家和工作時你的HIPA在另一個實施例中,HIPA能夠在多種不同的日常任務中協助用戶。沒有HIPA,用戶的日常生活將不再相同。當用戶醒來,他們的一天將從接收預先安排好的文字信息、電子郵件、電話呼叫或在他們床邊有吸引力的男性或女性HIPA圖像的一個栩栩如生的HIPA圖像的細語開始。HIPA圖像將向用戶尋求指示使得HIPA能完成用戶今天想要HIPA做的項目和整天、整周等做的所有項目,以及用戶的配偶和孩子想要用戶做的事情。當用戶仍躺在床上深思未來的一天而沒有動一根手指時,用戶將能夠打斷、忽略或者使HIPA專心於寫或者回復電子郵件、文字信息或者給任何人撥打電話。用戶可能周末想要出去,在那種情況下,用戶可以請HIPA搜索Expedia(艾派迪)和其它網站在這周五的下午7點後離開的大量細節,並歸納它們且在用戶的家庭辦公室內的印表機上列印出來。用戶也可能請HIPA安排購買所述用戶向HIPA描述的四張DVD中的三張,並還使用所述用戶可以使用的DVD遞送服務帳戶在下周五遞送。用戶也可以讓HIPA找出雜誌上看到的新圍巾的價格,用戶想要購買該圍巾用於用戶的配偶下周的生日,並且用戶也可以想要每天被一些離散提醒來提醒那件事情。用戶也能通過電話與2或3個人開一個HIPA會議,然後通過使用戶加入會議,這樣用戶就不需要以語音郵件浪費他或她的私人時間。當HIPA留下某人請用戶回電的信息時,HIPA將留下一個谷歌(Google)語音號碼,該號碼將由HIPA代表用戶答覆,並且在通知
呼叫者該用戶可得性之前,HIPA會徵詢用戶的許可以使其他呼叫者與用戶開會。由於用戶從HIPA做出每一個額外的請求,視該請求而定,用戶的HIPA會分配該請求給多個HIPA,同時允許每一個請求由專家執行,例如,請求可以由用戶附近區域的合適的專家執行。在某些情況下,請求的任務可能需要花費一些時間來執行,並且HIPA可能需要請求一些時間來做響應。當HIPA已經解決該任務,HIPA會通過它們默認的提醒方法警示用戶,除非被告知不這麼做。例如,用戶可以要求HIPA呼叫他們、給他們發送文本信息或者發送電子郵件給他們以及在用戶設定的時間間隔內重複該提醒。當用戶早晨正在枕頭上放鬆往左邊一瞥看著他或她旁邊的HIPA圖像在計劃著時,上面的所有事情可以無需舉起一根手指就能夠完成,這使用戶未來日子的計劃輕而易舉(breeze)。5、HIPA行動電話在另一個實施例中,在一天中通過用戶的電話、PDA、智慧型電話或其它此類裝置也可以使用該用戶的HIPA。在用戶的家裡和辦公室,用戶的呼叫者標識(ID)將會是到用戶的個人HIPA簡介的連結,就像用戶的網際網路用戶標識(IP USER ID)和密碼一樣。MSS行動電話用戶也能夠通過他們的電話查看他們的HIPA。6、HIPA 翻譯在另一個實施例和不是說英語的國家的環境中,當地的HIPA操作者可受僱傭來簡單地聆聽顧客且將顧客的語音從英語翻譯為該國家的當地語言的文本。視聲音質量和清晰度以及語音至文本翻譯的質量而定,語音至文本軟體也可以協助HIPA操作者。文本結果會傳送(stream)到例如亞洲,亞洲的HIPA操作者會將文本翻譯為英語並且將文本轉化為語音,然後以與英語消費者將會被處理的方式相同的方式被處理。7、更多詳細的應用a)學生-在另一個實施例中,父親或母親可能希望他們的孩子每天花費15分鐘來使他們的孩子檢查他們的家庭作業或者在具體的科目上獲得幫助,該科目能夠在HIPA界面的文本框中被指定。在每一學期前,HIPA對要檢查的課程會受到培訓和得到經驗。當被要求時,HIPA將能夠報回給父母孩子的進展。b)用於用戶、用戶的孩子和用戶年老的父母-在另一個實施例中,所有用戶能夠瀏覽例如在亞洲的HIPA計算機屏幕,HIPA操作者允許用戶指導或執行他們希望的任何任務,並顯示消費者的電子郵件、完整簡介、網絡瀏覽器,協助建立伺服器、潤色圖片編輯程序裡的圖像、寫VB應用或任何其他軟體應用,消費者能夠通過語音指弓I HIPA執行以上任一或其它任一任務。例如,用戶能夠讓HIPA在線購買一些音樂、寫讀書報告、使用來自他們電子郵件的數據創作電子數據表、放電影等等。在音樂或電影的情況中,用戶也將既聽到相關媒介的音頻流也聽到HIPA的語音。c)企業-在另一個實施例中,企業在他們的接待或安全臺(security desk)上可具有一個HIPA來替代一個傳統的接待員。HIPA也將能接聽呼入的電話和並利用VoIP在組織內傳達它們。d)網絡-在另一個實施例中,企業可以購買許可證而在他們自己的網站上擁有他們自有品牌的HIPA以利用對應於在線用戶或顧客位置而變化的種族、當地語言和的方言·來銷售產品。這些企業也可以通過HIPA得到「公司簡介(Corp profile) 」的許可證,「公司簡介」是允許公司利用用戶的HIPA簡介的授權元素調整適應用戶的體驗的數據簡介。e)虛擬網絡計算機-在另一個實施例中,用戶能夠利用虛擬網絡計算機(VNC)在他的家或辦公室計算機或者智慧型電話的任一者上獲得任意水平的服務或協助。所有計算機、所有基於UNIX的電話和基於Windows的電話(例如黑莓、iPhone、Windows行動電話和谷歌的Droid作業系統都和VNC—起工作)都容易地與VNC—起工作。VNC類似於微軟的遠程桌面但是可以是免費和/或開源的。此VNC的性能可以允許HIPA顧客接收來自他們的HIPA的幫助以添加聯繫信息到他們的無線電話、增添電影、安裝應用、更新固件或者修復簡單或複雜的電話問題。VNC允許用戶通過本地網絡或網際網路對另一臺計算機採取控制。對行動電話用戶來說一個尤其好的選擇是,VNC包括Java客戶端,該客戶端使用戶能夠通過任一瀏覽器訪問遠程計算機而無需安裝任何軟體。目前,有針對Windows、UNIX、Linux和Solaris的現成版本。VNC能夠用HIPA操作而沒有通過區域網(LAN)連接被減速,也不會耗費更多的金錢。為了能在低速連接時操作VNC,需要用戶減少色彩、移除桌面壁紙或者在他們的運用VNC的電話或移動裝置上僅僅有一個活動的窗口。雖然用戶可保存VNC界面為常用快捷方式,但是VNC界面無法處理為數眾多的連接。VNC程序能運行為服務程序,允許用戶連接到沒有人登錄的機器。安裝文件足夠小以致用戶可以保存它們在軟盤上。一些版本的VNC可以是免費的,以及VNC適用於家庭和商業用,尤其因為VNC可以是開源的、完全記錄的且利用不依賴於平臺的協議使得用戶能在多種平臺上遠程操作。f)屏幕杳看-在另一個實施例中,用戶也能夠杳看HIPA的整個屏幕或者HIPA的屏幕的一部分。r)專業化培訓-在另一個實施例中,HIPA能夠給用戶提供每一專業化培訓,從烹飪到從事某項體育運動到許多不同訓練的任一一項。h)監管孩子——在另一個實施例中,用戶的HIPA被分配照看他們房間裡的用戶的孩子或者一起玩耍的任務,並且如果孩子們開始打架或者做任何父親或母親列在名錄(profile)裡允許或不允許的任何事情則提醒用戶(父母)。父親或母親所有要做的是安裝無線或有線攝相機,也可以是一系列攝相機。i)監視聲音-在另一個實施例中,聲音和視頻能一起被監視。j)記錄和存擋咅頻和視頻-在另一個實施例中,HIPA能夠記錄和存檔音頻和視頻。
k)實時監視和記錄-在另一個實施例中,保安(security)公司、零售商店、父母或者非常關心寵物的主人可能想要一個或一系列視頻/音頻攝像機受他們的HIPA監視/記錄且受實時監視或記錄。作為一種可選項,也可以添加動作檢測軟體,它能提醒HIPA要仔細檢查的活動並用於接下來的進一步指示,例如呼叫外出吃晚餐的父母告知孩子們正在打架並且保姆正在睡覺或者忽略了孩子們。I)通過移動裝置流動式傳送(streaming)視頻在另一個實施例中,視頻也能夠通過手機、智慧型電話、PDA或其它任何這類裝置被傳送到任一地點並被監控。m)攝像機用途-在另一個實施例中,例如,汽車愛好者(buff)可能想要通過他的窗在他街上的汽車安裝一個攝像機,如果有人觸摸他的汽車,使HIPA通知他。η)電視/電影嚮導-在另一個實施例中,用戶可能想要他的HIPA成為他通向世界的電視/電影嚮導。例如,HIPA會提供美國和世界範圍可用的按次計費服務。以與人們如 何查看家庭個人視頻錄像機(PVR)所反饋的視頻/音頻類似的格式,HIPA中心局會傳送視頻/音頻給遠程膝上型電腦或移動裝置或手機。該視頻/音頻內容也能通過VNC或者專門的流媒體軟體觀看。ο)世界範圍的流動式傳送-在另一個實施例中,例如在亞洲的HIPA提供者能夠使用戶觀看世界範圍的任一電影或電視節目的視頻流。P)共享和控制軟體程序-在另一個實施例中,HIPA可向用戶提供例如在亞洲的包含最流行的軟體程序的虛擬計算機的共享和控制的能力。通過安裝被許可的軟體到HIPA提供者所擁有和操作且也能夠與HIPA共享的VM(虛擬機),這能夠容易地實現,在連接上HIPA後,允許用戶無限制地使用特定的軟體程序。q)通過VNC或者MS遠程桌面的協助-在另一個實施例中,用戶能通過VNC或者MS遠程桌面允許HIPA訪問他或她的計算機,VNC或者MS遠程桌面然後使得HIPA監控或者協助用戶在該計算機上的任何行動。例如,HIPA可以被請來幫助調試在一定時間內必須完成的應用程式上有問題的高級電腦程式員。在這種情況下,在具體一類計算機語言和/或應用類型方面的專家被號召過來協助該高級電腦程式員直至問題被解決。r)號召虛擬客人-在另一個實施例中,如果顧客需要非常專業化的幫助,虛擬客人能夠被HIPA提供者號召來幫助HIPA提供者和/或顧客。例如,如果顧客在使用過時的或晦澀I BM作業系統層次的計算機上需要協助,並且沒有一個HIPA提供者能夠提供幫助,然後HIPA會邀請具有特殊才能的知名人士,例如非常熟悉HIPA顧客需要協助的作業系統層次的已退休IBM僱員。然後,HIPA將邀請已退休的IBM僱員利用任何在線會議或者網絡會議軟體來協助。s)共享音樂-在另一個實施例中,通過分享出來由HIPA控制的以許多流行音樂選擇為特徵的得到許可的VM,也能夠享受音樂。其中一些能由知名的DJ為事件而編輯並被HIPA許可,且被組織和租出給HIPA顧客。t)促進商務交流-在另一個實施例中,用戶能使用HIPA來促進全世界的商務交流。例如,如果紐約的HIPA顧客可能正在開發一種新的設計概念,且他或她想要查看在米蘭的特定街的展示窗口,他或她能夠請他們的HIPA安排HIPA僱員/附屬人員在預先設置的時間利用流媒體視頻/音頻手機訪問所要求的地方,所述流媒體視頻/音頻手機使顧客能夠準確地交流他們在附近或者在世界上任何城市實時地想要看到的事物。當需要時,HIPA組織會在每一個城市基於契約的僱傭人,以通過HIPA執行任何法律任務。潛在的立契約者會被HIPA組織的專門一組人員僱傭,HIPA組織會利用例如分類網頁和求職網站的傳播媒介刊登廣告來徵求這一類人。當執行任務時,許多立契約者會被派發一個特殊的視頻手機來使用,以允許顧客引導或控制所要求的任務中的當地立契約者並且查看HIPA顧客想要的圖像。例如,汽車設計者可以請他的HIPA使立契約者參加年度底特律汽車展並且提供電話視頻/音頻信號給終端顧客。顧客將指引HIPA,實際上HIPA用非常具體指令來指引立契約者關於走那條通道、哪裡停止和說什麼。顧客也可能請立契約者挑選具體文件並且將它們直接帶到聯邦快遞(Fedex)或者UPS地點來郵寄它們。這些文件可以發送給HIPA或者直接給終端顧客。零售商店企業也可能利用簡單一致的HIPA界面的獨特控制和數據反饋來使他們的HIPA在全球的新進入者或競爭者的通道中走。公司的總部辦公室也可能想要HIPA通過手機或者視頻電話或者一些其它視頻通信手段僱傭人來檢查他們自己的設備。u)其它商業應用-在另一個實施例中,HIPA能夠例如用在貿易展會或者汽車展, 或者用來遊覽競爭者的商店或者用來查看新大樓來建立新的商店分支等等。
圖I示出了根據一個實施例的人工智慧個人助理系統。具體地,圖I示出了伺服器通過網絡連接至少一個終端,其中,伺服器存儲根據本公開的實施例的軟體。針對功能和數據結構的軟體或程序代碼,例如可用於人工智慧個人助理(HIPA)的軟體或程序代碼,可以綁定到遠程伺服器102。遠程伺服器102連接網際網路104,且網際網路104通過直接連接轉而連接到至少一臺計算機108,通過無線連接或直接連接到至少一臺移動計算機106,以及連接到至少一臺可攜式電話或移動裝置110,該行動電話和移動裝置用於接收視頻流、基於網際網路的內容或者基於無線應用協議(WAP)的內容。至少一臺計算機108也可以是站臺或者裝備有傳感器和麥克風的計算機,所述傳感器和麥克風如上討論的遍及零售店而設置,用作HIPA的虛擬站臺。至少一臺便捷式電話和移動裝置110可包括例如手機、智慧型電話、PDA、黑莓手機、iPhone等等。圖2示出了根據一個實施例的用於人工智慧個人助理系統的用戶終端的例子。雖然圖2示出了計算機系統的各種組件,但是它並不意圖於描述互連組件的任何特定結構或方式。一些實施例可以使用比圖2所示的那些組件更少或更多的組件的其他系統。在圖2中,用戶終端的數據處理系統200包括與微處理器203和存儲器208互連的互連202 (例如總線和系統核邏輯)。以圖2為例,微處理器203耦合到緩存存儲器204。互連202使微處理器203和存儲器208互連到一起,且將它們互連至顯示控制器、顯示裝置207、傳感器209以及互連到外圍裝置,例如通過輸入/輸出控制器206互連到輸入/輸出(I/O)裝置205。傳感器209可以包括例如確定用戶終端方向和/或檢測用戶終端搖動的加速計,或再例如記錄用戶終端附近聲音的聲音記錄設備。典型的I/O裝置包括滑鼠、鍵盤、數據機、網絡接口、印表機、掃描儀、視頻攝像機、觸摸板、麥克風和本領域公知的其它設備。在一些實施例中,當數據處理系統是伺服器系統時,一些I/o設備,例如印表機、掃描儀、滑鼠、和/或鍵盤是可選的。
互連202可包括通過各種橋接器、控制器和/或適配器互相連接的一根或多根總線。在一個實施例中,I/O控制器206包括控制USB外圍設備的USB(通用串行總線)適配器,和/或控制IEEE-1394外圍設備的I EEE-1394總線適配器。存儲器208可包括ROM(只讀存儲器)、易失性RAM(隨機存取存儲器)和非易失性存儲器,例如硬碟驅動器、快閃記憶體等。在之前的說明和以下所附的文件中,本公開是參照本公開具體的示例性實施例進行描述的。將明顯的是,在不脫離下面的權利要求書所提出的廣義精神和範圍的情況下,可對本公開作出各種變化。因此,說明書和附圖應被認為是示例意義上的而不是限制意義上的。在描述中,各種功能和操作可以被描述成是由軟體代碼執行或引起的,以簡化描述。然而,本領域技術人員應認識到這種表達意味的是,這些功能來自於例如微處理器的處理器執行代碼/指令產生的結果。可替代的或相結合的,這些功能和操作可利用專用電路在有或沒有軟體指令的情況下實現,例如利用專用用途集成電路(ASIC)或現場可編程門 陣列(FPGA)來實現。實施例可使用不帶軟體指令的硬線電路、或與軟體指令結合來實現。因此,技術不限於硬體電路和軟體的任何具體組合,也不限於由數據處理系統執行的指令的任何具體源。雖然一些實施例可在功能全面的計算機和計算機系統中實現,但是各種實施例能夠被分布為各種形式的計算產品,且能夠被應用而無需考慮用來實際上實行分布的機器或可讀計算機媒介的特定類型。所公開的至少一些方面可至少部分地體現到軟體中。也就是說,技術能夠在計算機系統或響應其處理器(例如微處理器)的其它數據處理系統中執行包含在存儲器(例如ROM、易失性RAM、非易失性存儲器、緩存或遠程存儲裝置)中的指令序列來實施。被執行用於實現實施例的例行程序(routine)可被實施為作業系統的一部分或具體應用、組件、程序、對象、模塊或被稱為「電腦程式」的指令序列。電腦程式典型地包括在不同時期在計算機中的各種內存和存儲裝置中設置的一個或更多指令,並且,當所述一個或更多指令被計算機中的一個或更多處理器讀取和執行時,使得計算機執行操作,該操作為執行涉及各個方面的元件必要的操作。總的來說,機器可讀介質包括以機器(例如計算機、網絡裝置、個人數字助理、生產工具、具有一個或更多處理器為一組的任何裝置等等)可訪問形式提供(即存儲和/或傳送)信息的任何機制。機器可讀介質也能用於存儲軟體和數據,當數據處理系統執行所述軟體和數據時,會使得系統執行各種方法。可執行的軟體和數據可以存儲在各種地方,包括例如ROM、易失性RAM、非易失性存儲器和/或緩存。該軟體和/或數據的部分可存儲在這些存儲裝置的任意一個中。進一步的,數據和指令能夠從集中的伺服器和/或對等網絡獲得。在不同時期和在不同通訊會話或相同通訊會話中,數據和指令的不同部分能夠從不同的集中伺服器和/或對等網絡獲得。所述數據和指令能夠在應用執行前完整獲得。可替換的,當需要執行時,數據和指令的部分能夠及時地被動態獲得。因此,不需要數據和指令在一個特定的時間實例完整位於機器可讀介質。易失性RAM通常被實施為動態RAM(DRAM),動態RAM需要不斷供電以更新或維持存儲器內的數據。非易失性存儲器通常是磁性硬碟驅動器、磁性光碟驅動器、光碟驅動器(例如DVD RAM)或者即便從系統移除電力後也能維持數據的其它類型存儲系統。非易失性存儲器也可以是隨機存取存儲器。非易失性存儲器能夠是直接耦合到數據處理系統的其餘組件的本地裝置。也可以使用遠離系統的非易失性存儲裝置,例如,通過例如數據機或乙太網接口的網絡接口耦合至數據處理系統的網絡存儲裝置。計算機可讀介質的例子包括但不限於,可記錄和不可記錄類型的介質,其中,例如易失性和非易失性存儲裝置、只讀存儲器(ROM)、隨機存取存儲器(RAM)、快閃記憶體裝置、軟盤和其他可移動盤、磁碟存儲介質、光學存儲介質(例如光碟只讀存儲器(CD ROM)、數字多功能光碟(DVD)等等)。計算機可讀介質可存儲指令。總體來說,有形的機器可讀介質包括以機器(例如計算機、網絡裝置、個人數字助理、生產工具、具有一個或更多處理器為一組的任何裝置等等)可訪問的形式提供(即存儲和/或傳送)信息的任何機制。在不同實施例中,硬線電路可以和軟體指令結合來實現該技術。因此,該技術不限 於硬體電路和軟體的任何具體組合,也不限於由數據處理系統執行的指令的任何特定源。儘管一些附圖以特定的順序示出操作,但可記錄沒有依賴順序的操作,且其它操作也可組合或拆分。雖然特別提到一些重新排序或其它編組,但其他的對本領域普通技術人員是顯而易見的,因此沒有呈現可替代方式的詳盡列表。此外,應該認識到步驟(stages)可以以硬體、固件、軟體或它們的任意組合實施。本公開包括方法和執行這些方法的設備,該設備包括執行這些方法的數據處理系統和包含指令的計算機可讀介質,當指令在數據處理系統上被執行時致使系統執行這些方法。雖然方法和系統以目前認為最好的實踐和優選實施例進行了描述,但應該理解本公開不限於已公開的實施例。旨在涵蓋被包括在權利要求的精神和範圍內的各種修改和相似排列,權利要求的範圍應該符合最寬泛的解釋以包含所有這種修改和相似結構。本公開包括以下權利要求書的任一和所有實施例。也應該理解的是,不脫離本發明的本質可作出各種變化。這種變化也暗含在說明書中。它們仍然落在本發明的範圍內。應該理解的是,本公開旨在產生一個專利,涵蓋本發明的許多方面,包括獨立和作為一個整體系統且以方法和設備二種方式。進一步的,本發明和權利要求書的各種元件中的每一個也可以各種方式獲得。本發明應該理解為包含每一個這種變化,可以是任一設備實施例的一實施例的變化、方法或處理實施例的變化、或者甚至僅僅是這些中的任一元件的變化。特別的,應該理解的是,因為本公開涉及到發明元件,每個元件的用詞可以表述為等同的設備術語或方法術語一一即便僅僅功能或結果相同。這種等同、更寬泛的、或者甚至更一般的用詞應被認為包含在每一個元件或行動的描述中。在希望使本發明授予的不明晰的寬泛範圍明晰化時,這種用詞能夠被替代。應該理解的是,所有行動可以被表述為發生該行動的手段,或表述為導致該行動的元件。類似地,所公開的每一個物理元件應該被理解為包含物理元件促使的動作的公開。
在這方面應該理解的是,因為實際原因以及為了避免潛在增加數以百計的權利要求,申請人僅僅列出了最初始的從屬權利要求。到做出非實質替代的程度、到申請人事實上沒有起草任何權利要求以從文字上包含任一特定實施例的程度、以及到不然可應用的程度,申請人不應被理解為以任何方式試圖或實際上放棄這種覆蓋,因為只是申請人還不能預測所有可能性;本領域技術人員不應合理被期望能起草文字上包含各種替代實施例的權利要求。進一步的,根據慣例的權利要求解釋,在這裡使用連接詞「包含」用於維持「開放端的」權利要求。因此,除非文中要求相反的解釋,不然,應該理解術語「包含」或者其變形試圖隱含地包含陳述的元件或步驟或元件組或步驟組,但不排除任一其它元件或步驟或元件組或步驟組。此類用詞應以它們最寬泛的形式理解,以便根據以下權利要求書給予申請人法律上允許的最寬泛的覆蓋範圍。在前面的說明中,結合本公開的具體的示例性實施例描述了本公開。將顯而易見的是,在不脫離以下權利要求書中闡述的最寬泛的精神和範圍的情況下可對本公開做出各
權利要求
1.一種用於人工智慧個人助理的計算機實施方法,包括 呈現移動視頻圖像給用戶; 通過計算裝置接收來自所述用戶的輸入,所述輸入請求至少ー個任務的執行; 確定所述執行是否應該由零個或更多操作者連同零個或更多計算機一起完成,其中存在至少ー個操作者或至少一臺計算機; 通過所述確定的裁決,完成所述執行以產生結果;以及 輸出所述結果給所述用戶,其中,所述結果與所述移動視頻圖像同步傳送給所述用戶。
2.權利要求I所述的計算機實施方法,其中所述執行所述至少一個任務包括 拆分所述至少一個任務為至少一斷片用於實施; 斷定所述實施是否應由零個或更多操作者連同零個或更多計算機完成,其中存在至少ー個操作者或至少一臺計算機; 通過所述斷定的決定完成所述實施;以及 將完成所述實施的產物重新加回到所述結果。
3.權利要求I所述的計算機實施方法,其中,所述移動視頻圖像為人的圖像,所述結果包括音頻輸出,以及所述同步包括所述音頻輸出與所述人的圖像的嘴唇移動的同歩。
4.權利要求I所述的計算機實施方法,其中,所述移動視頻圖像是計算機產生的。
5.權利要求I所述的計算機實施方法,其中,所述輸入包括選自由運動檢測、語音、視頻、鍵盤、觸控螢幕、滑鼠和手寫筆所構成的組中的至少ー者。
6.權利要求I所述的計算機實施方法,其中,所述ー個或更多計算機與零個或更多額外的計算機連網。
7.權利要求I所述的計算機實施方法,其中,所述ー個或更多計算機與伺服器通信。
8.權利要求I所述的計算機實施方法,其中,所述完成包括產生由語音到文字、文字到語音、文字到文字、語音到語音、視頻到視頻、所述輸入的翻譯、所述結果的翻譯、計算機到計算機文字、計算機到計算機語音和計算機到計算機視頻所構成的組中的一個或更多者。
9.權利要求I所述的計算機實施方法,其中,所述計算裝置完成解析所述輸入和過濾所述輸入中的至少ー者。
10.一種計算機實施的人工智慧個人助理系統,包括 顯示器,用於呈現移動視頻圖像給用戶; 計算裝置,用於接收來自所述用戶的輸入,所述輸入請求至少ー個任務的執行; 用於確定所述執行是否應該由零個或更多操作者連同零個或更多計算機完成的裝置,其中存在至少ー個操作者或至少一臺計算機; 用於通過所述確定的裁決,完成所述執行以產生結果的裝置;以及用於輸出所述結果給所述用戶的裝置,其中,所述結果與所述移動視頻圖像同步傳送給所述用戶。
11.權利要求10所述的計算機實施系統,其中,用於完成至少ー個任務的裝置包括 用於拆分所述至少一個任務為至少一斷片用於實施的裝置; 用於斷定所述實施是否應由零個或更多操作者連同零個或更多計算機完成的裝置,其中有至少ー個操作者或至少一臺計算機; 用於通過所述斷定的決定完成所述實施的裝置;以及用於將完成所述實施的產物重新加回到所述結果的裝置。
12.權利要求10所述的計算機實施系統,其中,所述移動視頻圖像為人的圖像,所述結果包括音頻輸出,以及所述同步包括所述音頻輸出與所述人的圖像的嘴唇移動的同歩。
13.權利要求10所述的計算機實施系統,其中,所述移動視頻圖像是計算機產生的。
14.權利要求10所述的計算機實施系統,其中,所述輸入包括選自由運動檢測、語音、視頻、鍵盤、觸控螢幕、滑鼠和手寫筆所構成的組中的至少一成員。
15.權利要求10所述的計算機實施系統,其中,所述ー個或更多計算機與零個或更多額外的計算機連網。
16.權利要求10所述的計算機實施系統,其中,所述ー個或更多計算機與伺服器通信。
17.權利要求10所述的計算機實施系統,其中,用於完成的所述裝置包括用於產生由語音到文字、文字到語音、文字到文字、語音到語音、視頻到視頻、所述輸入的翻譯、所述結果的翻譯、計算機到計算機文字、計算機到計算機語音和計算機到計算機視頻所構成的組中的一個或更多成員的裝置。
18.權利要求10所述的計算機實施系統,其中,所述計算裝置用於執行解析所述輸入和過濾所述輸入中的至少ー者。
全文摘要
本發明公開了一種人工智慧個人助理系統和方法。用戶與一個人的音頻和視頻圖像進行交互。用戶的輸入請求一個或更多任務的執行,該請求包括僅僅是由動作檢測激活的被動請求。因此,用戶可以主動請求任務,例如瀏覽電子郵件,或者被動觸發任務,例如銷售協助。取決於任務的複雜性,人工操作者或者計算機可以協助所述用戶。同步於下載結果,音頻和視頻圖像與用戶交流。
文檔編號G06F9/30GK102844738SQ201180013519
公開日2012年12月26日 申請日期2011年2月2日 優先權日2010年2月2日
發明者迪恩·斯塔克 申請人:4D零售科技公司