
1、實體平臺
a) NAO是一個身高58厘米的可編程仿人機器人,內含以下構件:
b) 擁有25個自由度的身體,主要元件為電機和電動致動器;
c) 傳感器系統,包括:2 個攝像頭、4 個麥克風、聲納測距儀、2 套紅外線接收器和發送器、1 個慣性器件板、9 個觸摸傳感器和 8 個壓力傳感器;
d) 多種交流設備,包括語音合成器、LED燈及2個高保真揚聲器;
e) 英特爾ATOM 1.6 GHz處理器(位于頭部),運行LINUX內核,并支持Aldebaran公司獨家開發的中間件(NAOqi);
f) 第二個CPU(位于軀干);
g) 48.6 瓦時電池,根據使用情況,可為 NAO 提供超過 1.5 個小時的自主動力。
2、運動
a) 全方位行走
NAO行走使用的是一個簡單的動態模型(直線倒立擺)和二次規劃,通過關節傳感器反饋的信息來保持穩定,保證行走的魯棒性,免受小干擾,并可吸收軀干在正向和側向平面上的擺動。NAO可在多種地面上行走,如地毯、瓷磚地、木地板等,并可在行走過程中順利地從一種地面走到另一種地面上。
b) 全身運動
NAO的運動模塊基于廣義逆運動學,可處理笛卡爾坐標系、關節控制、平衡、冗余性和任務優先性。換言之,如果您要求NAO伸出手臂,由于需要同時考慮到其手臂和腿部的關節,NAO在執行這個動作時會向前俯身。此外,NAO為保持平衡會停止移動。
c) 摔倒管理器
摔倒管理器可在NAO摔倒時起到一定的保護作用。其主要功能是探測NAO的質量中心是否超出了支撐多邊形。后者由機器人的足底與地面的接觸點來決定。一旦探測到機器人摔倒狀況,所有運動任務都會被終止,NAO的雙臂會根據摔倒方向采取保護姿勢,機器人的質心會降低,剛度會降至零。
3、視覺
a) NAO擁有兩個攝像頭,可追蹤、記憶并識別不同的圖像和人臉。
b) NAO 配備了 2 個 1220p 攝像頭,每秒最多可攝取 30 個圖像。
c) 一個攝像頭位于NAO前額,負責水平掃視。另一個位于嘴部,掃描周圍環境。
d) 可通過軟件獲得 NAO 看到的圖片和視頻流。不過,如果機器人不會詮釋看到的事物,那么就算它看得再清楚,也一無用處。
e) 這就是為什么NAO身上包含了一系列算法,可幫助機器人探測并識別出看到的人臉或形狀。這樣,NAO就可以認出和它說話的人,也可以找到皮球或更加復雜的物品。
f) 這些算法以盡量減少CPU使用資源為宗旨特別開發而成。
g) 此外,還可以通過NAO的軟件開發工具包(SDK)自行開發模塊,并與OpenCV接口(OpenCV是最初由英特爾公司開發的開源計算機視覺模塊庫)。
h) 可直接在NAO上運行模塊,或是將其傳送到與NAO相連的電腦上執行,從而可以很容易地使用OpenCV的顯示功能,通過反饋的圖像來開發和測試算法。
4、語音
NAO 使用 4 個定向麥克風來探測聲音,并可通過語音識別和聲音合成功能,運用 19 種語言與人交流。
a) 聲源定位
研制仿人機器人的主要目的之一是讓機器人與人交流互動。聲源定位功能可幫助機器人辨別出聲源方向。為了獲得魯棒且有用的輸出數據,并同時考慮到內存和CPU的限制,NAO的聲源定位基于一個名為“到達時間差”的方法。 當近處一個聲源發出聲音時,NAO的4個麥克風接收到聲波的時間會略有不同。 例如,如果一個人站在NAO左邊和它說話,其聲波會首先到達左側麥克風,在幾微秒后到達位于前方和后方的麥克風,最后到達右側麥克風。 這種時間差名為“雙耳時間差”,可對其進行數學處理,以確定聲源的位置。 由此,NAO在每次聽到聲音時,都可通過4個麥克風上的“雙耳時間差”數據,經過運算,確定聲源的方向(方位角和仰角)。 這個功能由名為“ALAudioSourceLocalization”的NAOqi模塊來完成,提供C++和Python接口,可使用Python腳本或NAOqi模塊進行精確的互動。 此外,Chorégraphe軟件中包含兩個指令盒,幫助用戶在行為程序中很容易地使用該功能。
b) 可行的應用實例:
探測、追蹤并識別人;
探測、追蹤并識別發聲物體;
在某個特定方向進行語音識別;
在某個特定方向識別說話的人;
遠程跟蹤/安全應用程序;
娛樂用應用程序。
c) 處理音頻信號
在機器人上,嵌入式處理器的運算能力往往很有限,因此有必要在電腦或服務器上進行某些遠程運算。 這一點在處理音頻信號時尤其明顯,在一個遠程處理器上進行語音識別往往會更加有效、快速和準確。大多數智能手機都可完成此類遠程語音識別。 不過,一些機器人用戶會更喜歡將自行開發的信號處理算法直接安裝在機器人上。 NAOqi 的環境使用簡單對象訪問協議(Simple Object Access Protocol,簡稱 SOAP),通過網絡收發音頻信號。 借助高級Linux聲音構架庫(ALSA) 產生聲音并儲存在NAO上。 ALAudioDevice模塊管理音頻輸入和輸出。 NAO的語音功能可幫助用戶在電信和人機互動領域開展廣泛的研究和實驗工作。 例如,用戶可把NAO用作交流工具,像對人一樣和NAO對話。
5、觸摸傳感器&聲納測距儀
a) 觸摸傳感器
除了攝像頭和麥克風以外,NAO還配備了電容式傳感器,分別位于頭頂(分為三部分)和雙手。 您可以通過觸摸機器人向其發送信息,例如輕按頭部一次,讓NAO停止動作。這些傳感器也可用于觸發一些相關動作。 該系統配有LED燈,可顯示接觸類型。用戶還可設定復雜的序列。
b) 聲納測距儀
NAO配備了2個聲納信道:2個發送器和2個接收器。 由此,NAO 可估測與周圍障礙物之間的距離。探測范圍為 1 厘米至 3 米。 如與障礙物相距不到15厘米,NAO不會收到具體的距離數據,而只會知道附近有一個物體。 信號處理無疑是一個很好的實例。通過音頻模塊,您可實時獲取麥克風提供的原始數據,并使用您自己的編碼進行處理。
6、連接性
a) 以太網及無線上網
目前,NAO 支持 Wi-Fi 無線上網(b/g/n)和以太網。這是目前最常用的網絡通信協議。此外,NAO 還可通過安裝在雙眼內的紅外線收發器連接到周圍的物體上。NAO 與 Wi-Fi IEE 802.11g 標準兼容,可在 WPA 和 WEP 網絡使用,從而可以連接到大多數家用和企業網絡。NAO 的操作系統支持以太網和 Wi-Fi 連接。在設置 Wi-Fi 時,只需輸入密碼即可。 NAO的聯網功能為開發其應用提供了大量空間。用戶可使用網絡上的任意一臺電腦來控制NAO或為其編程。
b) 以下為NAO用戶創建的幾個應用實例:
通過其IP地址,NAO可以知道自己身處何地,并向用戶提供個性化的天氣預報; 向NAO提出一個關于某主題的問題,它會自動鏈接到維基百科,找到并讀出相應的解釋 ; 將NAO連至一個音頻流,它會為您播放某個在線電臺的廣播節目; 使用XMPP技術(類似Google Chat討論技術),遠程控制NAO并獲取其攝像頭的視頻流。
c) 紅外線
NAO可憑借紅外線技術與其他NAO及其他使用紅外線的設備進行交流。您可設置NAO,通過紅外線交流來控制其他設備(如“NAO,請把電視打開!”)。NAO還可接收由遙控器等紅外線發射器發送的指令。當然,兩個機器人NAO之間可直接交流。 紅外線技術是目前最常見的設備控制方法,這使NAO很容易適應家庭自動化應用。NAO還可確定紅外線信號是來自左側還是右側。
7、開源 Aldebaran Robotics公司一直致力于為機器人平臺開發嵌入式系統,并希望與廣大仿人機器人研究人員、程序開發員及新興項目策劃和執行人員分享其多平臺建設工具、中央交流庫和其他基本模塊。 用戶可憑借Aldebaran Robotics公司的豐富經驗,專注于開發精彩的創新程序。 此外,用戶還可獲得強大的創新技術支持,而創新正是迅速成長的NAO社團的一大特色。 因此,用戶社團成員之間應積極合作,長期互通有無,著眼于未來,共同探索新的應用程序。 |