傳統設計方法的另一種可替代性方法是將機器人組織成一個執行預定任務的自組織系統。因此,機器人通過簡單的局部交互實現了全局系統行為,而無需集中控制。正如自然界中的許多例子所展示的那樣,簡單的交互規則可以出現相當復雜的行為,同時能夠針對干擾和故障展現出可擴展性和魯棒性。這將使得簡單的控制系統,例如特定的機器人,身上具有一個小型的人工神經網絡(ANN)。
一種顯示輸入、輸出和隱藏神經元組的神經網絡的可能性布線方式。其中,粗線表示用更為強健的權重進行的連接,而權重較輕的連接則用灰色線表示。
不幸的是,現在還沒有一個直接的方法能夠設計這些規則,從而使整個系統顯示出所需的屬性。通常而言,這一新興服務是很難甚至是無法對其進行預測的。因此,對于系統設計人員來說,找到一組能夠使整個系統展現出所需屬性的規則是一項巨大且艱難的挑戰。主要問題在于,一個參數的微小變化可能會導致意想不到、甚至是違反直覺的結果。
要想設計一個具有所需新興行為的自組織系統,關鍵是要為系統組件(智能體)的行為找到局部規則,從而在系統規模上生成預期的行為。在大多數情況下,這需要進行大量的實驗和反復的試錯才能夠成功,而且在這個過程中,如果系統具有高度復雜性,那么效率將會非常低,甚至是不可能完成的。由于參數之間的意外依賴性關系,參數密集型系統也會受到結果的不可預測性影響。
使用不同I / O接口的人工神經網絡(ANN)進行比賽的結果顯示
在本文中,我們討論了進化方法在設計自組織機器人團隊的基于人工神經網絡控制系統中的應用。具體來說,我們對神經控制器和機器人之間的界面設計進行了處理,并詳細說明適應度函數(fitness function)參數對結果的特殊影響。作為該方法的案例研究,我們描述了模擬足球機器人的神經控制程序的演變過程。
我們已經描述了一種用于協同機器人團隊進化神經網絡控制器的方法。給定一個總體目標函數,我們使用進化算法,演化出神經網絡控制器的特定權重和偏差。因此,神經網絡學習對感官輸入進行解釋以控制機器人執行器,并根據有利于給定任務的策略行為進行行動。該方法是非常靈活的,可以應用于各種各樣的問題,但它依賴于一個足夠精確的模擬,以及一個能夠為進化算法提供必要梯度的適應度函數。
模擬足球機器人比賽中,一組用于檢測球的輸入神經元
在案例研究中,我們已經對模擬足球機器人的控制行為進行了演化,從而協同性地贏得足球比賽。經過數百次的生成之后,一個團隊的球員能夠采取有用的行為方式。與相關研究工作形成對比的是,這些球員并沒有演變成諸如后衛、中場或前鋒這樣先驗定義的角色,但他們都有一個相同的神經網絡控制器的實例。但是,在比賽期間,球員會根據他們所處的情況狀態而表現出不同的行為。因此,與生物系統類似,實體會以一種自組織的方式指定不同的角色。但由于這些實體是相同的,所以該系統對一些實體的失敗具有很高的魯棒性。
在實驗中,我們研究了各種因素可能會對結果造成的影響,結果顯示,最重要的因素是神經網絡與傳感器/執行器之間的接口設計。雖然從理論上來說,人工神經網絡可以采用不同的傳感器/執行器接口表示方式,但是找到一個對于人工神經網絡來說具有較低“認知復雜度”的接口是很有必要的,在我們的例子中,這是一個傳感器和預期的機器人運動的簡單直角坐標表示(cartesian representation)。除此之外,我們還分析了使用不同大小和類型的人工神經網絡所產生的影響。雖然神經元的數量對性能表現的影響最小,但這種表示類型主要是有利于完全連接的網絡類型。
未來,我們打算對所生成解決方案的魯棒性和容錯性進行評估。此外,我們的系統對表示(例如,使用不同的控制器類型)、優化方法和問題定義(例如,將方法應用于不同的問題域)呈現一個開放的狀態,而該領域仍具有很大的發展空間。
2025-06-01 18:37
2025-05-31 19:52
2025-05-31 19:49
2025-05-26 12:52
2025-05-26 09:00
2025-05-22 15:01
2025-05-21 20:49
2025-05-21 13:31
2025-05-18 16:04
2025-05-17 11:32