- 相關(guān)推薦
盤(pán)算機仿真機器人世界杯足球錦標賽攻防戰術(shù)的鉆研
【摘要】隨著(zhù)盤(pán)算機技巧的發(fā)展, 散播式人工智能中多智能體系統 (MAS Multi-agent System)的理論及利用鉆研已經(jīng)成為人工智能鉆研的熱門(mén),RoboCup(Robot World Cup),即機器人世界杯足球錦標賽,是一個(gè)在異步,有噪聲的對抗環(huán)境下,鉆研多智能體的決策和合作的問(wèn)題。本文詳細介紹了盤(pán)算機仿真足球機器人比賽中進(jìn)攻和防守的設計與實(shí)現。
【要害詞】進(jìn)攻;組織性;正確 ;快速;防守;機動(dòng)性
RoboCup(Robot World Cup),即機器人世界杯足球錦標賽。它是國際上一項為進(jìn)步相干領(lǐng)域 的教導和鉆研程度而舉辦的大型比賽 和學(xué)術(shù)運動(dòng),通過(guò)供給一個(gè)標準 任務(wù) 來(lái)增進(jìn)散播式人工智能、智能機器人技巧、及其相干領(lǐng)域 的鉆研與發(fā)展。訓練和制作機器人進(jìn)行足球賽,是當前人工智能和機器人領(lǐng)域 的鉆研熱門(mén)之一。在比賽 中,當斷定了球隊的陣型后,每個(gè)隊員分配了相應的角色,起頭討論球隊的整體和局部攻防戰術(shù)。
全隊進(jìn)攻戰術(shù)
全隊進(jìn)攻戰術(shù)是指比賽 中一方獲得球后,通過(guò)隊員之間的傳遞配合達到 射門(mén)的目標而采納的配合法子 。與局部進(jìn)攻戰術(shù)相對比,全隊進(jìn)攻戰術(shù)的進(jìn)攻面對比廣,參加 進(jìn)攻和快速回擊等。首要有邊路進(jìn)攻,中路進(jìn)攻,快速回擊等。
1、邊路進(jìn)攻:利用 球場(chǎng)兩側地區 發(fā)起進(jìn)攻的法子 叫做邊路進(jìn)攻。邊路進(jìn)攻是全隊進(jìn)攻戰術(shù)的首要情勢之一,其首要特性是有利于施展進(jìn)攻速度,打破對方防線(xiàn)制作缺口。
2、中路進(jìn)攻:中路進(jìn)攻是利用 球場(chǎng)中間區域組織的進(jìn)攻,這種進(jìn)攻雖然能直接射門(mén),但難度最大,因為中路防守最為縝密,突前的攻擊手必須 是反應極其敏銳 ,意識強而且技巧高,敢于冒險,速度快和氣于路位策應的隊員。
3、快速回擊:比賽 中當攻方進(jìn)攻時(shí),后衛線(xiàn)往往壓至中場(chǎng)左近,防守人數也由于插上進(jìn)攻和助攻而相對減少,此時(shí)抓住對方防區空隙對比大和回防較慢的時(shí)機,趁其失球發(fā)動(dòng) 快速回擊,往往能取得良好的效果 ,快速回擊是最有要挾的進(jìn)攻手法,有效發(fā)動(dòng) 快速回擊。能有效得分,但其有必然的冒險性。所以要控制正確快速的原則。配合要有組織性,要非常有默契,需要 多次練習。否則很難在比賽 中實(shí)行。
全隊防守戰術(shù)
防守戰術(shù)可分為兩種根基類(lèi)型:盯人緊逼防守(人盯人防守),即在規定的領(lǐng)域內盯人緊逼,不交換 看守:區域緊逼防守(盯人和區域相聯(lián)合),即現今風(fēng)行的綜合防守,緊逼和保護相聯(lián)合,在個(gè)人的防區內緊逼,作交替看守。盯人防守即各自都有明確 的防守對象。防守最根本 的原則是緊逼和保護。只有緊逼才干有效地主動(dòng) 斷搶?zhuān)瑝阂謱Ψ郊记傻膬?yōu)勢而獲得主動(dòng) 權:保護是為了更好地緊逼和把持空檔,為博得比賽 籌辦機會(huì )。防守可以被解釋 成一個(gè)安排 的事件。在清華設計地隊伍中它是應用一個(gè)類(lèi)型,基于情況 的策略安排 理論。安排 最首要的一點(diǎn)是在根基的編隊中,哪個(gè)斷定一個(gè)隊員的地位通過(guò)標準 的角色分配,球的地位和球的把持狀態(tài) 。在這個(gè)防守問(wèn)題上,根基的信息供給作為一個(gè)標準 ,命名的,一個(gè)雷同的角色,因為角色分配和任務(wù) 評價(jià)。另外一個(gè)首要的事實(shí)是在防守的地位機動(dòng)性,這個(gè)測量多么危險,如果一個(gè)對手站在給定的地位。防守地位機動(dòng)性因為任意的點(diǎn)在球場(chǎng)上的是先前已經(jīng)知道在所有的隊友中間。
四種類(lèi)型的防守動(dòng)作:
1、lock(陰礙 ):交叉一個(gè)對手的占領(lǐng)這個(gè)球在我們球門(mén)的外圍,禁止他向前推動(dòng)。
2、Press(壓力):跑,在一個(gè)對手占領(lǐng)這個(gè)球,并且在我們球門(mén)的左近,維持對他有要挾
3、Mark(盯人):盯住一個(gè)沒(méi)有球的對手,因此他的隊友不可以傳球給他
4、Point Defend(地位防御):站在根基的信息地位,這個(gè)將有利益,當一個(gè)左近的隊友在1vs1中失敗了,或者當這個(gè)隊重新奪回了球的把持權。
為了簡(jiǎn)化這個(gè)問(wèn)題,我們設置一個(gè)規矩,一個(gè)防守隊員不可以防守兩個(gè)對手在雷同的光陰里面,還有兩個(gè)防守隊友不該當防守雷同的對手。這個(gè)互斥的操作被供給在雷同的這些情況 下。這個(gè)沖突的操作沒(méi)有在這里應用。那里有一個(gè)二中擇一,就是block和press被設置成沖突,替代了互斥,供給一個(gè)不同的防守策略。因此另外一個(gè)也是可以的,我們不再進(jìn)一步深入 討論。在分解一個(gè)防守任務(wù) 到防守每個(gè)進(jìn)攻的對象,和站在根基的信息點(diǎn),布置被產(chǎn)生 通過(guò)鏈接每個(gè)防守隊員到每個(gè)子任務(wù) 。那時(shí)候,這個(gè)程序達到一個(gè)評價(jià)個(gè)體的效用。
我們定義了一個(gè)評價(jià)函數為了每種類(lèi)型的動(dòng)作。這些變量被用來(lái)每個(gè)評價(jià)函數的輸入:猛烈,測量光陰間隔從隊員的當前地位到防守地位,背離,測量距離從防守的點(diǎn)到隊員的根基的編隊地位,要挾,也就是這個(gè)防守地位機動(dòng)性對手當前的地位。這個(gè)函數輸出增加隨著(zhù)要挾和減小隨著(zhù)距離和背離。為了點(diǎn)防守,只有要挾作為輸入。為了獲得每個(gè)函數的實(shí)際的值,我們設置一些范例的情景,從他們之間摘錄輸入值,然后賦予輸出值到這個(gè)函數。這個(gè)值被警惕的裝入來(lái)維持輕微的變更。在這個(gè)法子 下,一個(gè)輸入和輸出的列表數據就生成了。
在清華設計中,他們應用 BP網(wǎng)絡(luò )神經(jīng)去編碼評價(jià)函數。這個(gè)列表產(chǎn)生 被應用作為訓練網(wǎng)絡(luò )神經(jīng)的設置。在訓練之后,網(wǎng)絡(luò )被測試去確保他們適宜在先前的段中請求的,因此評價(jià)函數就斷定了,但我們隊伍還在改善中。剩下的企圖 到一個(gè)標準 的程序現在上面和沒(méi)有需要 更進(jìn)一步的討論。還留下一個(gè)補救企圖 的產(chǎn)生 。有時(shí)候這個(gè)隊保持一致失敗了。例如,當一個(gè)對手和兩個(gè)防守隊員的地位的距離雷同,而且在雷同的光陰里面。編隊的點(diǎn)。這兩個(gè)布置將有類(lèi)似的評價(jià),這兩個(gè)防守隊員可能沖突。我們的設計利用 這個(gè)絕對的反饋存在這個(gè)系統 中。因為球將維持移動(dòng)在這個(gè)比賽 中,和對手必須 向前移動(dòng)去進(jìn)攻,另外這個(gè)根基的信息地位或者防守的點(diǎn)將轉變在下個(gè)周期。那里有一個(gè)小小的轉變使得這兩個(gè)布置仍然維持雷同的評價(jià)。一旦這兩個(gè)布置不同的時(shí)候足夠明顯 為兩個(gè)防守隊員去分手 出來(lái)。這個(gè)預先防守隊員將履行這個(gè)防守動(dòng)作,更接近的移動(dòng)到對手。然后另外一個(gè)將移動(dòng)到另外一個(gè)方向。因此,這個(gè)對照 增加,這個(gè)系統 提取一個(gè)狀態(tài) 分手來(lái)自先前的進(jìn)退兩難的局面 。因此又可以完成一致了。
防守算法的實(shí)現
1、防守算法的初始想法
第一步:找球的地位,即時(shí)更新
第二步:確定 球是否在可踢領(lǐng)域:
如果可踢,則根據 自己所在的地位作出相應的動(dòng)作,具體是:
如果再罰球去內,馬上把球踢出去,且盡量傳給隊友;如果再罰球區外,可以適當 的帶球,把球送往中場(chǎng);
如果不可踢,則進(jìn)入第三步;
第三步:確定 自己是不是有責任 去斷球:
有,則毫不躊躇的去斷球,斷球也要分區域,在罰球區,則要以全力跑過(guò)去斷球,如果身后有自己的隊友,則可以考慮 鏟球,如果自己在進(jìn)攻球員的后面(他已經(jīng)過(guò)了我),則要馬上從后面鏟球;
沒(méi)有,則要進(jìn)行協(xié)防,進(jìn)入第四步;
第四步:是協(xié)防,這步我感覺(jué)是最難的,因為這種情況 太多了,現在只有大概的一點(diǎn)思想:還是要把后半場(chǎng)分區,針對各區采納各種mark策略
第五步:根據 隊形調劑自己的地位
2、防守算法的實(shí)現流程:
|-->如果沒(méi)有開(kāi)球:
| |-->如果是本方開(kāi)球且球員自己是9號:
| | |->如果球在可踢領(lǐng)域:則以最大力把球kick出去;
| | |->如果球不可踢: 則搶斷;
| |-->如果當前隊形不是初始化隊形或者球員自己的實(shí)際地位偏離隊形規定地位(以下稱(chēng)為策略地位)1m以上:則導入初始隊形,球員直接移到自己的策略地位;
| |-->如果是7號或者8號:則籌辦移動(dòng)到9號kickto的點(diǎn),并把頭轉向球;
| |-->其他情況 :則把身材對向(0,0),并把頭轉向球;
|-->如果已開(kāi)球:則先導入防守的433隊形,
| |-->如果球的信息不是最新的:則搜索球,并轉動(dòng)頭以助以尋找;
| |-->如果球在可踢領(lǐng)域:
| | |-->如果在球員自己的罰球區:則以最大力把球以相對安全的角度kick出罰球區;
| | |-->如果在自己前方5m,角度為(-80,80)的扇形區域內有對方球員:則以最大力把球轉移,即ClearBall;
| | |-->如果在自己前方5m,角度為(-80,80)的扇形區域內沒(méi)有對方球員 :則以不大的力把球kick出去;
| | |-->其他:則帶球前進(jìn);
| |-->如果球員自己是隊友中最快可以達到球的地位的球員,即球員自己最有責任 斷球:
| | |-->如果球正被對方帶向球門(mén):
| | | |-->如果球員自己和球的距離小于2。5m:則鏟球;
| | | |-->否則:則加速跑向球;
| | |-->否則:則搶斷;
| |-->如果球員自己的當前地位偏離他的策略地位(1。5+(球員與球的距離)/10。0)m:則即時(shí)調劑自己的地位;
| |-->如果球員在自己的半場(chǎng):則進(jìn)入mark狀態(tài) ,
| | |-->如果球員在自己的罰球區內:則采納 MARK_GOAL 的mark法子 (防止被防球員接球射門(mén));
| | |-->如果球員在自己罰球區兩側:則采納 MARK_BISECTOR 的mark法子 (既防止被防球員接球,又防止其接球射門(mén));
| | |-->在其他區域 :則采納 MARK_BALL 的mark法子 (防止被防球員接球);
| |-->如果球員自己與球的相對角度大于1:則把身材轉向球,并把頭轉向球;
| |-->其他情況 :轉頭(觀(guān)察);
注:以上的流程遇到“;”就返回,得到一個(gè)soc(命令),最后將soc返回。
【參考文獻】
[1]李實(shí)、徐旭明、葉榛、孫增圻編著(zhù),《綜述:國際機器人足球比賽 及其相干技巧》,清華大學(xué)盤(pán)算機系國家 智能技巧與系統 重點(diǎn)實(shí)驗 室,1999 年。
[2]孫增圻、李實(shí)編著(zhù),《RoboCup 與智能主動(dòng)化》,清華大學(xué)盤(pán)算機科學(xué)與技巧系,1999 年。
【盤(pán)算機仿真機器人世界杯足球錦標賽攻防戰術(shù)的鉆研】相關(guān)文章:
計算機仿真機器人世界杯足球錦標賽攻防戰術(shù)的研究03-20
探討仿真計算機與實(shí)時(shí)網(wǎng)絡(luò )技術(shù)12-03
汽車(chē)領(lǐng)域計算機仿真技術(shù)研究03-28
智能變電站計算機仿真論文11-13
化工中計算機仿真技術(shù)研究03-28
基于力反饋器的模塊化機器人控制建模與仿真03-12