Fjölvitrænir verkefnalausnaármenn

Verkefni lokið – fréttatilkynning verkefnisstjóra

11.9.2014

Tækni byggð á gervigreind er að finna í tækjum og tólum sem eru mikilvæg í okkar daglega lífi, til dæmis í stafrænum myndavélum (sjálfkrafa fókus) og bifreiðum (bakka sjálfar í stæði).

Margra ára þrotlausar rannsóknir liggja að baki því að hægt sé að hagnýta gervigreindartækina á þennan hátt, og í síauknum mæli erum við að treysta á að tölvurnar taki sjálfstæðar ákvarðanir.  

Heiti verkefnis: Fjölvitrænir verkefnalausnaármenn
Verkefnisstjóri: Yngvi Björnsson, dósent við tölvunarfræðideild Háskólans í Reykjavík
Tegund styrks: Verkefnisstyrkur
Styrkár: 2010-2013
Fjárhæð styrks: 17,790 millj. kr.
Tilvísunarnúmer Rannís: 10003902 

VERKEFNIÐ VAR STYRKT AF RANNSÓKNARSJÓÐI. 

Þetta rannsóknarverkefni, sem unnið var við Gervigreindarsetrur Háskólans í Reykjavík, fólst í því þróa frekar aðferðir sem gera hugbúnaði sem notaður er við ákvörðunartöku í rauntíma (t.d. í leikjaforritum) kleift að læra af reynslu þ.a. hann nái að leysa af sjálfsdáðum fjölbreytilegar gerðir vandamála. Sérstök áhersla var lögð á þróun svokallaðra alhliða leikjaforrita og notkun hermileitar við ákvarðanatöku. Borð- og tölvuleikir hafa áratugum saman verið notaðir við þróun á ýmiskonar gervigreindartækni, enda krefst margþættrar færni að spila slíka leiki vel.  Í gengum tíðina hafa verið þróuð leikjaforrit sem standa jafnfætis mönnum í krefjandi leikjum á borð við skák og damm. Slíkur árgangur er að stóru leyti tilkominn vegna þrotlausrar vinnu sérfræðinga við að byggja þekkingu á viðkomandi leik inn í leikjaforritin.  Rannsóknir á alhliða leikjaforritum hafa það markmið að þróa tæknina áfram, þannig að leikjaforritin geti lært af sjálfdáðum að spila nánast hvaða leik sem er án þess að mannhöndin þurfi að koma þar nærri. Ef forritinu er til dæmis gefin lýsing á mannganginum í skák þá ætti forritið að vera fært um að læra af sjáfdáðum tefla vel.  Þessi tækni opnar í framtíðinni möguleika á ýmiskonar kerfum sem geta lært að leysa af hendi margskonar verkefni án þess að mannshöndin komi þar nærri.

Að verkefninu komu, auk verkefnisstjóra, nýdoktorar og nemar í doktors- og meistaranámi við tölvunarfræðideild Háskólans í Reykjavík, svo og samstarfsaðilar við háskóla í Hollandi og Kanada. Öll helsu markmið verkefnisins voru uppfyllt, sem leiddu m.a. til áframhaldandi þróunar á fullkomu hugbúnaðarkerfi, CadiaPlayer, sem lærir að spila margskonar leiki af sjálfsdáðum.  Þróaðar voru nýjar aðferðir við að stýra hermileit sem hafa þegar sannað gildi sitt, en  CadiaPlayer er einn af fremstu alhliða leikjaspilurum í heiminum í dag og hefur til dæmis í þrígang unnið alþjóðlega keppni slíkra hugbúnaðarkerfa, nú síðast árið 2012. Hönnunin sem spilarinn byggir á hefur haft mikil áhrif á rannsóknir á þessu sviði gervigreindar og nota nú nær öll helstu alhliða leikjaforrit sambærilega tækni.  Jafnframt voru leitar- og lærdómsaðferðir sem þegar voru til staðar útvíkkaðar til að takast betur á við fjölbreyttari gerðir vandamála, til dæmis þegar ákvarðanir eru teknar samtímis eða þegar upplýsingar um ákvörðunartökuvandamál eru að hluta óþekktar. Einnig var skoðað hvernig þessi tækni nýtist í öðrum flóknum ákvörðunartökuvandamálum, svo sem við sjálfvirkra áætlunargerð og villuleit í líkönum.  Niðurstöður verkefnisins hafa verið kynntar í tímaritum og á helstu alþjóðlegum ráðstefnum á sviði gervigreindar, samanber eftirtaldar greinar og ritgerðir:

  • Hilmar Finnsson and Yngvi Björnsson (2010). Learning Simulation Control in General Game-Playing Agents. In The Twenty-Fourth AAAI Conference on Artificial Intelligence, pp. 954–959, AAAI Press.
  •  M. Winands, Y. Björnsson and J. Saito (2010). Monte-Carlo Tree Search in Lines of Action. IEEE Transactions on Computational Intelligence and AI in Games, 2(4), pp. 239–250.
  • Hilmar Finnsson and Yngvi Björnsson (2011). CadiaPlayer: Search-Control Techniques. Kunstlige Intelligence Journal 25(1), p. 9-16, Springer.
  • Hilmar Finnsson and Yngvi Björnsson (2011). Game-Tree Properties and MCTS performance. In The International Joint Conference on Artificial Intelligence (IJCAI'11), GIGA workshop,  Barcelona, Spain, pp. 23–30.
  • Stefán Freyr Guðmundsson and Yngvi Björnsson (2011). MCTS: Improved Action Selection Techniques for Deterministic Games.  In The International Joint Conference on Artificial Intelligence (IJCAI'11), GIGA workshop, Barcelona, Spain, pp. 45–52.
  • Steinar Hugi Sigurðarson. Guided Search for Deadlocks in Actor-Based Models. MSc thesis in Software Engineering, School of Computer Science, Reykjavík University, June, 2011.
  • Stephan Schiffel and Michael Thielscher. Reasoning About General Games Described in GDL-II. In The Twenty-Fifth AAAI Conference on Artificial Intelligence, pp. 846–851, AAAI Press.
  • Björn Jónsson. Representing Uncertainty in RTS Games. MSc thesis in Software Engineering, School of Computer Science, Reykjavík University, January, 2012.
  • Mandy Tak,  Mark Winands, Yngvi Björnsson (2012)  N-Grams and the Last-Good-Reply Policy applied in General Game Playing. IEEE Transactions on Computational Intelligence and AI in Games, 4(2), pp. 73–83.
  • Steinar Hugi Sigurðarson, Marjan Sirjani, Yngvi Björnsson, and Árni Hermann Reynisson (2012). Guided Search for Deadlocks in Actor-Based Models. In FACS, pp. 242–259, Lecture Notes in Computer Science 7684, pp. 242–259, Springer.
  • Yngvi Björnsson (2012). Learning Rules of Simplified Boardgames by Observing. In European Conference on Artificial Intelligence (ECAI'12), pp. 175-180.
  • Hilmar Finnsson (2012). Generalized Monte-Carlo Tree Search Extensions for General Game Playing. In The Twenty-Sixth AAAI Conference on Artificial Intelligence, pp. 1550–1556, AAAI Press.
  • Abdallah Saffidine, Hilmar Finnsson, and Michael Buro (2012). Alpha-Beta Pruning for Games with Simultaneous Moves. In The Twenty-Sixth AAAI Conference on Artificial Intelligence, pp. 556–562, AAAI Press.
  • Sebastian Haufe, Stephan Schiffel, Michael Thielscher. Automated verification of state sequence invariants in general game playing. Artificial Intelligence 187, pp. 1-30,  2012.
  • Daniel Michulke, Stephan Schiffel.  Distance Features for General Game Playing Agents. In 4th International Conference on Agents and Artificial Intelligence, pp. 127-136, 2012.
  • Hilmar Finnsson (2012). Simulation-Based General Game Playing. PhD thesis in Computer Science, School of Computer Science, Reykjavík University, June, 2012.

 










Þetta vefsvæði byggir á Eplica