OpenAI's Dota 2-nederlaag is nog steeds een overwinning voor kunstmatige intelligentie
Machines leren, net als mensen, het beste wanneer ze worden geslagen
Vorige week sloeg de mensheid terug tegen de machines - een soort van.
Eigenlijk hebben we ze verslagen in een videogame. In eenbest-of-three wedstrijd, hebben twee teams van professionele gamers een team van AI-bots overwonnen die zijn gemaakt door het door Elon Musk opgerichte onderzoekslab OpenAI. De concurrenten waren aan het spelenDota 2, een fenomenaal populair en complex strijdarenaspel. Maar de match was ook een soort lakmoesproef voor kunstmatige intelligentie: de nieuwste spraakmakende maatstaf voor onze ambitie om machines te maken die ons kunnen overtreffen.
In de mens-AI-scorecard heeft kunstmatige intelligentie onlangs een aantal grote overwinningen behaald. Het meest opvallend was de nederlaag van 's werelds beste Go-spelers door DeepMind's AlphaGo, een prestatie die experts minstens tien jaar buiten bereik dachten. Onlangs hebben onderzoekers hun aandacht gericht op videogames als de volgende uitdaging. Hoewel videogames de intellectuele reputatie van Go en schaken missen, zijn ze eigenlijk veel moeilijker voor computers om te spelen. Ze houden informatie achter voor spelers; plaatsvinden in complexe, steeds veranderende omgevingen; en vereisen het soort strategisch denken dat niet gemakkelijk kan worden gesimuleerd. Met andere woorden, ze staan dichter bij het soort problemen dat we willen dat AI in het echte leven aanpakt.
De nederlaag van OpenAI is slechts een hobbel op de weg voor AI-vooruitgangDota 2is een bijzonder populaire proeftuin en men denkt dat OpenAI de beste heeftDota 2bots rond. Maar vorige week verloren ze. Dus wat gebeurde er? Hebben we een soort plafond bereikt in het vermogen van AI? Is dit het bewijs dat sommige vaardigheden gewoon te complex zijn voor computers?
De korte antwoorden zijn nee en nee. Dit was slechts een hobbel in de weg, zegt Stephen Merity, een machine learning-onderzoeker enDota 2ventilator. Machines zullen het spel uiteindelijk veroveren, en het zal waarschijnlijk OpenAI zijn die de zaak kraakt. Maar uitpakkenwaarommensen hebben vorige week gewonnen en wat OpenAI wist te bereiken - zelfs in een nederlaag - is nog steeds nuttig. Het vertelt ons wat AI wel en niet kan en wat er gaat gebeuren.
rogan

Ruzie maken over de slimheid van de bots is één ding, maar dat van OpenAI FiveDota 2wedstrijden riepen ook een andere, meer fundamentele vraag op: waarom organiseren we deze evenementen eigenlijk?
Neem de opmerkingen van Gary Marcus, een gerespecteerde criticus van debeperkingen van hedendaagse AI. In aanloop naar de games van OpenAI vorige week wees Marcus er op Twitter op dat de bots niet eerlijk spelen. In tegenstelling tot menselijke gamers (of sommige andere AI-systemen), kijken ze niet echt naar het scherm om te spelen. In plaats daarvan gebruiken zeDota 2’s bot API om het spel te begrijpen. Dit is een feed van 20.000 nummers die in numerieke vorm beschrijft wat er aan de hand is, met informatie over alles, van de locatie van elke held tot hun gezondheid tot de afkoeling van individuele spreuken en aanvallen.
Zoals Marcus verteltDe rand, dit lost het enorm uitdagende probleem van scèneperceptie op en geeft de bots een enorm voordeel. Ze hoeven niet op de kaart te zoeken om bijvoorbeeld te zien waar hun team is, of naar de gebruikersinterface te kijken om te zien of hun krachtigste spreuk klaar is. Ze hoeven de gezondheid van een vijand niet te raden of hun afstand in te schatten om te zien of een aanval de moeite waard is. ze gewoonweten.
Maar telt dit als bedrog?
Er zijn een paar manieren om hier antwoord op te geven. Ten eerste had OpenAI een visiesysteem kunnen creëren om de pixels te lezen en dezelfde informatie op te halen die de bot-API biedt. (De belangrijkste reden waarom dit niet het geval was, is dat het ongelooflijk veel middelen zou hebben gekost.) Dit is lastig te beoordelen, omdat niemand weet of het zou werken totdat iemand het daadwerkelijk heeft gedaan. Maar het is misschien niet relevant. De belangrijkste vraag zou kunnen zijn: kunnen we?ooiteen eerlijk gevecht hebben tussen mens en machine? Immers, als we willen benaderen hoe mensen spelenDota 2, moeten we robothanden bouwen voor de OpenAI Five om een muis en toetsenbord te bedienen? Om het nog eerlijker te maken, moeten de handenzweet?
machines denken als mensen op dezelfde manier als vliegtuigen vliegen als vogelsDeze vragen zijn een beetje grappig, maar ze onderstrepen de onmogelijkheid om een echt gelijk speelveld te creëren tussen mens en computer. Zoiets bestaat niet omdat machines denken als mensen op dezelfde manier als vliegtuigen vliegen als vogels. Zoals AI-game-onderzoeker Cook het stelt: Natuurlijk zijn computers beter in dingen dan wij. Daarom hebben we computers uitgevonden.
Misschien moeten we wat dieper nadenken over waarom we deze evenementen in de eerste plaats houden. Brockman verteltDe randdat er meer is dan gamen. De reden waarom we dat doenDotais niet zo dat we kunnen oplossenDota, hij zegt. We zitten hierin omdat we denken dat we de AI-technologie kunnen ontwikkelen die de wereld de komende decennia van stroom kan voorzien.
Er zit waarheid in deze ambitieuze bewering. De trainingsinfrastructuur die wordt gebruikt om de OpenAI Five - een systeem genaamd Rapid - te onderwijzen, wordt nu al gebruikt voor andere projecten. OpenAI heeft het bijvoorbeeld gebruikt om robothanden te leren objecten te manipuleren met nieuwe niveaus van menselijke behendigheid. Zoals altijd bij AI zijn er beperkingen, en Rapid is niet een of ander algoritme dat alles kan. Maar het algemene principe geldt: het werk dat nodig is om zelfs willekeurige doelen te bereiken (zoals het verslaan van mensen in een videogame) helpt het hele gebied van AI aan te sporen.

En het helpt ook degenen die worden uitgedaagd door de machines. Een van de meest fascinerende delen van het AlphaGo-verhaal was dat hoewel de menselijke kampioen Lee Sedol werd verslagen door een AI-systeem, hij en de rest van de Go-gemeenschap er ook van leerden. De speelstijl van AlphaGo verstoorde eeuwen van geaccepteerde wijsheid. Zijn bewegingen worden nog steeds bestudeerd en Lee maakte een winnende reeks na zijn wedstrijd tegen de machine.
Hetzelfde begint al te gebeuren in de wereld vanDota 2: spelers zijnhet spel van OpenAI Five bestuderenom nieuwe tactieken en bewegingen te ontdekken. Ten minste één voorheen onontdekte game-monteur, waarmee spelers een bepaald wapen snel kunnen opladen door buiten het bereik van de vijand te blijven, is ontdekt door de bots en doorgegeven aan mensen. Zoals AI-onderzoeker Merity zegt: ik wil letterlijk naar deze wedstrijden zitten kijken, zodat ik nieuwe strategieën kan leren. Mensen kijken naar dit spul en zeggen: 'Dit is iets dat we in het spel moeten trekken.'
Dit fenomeen van AI die mensen leert, zal in de toekomst waarschijnlijk alleen maar vaker voorkomen. Op een vreemde manier lijkt het bijna een daad van welwillendheid. Alsof de bots ons, in een vertoon van menselijke gratie, een afscheidscadeau geven terwijl ze onze capaciteiten inhalen. Het is natuurlijk niet waar; AI is gewoon een andere methode die mensen hebben uitgevonden om onszelf te leren. Maar daarom spelen we. Het is een leerervaring - voor ons en de machines.