Înainte să fie stricat cuvântul AI

Dacă întrebi pe cineva ce înseamnă AI în jocuri în 2024, îți va vorbi despre NPC-uri cu voce generată, texturi făcute cu Stable Diffusion și dialoguri produse de ChatGPT. Corect tehnic. Complet greșit ca poveste.

Timp de douăzeci de ani, cel mai interesant AI aplicat de pe planetă nu era în laboratoare academice. Era în jocuri. Rula în timp real, pe hardware-ul tău de acasă, în fața unui jucător uman care ar fi observat imediat orice prostie. Și acum, industria a predat cuvântul „AI” unor sisteme care produc imagini frumoase și a îngropat niște chestii, de fapt, revoluționare…

Merită să vorbim despre asta, pentru că dacă nu înțelegi ce este AI-ul cu adevărat, nu vei înțelege niciodată ce lipsește din jocurile pe care le joci azi și ce am putea avea din nou dacă nu cumpărăm prostii făcute cu Generative AI.

Orice sistem AI poate fi maximal eficient. Un motor de șah care joacă perfect este un motor de șah perfect. Un NPC care nu te ratează niciodată este un NPC prost conceput, un joc prost gândit și un lead designer concediat.

Game AI-ul a trebuit să rezolve ceva ce comunitatea academică evita cu grație: să creeze senzația de inteligență gestionând cu precizie cât de competent este de fapt. Să pară că gândește fără să câștige tot timpul. Să te surprindă fără să te frustreze. Să fie viu.

Asta e mai greu decât să faci un sistem care câștigă. Mult mai greu. Și nimeni nu îți plătea dacă jocul era mult prea greu sau dacă era prea ușor. Jucătorul simțea imediat. 

Problema într-o conversație despre latura tehnică este exact faptul că sunt la bază niște inovații foarte specifice și foarte greu de aplicat la cea mai dificilă categorie de public: general population. Cu toate astea, există câteva invenții din ultimii 20 de ani care merită studiate mai atent:

F.E.A.R. (2005): G.O.A.P.

Inamicii din F.E.A.R. te flancau. Se ajutau reciproc. Se retrăgeau când îi atacai prea intens. Jucătorii raportau, complet neîntrebați, că AI-ul pare că gândește.

Nu gândea. Dar ce făcea era mai interesant decât gândirea.

Jeff Orkin, programatorul acestui AI, a implementat un sistem numit Goal-Oriented Action Planning. Fiecare soldat menținea o listă de obiective: supraviețuiește, reacționează, flanchează și alege dintr-o librărie foarte mare de acțiuni cu precondiții și efecte. Un planificator construia în timp real cea mai scurtă secvență de acțiuni care ducea la obiectiv. Când condițiile se schimbau, planul se reconstruia.

Soldații își anunțau intențiile pe un sistem partajat, și vocal, pentru player, printr-un walkie-talkie. „Mă deplasez să flanchez.” „Suprim.” Colegii lor ascultau și se adaptau. Niciun soldat nu vedea imaginea tactică completă. Coordonarea apărea din decizii locale, nu din scriptare centrală.

Aceasta se numește coordonare distribuită multi-agent. Robotica academică o teoretiza. Monolith Productions o livra la 60 de cadre pe secundă, în 2005, pe un PC de gaming obișnuit.

Orkin a publicat arhitectura academică și a ajuns la MIT Media Lab. Sistemul lui e citat în curricula de AI pentru jocuri. Rareori în altă parte.

Foto: store.steampowered.com /F.E.A.R. /Monolith Productions /Vivendi Games

Shadow of Mordor (2014): The NEMESIS System.

Acesta e cel mai simplu de explicat și cel mai greu de replicat.

Fiecare căpitan orc din Shadow of Mordor era un personaj cu memorie. Dacă te omora, își amintea. Dacă îl lăsai rănit și scăpa, se întorcea. Dacă îl umileai în fața soldaților lui, revenea obsedat. Dialogul lui reflectă exact ce s-a întâmplat între voi, nu din replici pre-scrise, ci din texte asamblate din componente bazate pe istoria voastră specifică.

În paralel cu jocul tău, căpitanii se băteau între ei pentru ierarhie, formau alianțe, se promovau. Te întorceai la o lume schimbată, care evolua fără tine.

Aceasta se numește simulare socială bazată pe agenți cu stare persistentă și generare de narațiune dinamică. Warner Bros. a brevetat-o agresiv. Rezultatul e că nimeni altcineva nu o poate construi legal și unul dintre cele mai semnificative avansuri în AI narativ din istoria jocurilor rămâne blocat într-un singur studio, care între timp nu l-a folosit la NIMIC.

Foto: igdb.com /Shadow of Mordor /Monolith Productions /Warner Bros.

Left 4 Dead (2008): AI Scene Director

Left 4 Dead avea un sistem numit AI Scene Director. La fiecare câteva secunde, el evalua starea grupului tău de jucători, health, ritmul în care vă mișcați, timpul trecut de la ultimul moment tensionat, consumul de resurse; și ajusta lumea: spawn-uri, iteme, intensitate muzicală, inamici speciali.

Tensiune prea mare? Dădea înapoi. Prea confortabil? Creștea densitatea. Muzica se schimba înainte să știi că vine ceva.

Jucătorii raportau că fiecare run părea proiectat pentru ei. Fusese. De o mașină care le modela starea psihologică în timp real și lua decizii autoriale ca să o mențină pe o traiectorie emoțională țintă.

Asta fac editorii de film. Asta fac scenariștii buni. Directorul o făcea computațional, invizibil, pentru patru oameni simultan, în 2008.

Foto: store.steampowered.com /Left 4 Dead /Valve Corporation

Și restul, pe scurt, cu promisiuni de viitoare articole:

Black & White (2001): creatura lui Molyneux învăța din recompense și pedepse. Reinforcement learning în 2001, orientat spre public live, înainte ca termenul să existe în presa tech.

The Sims (2000): fiecare Sim evalua continuu ce nevoie e mai urgentă și alegea acțiunea care o rezolva cel mai eficient. Utility-based AI aplicat psihologiei umane motivaționale. Din ea apăreau relații, drame, povești pe care nimeni nu le construise dinainte; ele apăreau organic.

Alien: Isolation (2014): Alienul rula pe două sisteme AI care nu comunicau. Unul știa mereu unde ești și repoziționa Alienul strategic. Celălalt simula senzorial: auz, vedere, miros. Alienul nu trișa. Căuta. Rezultatul era un prădător care se simțea real.

Halo: Combat Evolved (2001): Elites flancau și se regrupau. Grunții se panicau. Hunterii operau ca pereche. Fiecare nivel al ierarhiei rula la frecvențe de update diferite. Arhitectură stratificată de planning tactic, în 2001, pe prima consolă Xbox.

De ce contează. Serios

Și acum ajungem la partea importantă, pentru că tot ce e de sus e istorie frumoasă, dar istoria singură nu e un argument.

Înțelegerea a ceea ce e AI-ul cu adevărat în jocuri contează din trei motive concrete.

Primul: Știi ce lipsește din jocurile tale. Jocurile actuale cu „AI” promit lumi vii și personaje care răspund autentic. Ce livrează sunt NPC-uri care vorbesc fluent și nu-și amintesc nimic din conversația anterioară. Dacă știi că Sistemul Nemesis exista în 2014 și că niciun joc cu LLM nu a livrat ceva la fel de semnificativ, știi să ceri mai mult. Știi să nu fii impresionat de demo-uri de PR.

Al doilea: Înțelegi diferența reală dintre tipurile de AI. AI generativ produce artefacte, imagini, text, audio. Nu modelează comportament, nu simulează psihologie, nu se adaptează la tine în timp real. AI comportamental acționează, percepe, decide, se adaptează. Sunt discipline diferite. A le confunda înseamnă a lua decizii proaste ca jucător, ca developer, ca investitor, ca jurnalist. Industria face asta acum la scară masivă.

Al treilea: Urmărești banii corect. Investițiile masive în AI generativ pentru jocuri sunt parțial justificate prin promisiunea că rezolvă probleme pe care, de fapt, nu le rezolvă. Generarea de mai mult dialog nu înlocuiește un sistem care ține minte relația cu tine. Texturi generate procedural nu înlocuiesc un director care îți modelează experiența emoțională. Dacă înțelegi asta, nu cumperi hype-ul. Și dacă suficient de multă lume înțelege asta, poate industria investește și în ceea ce funcționează cu adevărat.

Ce s-a întâmplat

Prin 2022, cuvântul „AI” în jocuri a început să însemne altceva. A început să însemne Stable Diffusion și ChatGPT. Presa a urmat. Investițiile au urmat.

Summitul AI de la GDC; 

Studiouri care aveau programatori dedicați exclusiv comportamentului agenților au restructurat sau eliminat acele roluri. 

Finanțare care merge spre ce produce output vizibil pentru investitori: imagini, voce, text.

AI-ul comportamental nu arată bine. Nu poți pune într-un press release că inamicii tăi replanifică tactic în 15 milisecunde, sau gândesc predictiv cu o acuratețe de cam 85%. Poți pune o imagine generată de Midjourney.

Consecința? Industria deprioritizează sistematic cercetarea care a produs cele mai convingătoare experiențe interactive din istoria mediului, în favoarea unor sisteme care produc conținut mai ieftin și mai repede, dar nu rezolvă ce era de fapt interesant de rezolvat.

În final

AI Directorul din Left 4 Dead te urmărea. Vedea că ești pe ultima sută de metri, că nu mai ai items, că e liniște de prea mult timp. Și acționa. Îți trăznea nenorocitul ăsta de scene director zombie speciali în fața când erai mai liniștit. O treabă absolut impecabilă.

Niciun sistem generativ în producție astăzi nu face asta. 

Directorul a existat în 2008. Pe hardware obișnuit. Era invizibil și funcționa. Nu are rost acum să trec din nou prin fiecare exemplu de mai sus, dar cert este că toate au fost revoluționare.

Asta a fost AI-ul în jocuri. Asta e ce se uită. Și dacă nu știi ce a existat, nu vei ști nici ce îți lipsește.