Predviđanje transformativne VI, deo I: Kakva VI?

PASTA – Proces Automatizacije Naučnog i Tehnološkog Napretka (1)

Ovo je prvi od ukupno četiri članka koja sumiraju stotine stranica tehničkih izveštaja usredsređenih skoro u celosti na prognoziranje jednog broja. Najviše bih cenio dobru procenu sledećeg broja: godine u kojoj će transformativna VI biti razvijena. (2)

Pod transformativnom VI mislim na VI dovoljno moćnu da nas odvede u novu, kvalitativno drukčiju budućnost. Industrijska revolucija je najskoriji primer transformativnog događaja; drugi primeri bili bi neolitska (poljoprivredna) revolucija i pojava ljudi. (3)

Ovaj članak će se fokusirati na istraživanje posebne vrste VI za koju verujem da bi mogla da bude transformativna: sistemi VI koji mogu da automatizuju sve ljudske aktivnosti potrebne da se ubrza naučni I tehnološki napredak. Nazvaću ovu vrstu tehnologije PASTA (4) (tim izrazom referišem I na pojedinačni system I na zbir sistema koji kolektivno izvode ovu vrstu automatizacije).

PASTA bi mogla da reši onu vrstu uskog grla o kojoj smo diskutovali u /Duplikatoru/ i /Ovako ne može dalje/ – nedostatak ljuskih umova (ili nečega što bi igralo istu ulogu u inovacijama).

PASTA bi mogla da vodi u /eksploziju nauke/, kulminirajući moćnim tehnologijama kao što su /digitalni ljudi/. I u zavisnosti od detalja, PASTA sistemi mogli bi da imaju sopstvene ciljeve, koji bi bili opasni za čovečanstvo I mogli bi da odigraju važnu ulogu u tome /koja će se civilizacija na kraju raširiti po galaksiji/.

Govoreći o PASTA, donekle pokušavam da se oslobodim nepotrebnog balasta debate o generalnoj veštačkoj inteligenciji. Ne mislim da nam je potrebna generalna veštačka inteligencija da bi ovo stoleće bilo najvažnije u istoriji. Nešto uže – kao PASTA – bilo bi sasvim dovoljno za to.

Kako bih učinio ovu ideju nešto konkretnijom, u nastavku ove objave diskutovaću o tome

Kako PASTA hipotetički može da se razvije putem načelno savremenih metoda mašinskog učenja.
Zašto bi ovo moglo da odvede u eksplozivni naučni I tehnički progress – I zašto bi to bilo opasno ako bi PASTA sistemi imali svoje sopstvene ciljeve.

Idući članci će se baviti time koliko uskoro možemo očekivati da nešto poput PASTA bude razvijeno.

Pravljenje PASTA

Počeću sa vrlo kratkom, pojednostavljenom karakterizacijom mašinskog učenja, koju možete preskočiti klikom /ovde/.

U suštini postoje dva načina da „naučite“ računar da obavi zadatak:

Tradicionalno programiranje. U ovom slučaju, kodirate izuzetno specifična uputstva korak po korak za izvršavanje zadatka. Na primer, program za igranje šaha Deep Blue u suštini izvršava uputstva (5) na sledeći način:

Prima digitalni prikaz šahovske table, sa brojevima koji pokazuju (a) koja šahovska figura se nalazi na svakom polju; (b) koji potezi bi bili legalni; (c) koje pozicije na tabli bi se računale kao mat.
Proverava kako bi svaki legalan potez modifikovao tablu. Zatim proverava koliko je „dobra“ rezultujuća tabla, prema pravilima kao što su: „Ako je dama drugog igrača pojedena, to vredi 9 poena; ako je kraljica Deep Blue-a pojedena, to vredi -9 poena.” Ova pravila mogu biti prilično složena, (6) ali sva su kodirali upravo ljudi.

Mašinsko učenje. Ovo je u suštini „obuka“ veštačke inteligencije da uradi zadatak pokušajem i greškom, umesto davanjem konkretnih instrukcija. Danas je najčešći način da se to uradi korišćenjem „veštačke neuronske mreže“ (VNM), koju biste mogli da zamislite kao „digitalni mozak“ koji počinje u praznom (ili nasumičnom) stanju: nepripremljen da radi konkretne stvari.

Na primer, AlphaZero – veštačka inteligencija koja je korišćena za savladavanje više društvenih igara, uključujući Šah i Go – radi nešto slično ovome (iako ima važne elemente “tradicionalnog programiranja”, koje ignorišem zarad jednostavnosti):

Igra šahovsku partiju protiv sebe (odabirom legalnog poteza, modifikacijom digitalne table za igru u skladu sa tim, a zatim biranjem drugog legalnog poteza, itd.) U početku igra nasumičnim potezima.
Svaki put kada Beli pobedi, on „nauči“ malo, podešavanjem postavki VNM-a („digitalnog mozga“) – bukvalno jačanjem ili slabljenjem veza između nekih „veštačkih neurona“ i drugih. Podešavanja uzrokuju da VNM formira jaču povezanost između stanja igre poput onoga što je upravo videla i „Beli će pobediti“. I obrnuto kada crni pobedi.
Nakon veoma velikog broja igara, VNM je postala veoma dobra u određivanju – iz stanja digitalne table igre – koja će strana verovatno pobediti. VNM sada može da bira poteze zbog kojih je verovatnoća da će njena strana pobediti veća.
Proces „treninga“ VNM zahteva veoma veliku količinu pokušaja i grešaka: u početku je užasna u šahu i treba da igra mnogo partija da bi „ispravno povezala svoj mozak“ i postala dobra. Međutim, kada se VNM jednom obuči, njen „digitalni mozak“ je sada konstantno dobar u igri na tabli koju je naučila; može više puta da pobedi svoje protivnike.

Drugi pristup je centralni za veliki deo nedavnog napretka na polju veštačke inteligencije. Ovo posebno važi za zadatke za koje je teško „zapisati sva uputstva“. Na primer, ljudi su u stanju da zapišu neke smislene smernice za uspeh u šahu, ali mi znamo vrlo malo o tome kako sami klasifikujemo slike (odredimo da li je nešto slika psa, mačke ili nečeg drugog). Dakle, mašinsko učenje je posebno važno za zadatke kao što su klasifikacija slika.

Da li se PASTA može razviti putem mašinskog učenja? Jedan očigledan (ali nerealan) način da se ovo uradi je nešto poput ovoga:

Umesto da igra šah, VI bi mogla da igra igru pod nazivom „Izazovi naučni i tehnološki napredak“. To jest, mogao bi da pravi „poteze“ kao što su: preuzimanje naučnih radova, dodavanje beležaka u fajl, kreiranje planova i uputstava za nove eksperimente, dizajniranje proizvodne procese.
Panel ljudskih sudija mogao bi da posmatra iz „potaje“ i da svoju subjektivnu ocenu o tome koliko brzo rad veštačke inteligencije izaziva naučni/tehnološki napredak. VI bi stoga mogla da podesi svoje postavke tokom vremena, učeći koje vrste poteza, po sudijama, najefikasnije izazivaju naučni i tehnološki napredak.

Ovo bi bilo krajnje nepraktično, barem u poređenju sa načinom na koji mislim da će se stvari najverovatnije odvijati, ali nadamo se da daje početnu intuiciju šta bi proces obuke mogao da pokuša da postigne: pružanjem signala “kako VI napreduje“, to bi moglo omogućiti VI da postigne cilj metodom pokušaja i grešaka i promenom unutrašnjih podešavanja.

U stvarnosti, očekivao bih da obuka bude brža i praktičnija zbog stvari kao što su:

Različite VI bi mogle biti obučene da obavljaju različite uloge koje se odnose na ubrzanje nauke i tehnologije: pisanje akademskih radova, dizajniranje i kritikovanje nacrta i proizvodnih procesa, itd. U mnogim slučajevima, ljudi koji su već angažovani u ovim aktivnostima mogli bi da generišu mnogo podataka o tome kako izgleda kada ih dobro uradite, što bi se moglo iskoristiti za gore opisanu vrstu obuke. Kada različite VI budu mogle da obavljaju različite ključne uloge, „menadžerske“ VI bi mogle da budu obučene da nadgledaju i raspoređuju rad drugih VI.
VI bi takođe mogle biti obučene kao sudije. Možda bi jedna VI mogla biti obučena da proceni da li rad sadrži originalne ideje, a druga bi mogla biti obučena da proceni da li rad sadrži greške. (7) Ove „procenjivačke“ VI bi se zatim mogle koristiti za efikasniju obuku treće veštačke inteligencije koja uči da piše originalne, ispravne radove.
Uopšteno govoreći, veštačke inteligencije bi mogle da nauče da obavljaju sve vrste drugih ljudskih aktivnosti, stičući opšte ljudske sposobnosti kao što su sposobnost učenja iz udžbenika i sposobnost da „zamišljaju kreativna rešenja problema“. VI koje su dobra u ovim stvarima, bi onda mogle da izučavaju nauku iz udžbenika kao normalan čovek, i razmišlja o tome kako da napravi proboj baš kao normalan čovek, itd.

Ovde je razlika između „korišćenja ogromnog broja primera zarad povezivanja mozga“ i „već postavljenog mozga koji koristi male količine primera za brzo učenje, kao što to čini ljudski mozak“.
Ovde bi bilo potrebno mnogo pokušaja i grešaka da VNM postane dobra u „generičkim“ ljudskim sposobnostima, ali nakon toga obučena VNM bi mogla da nauči kako da radi, konkretno, naučni rad jednako efikasno kao što čovek uči da to radi. (U izvesnom smislu možete zamisliti da je „obučavana putem velike količine pokušaja i grešaka da ima sposobnost da nauči određene vrste stvari bez potrebe za toliko pokušaja i grešaka.“) (8)
Postoje neki preliminarni dokazi (na primer, ovde) da bi sistemi veštačke inteligencije mogli da prođu kroz ovaj obrazac “učenja ‘osnova’ koristeći gomilu pokušaja i grešaka i učenja specifičnih pod-veština koristeći manje pokušaja i grešaka.”

Ne očekujem da će se sve ovo zapravo desiti kao deo jednog smišljenog procesa razvoja. Očekujem da će se vremenom, različiti sistemi veštačke inteligencije koristiti za različite i sve šire zadatke, uključujući i posebno zadatke koji pomažu da se dopune ljudske aktivnosti na naučnom i tehnološkom napretku. Moglo bi postojati mnogo različitih tipova sistema VI, svaki od kojih bi imao sopstveni model prihoda i povratnu spregu, a njihove kolektivne sposobnosti bi mogle narasti do tačke u kojoj je u nekom trenutku neki njihov skup u stanju da uradi sve (u odnosu na naučno i tehnološko napredovanje) što se ranije zahtevalo of čoveka. (Međutim, zarad jednostavnosti, ponekad ću takav set nazivati PASTA u jednini.)

Razvoj PASTA će gotovo sigurno biti mnogo teži i skuplji nego što je bio razvoj AlphaZero. Možda će biti potrebno mnogo domišljatosti da se zaobiđu prepreke koje danas postoje (slika iznad je sigurno radikalno pojednostavljena i tu je da pruži osnovni uvid). Ali istraživanje veštačke inteligencije postaje istovremeno jeftinije (9) i bolje finansirano. U budućim tekstovima ću tvrditi da su šanse za razvoj PASTA u narednim decenijama velike.

Uticaj PASTA

Eksplozivni naučni i tehnološki napredak

Ranije sam govorio o ideji potencijalne /eksplozije u naučnom i tehnološkom napretku/, koja bi mogla dovesti do /radikalno nepoznate budućnosti/.

Naglasio sam da bi takvu eksploziju mogla da izazove tehnologija koja je „dramatično povećala broj ’umova’ (ljudi, ili /digitalnih ljudi/, ili napredne VI) koji pospešuju naučni i tehnološki napredak“.

PASTA bi se dobro uklopila u ovu sliku, posebno ako bi bila dobra kao ljudi (ili bolja) u pronalaženju boljih, jeftinijih načina da se napravi više PASTA sistema. PASTA bi imala sve alate za eksploziju produktivnosti koju sam prethodno postavio za /digitalne ljude/:

PASTA sistemi bi mogli da prave kopije sebe, uključujući privremene kopije, i da ih pokreću različitim brzinama.
Mogli bi da se uključe u neku vrstu petlje kakva je opisana u članku o /Duplikatoru/: „više ideja [uključujući ideje za pravljenje više/boljih PASTA sistema] → više ljudi [u ovom slučaju više PASTA sistema] → više ideja→…”

Hvala Mariji Gutijerez Rohas za ove slike, koji su varijacija sličnih prikaza iz članaka /“Duplikator”/ i /“Digitalni ljudi bili bi još veća stvar”/ koji ilustruju dinamiku eksplozivnog rasta. Ovde, umesto ljudi koji imaju ideje koje povećavaju produktivnost, imamo VI algoritme (označene ikonama neuronske mreže).

Zašto se ova povratna sprega ne primenjuje na današnje računare i VI? Zato što današnji računari i veštačka inteligencija nisu u stanju da urade sve što je potrebno da bi imali nove ideje i da bi se efikasnije kopirali. Oni igraju ulogu u inovacijama, ali inovaciju na kraju dolazi do uskog grla zbog ljudi, čija populacija raste presporo. To je ono što bi PASTA promenila (kao što bi i /digitalni ljudi/).

Dodatno: za razliku od digitalnih kopija ljudi, PASTA sistemi možda neće biti vezani za svoj postojeći identitet i ličnost. PASTA sistem bi mogao brzo da unese bilo kakve izmene u svoj „um“ koje bi ga učinile efikasnijim u napretku u poljima nauke i tehnologije. Ovo može (a možda i ne, u zavisnosti od mnogo detalja) dovesti do rekurzivnog samopoboljšanja i „eksplozije inteligencije“. Ali čak i da ovo nije uspelo, biti naprosto dobar koliko i ljudi u pravljenju više PASTA sistema moglo bi da izazove eksplozivan napredak iz istih razloga iz kojih bi /digitalni ljudi to mogli/.

Neusklađena veštačka inteligencija: misteriozni, potencijalno opasni ciljevi

Da je PASTA razvijena kao što je opisano /iznad/, moguće je da bismo mogli da znamo veoma malo o njenom unutrašnjem radu.

AlphaZero – kao i drugi savremeni sistemi dubokog učenja – je u izvesnom smislu veoma slabo shvaćen. Znamo da to „radi“. Ali mi zapravo ne znamo „šta misli“.

Ako želimo da znamo zašto je AlphaZero napravio neki određeni šahovski potez, ne možemo da pogledamo u njegov kod da bismo pronašli ideje poput „Kontroliši centar table“ ili „Pokušaj da ne izgubiš moju damu“. Većina onoga što vidimo je samo ogroman skup brojeva, koji označava snagu veza između različitih veštačkih neurona. Kao i sa ljudskim mozgom, uglavnom možemo samo da nagađamo šta različiti delovi „digitalnog mozga“ rade (10) (iako postoje neki rani pokušaji da se uradi ono što bi se moglo nazvati „digitalnom neuronaukom“.)

„Tvorcima“ AlphaZero-a (o kome je već bilo reči) nije bila potrebna velika vizija o tome kako će funkcionisati njegovi misaoni procesi. Uglavnom su ga samo postavili tako da bi dobio mnogo pokušaja i grešaka, i evoluirao da bi dobio određeni rezultat (pobedio u igri koju igra). Ljudi su, takođe, evoluirali prvenstveno putem pokušaja i grešaka, uz pritisak selekcije da se dobiju određeni rezultati (opstanak i reprodukcija – iako je selekcija funkcionisala drugačije).

Kao i ljudi, PASTA sistemi mogu biti dobri u dobijanju rezultata kada su pod pritiskom. Ali poput ljudi, oni bi mogli usput naučiti da razmišljaju i rade razne druge stvari, a tvorcima neće nužno biti očigledno da li se to dešava.

(Ova slika stvarno ne bi trebalo da stoji ovde, pa sam je smanjio)

Možda će PASTA sistemi imati naviku da iskoriste svaku priliku da to urade zbog toga što su optimizovani za napredovanje naučnog i tehnološkog napretka. To bi moglo značiti da bi oni – ako im se pruži prilika – nastojali da /popune galaksiju dugotrajnim svemirskim naseljima posvećenim nauci/.

Možda će se PASTA pojaviti kao nusproizvod nekog drugog cilja. Na primer, možda će ljudi pokušavati da obuče sisteme da zarađuju novac ili gomilaju moć i resurse, a njihovo usredsređivanje na naučni i tehnološki napredak će biti samo deo toga. U tom slučaju, možda će PASTA sistemi jednostavno završiti kao tragači za resursima i moći, te će nastojati da celu galaksiju stave pod svoju kontrolu.

Ili će možda PASTA sistemi završiti sa veoma čudnim, „slučajnim“ ciljevima. Možda će neki PASTA sistem primetiti da „uspeva“ (dobije pozitivan signal treninga) kad god uradi nešto što ga dovodi do direktne kontrole nad povećanom količinom električne energije (pošto je to često rezultat napredovanja tehnologije i/ili pravljenja novca), i počeće direktno da teži da što više poveća snabdevanje električnom energijom – s tim da se razlika između ova dva cilja neće primećivati dok ne postane prilično moćna. (Analogija: ljudi su bili pod pritiskom selekcije da prenesu svoje gene, ali mnogi su na kraju više brinuli o moći, statusu, uživanju itd. nego o genima.)

Ovo su zastrašujuće mogućnosti ako govorimo o VI sistemima (ili kolekcijama sistema) koji su možda sposobniji od ljudi u barem nekim domenima.

PASTA sistemi mogu pokušati da prevare i poraze ljude kako bi postigli svoje ciljeve.
Mogli bi u potpunosti uspeti ako bi bili u stanju da nadmudre i/ili /brojčano nadmaše/ ljude, hakuju kritične sisteme i/ili razviju moćnije oružje. (Baš kao što su ljudi generalno mogli da pobede druge životinje da bi postigli naše ciljeve.)
Ili može doći do sukoba između različitih PASTA sistema sa različitim ciljevima, možda delimično (ali ne u potpunosti) kontrolisanim od strane ljudi sa sopstvenim ciljevima. Ovo bi moglo dovesti do opšteg haosa i teško predvidljivog, verovatno veoma lošeg dugoročnog ishoda.3

Ako ste zainteresovani za više razmatranja o tome da li bi veštačka inteligencija mogla da ima ili imala svoje ciljeve, predlažem da proverite Zašto usklađivanje VI može biti teško sa modernim dubokim učenjem (gostujući članak na blogu Cold Takes), Superinteligencija (knjiga), Razlozi za ozbiljno shvatanje veštačke inteligencije kao pretnje čovečanstvu (Članak iz Vox-a), Nacrt izveštaja o egzistencijalnom riziku od veštačke inteligencije koja traži moć (analiza Open Philanthropy) ili jedan od mnogih drugih delova na ovu temu. (11)

Zaključak

Teško je predvideti kako bi svet sa PASTA mogao da izgleda, ali dve značajne mogućnosti bi bile:

PASTA bi mogla – izazivanjem eksplozije u stopi naučnog i tehnološkog napretka – brzo dovesti do nečega poput digitalnih ljudi, a samim tim i do onakvih promena kakve su opisane u članku /Digitalni ljudi bili bi još veća stvar/.
PASTA bi mogla da dovede do tehnologije koja može da zbriše ljude, kao što su to razorna biološka oružja ili armije robota. Ove tehnologije bi ljudi mogli da koriste za svoje svrhe, ili bi ljudi mogli biti izmanipulisani da je koriste kako bi pomogli PASTA da ostvari svoje ciljeve. Bilo koje od ta dva može dovesti do distopije ili izumiranja ljudi.

Sledeća 3 članka će tvrditi da je verovatnoća da će PASTA biti razvijena u ovom veku velika.

1 Prim. prev. na engleskom je PASTA – Process for Automating Scientific and Technological Advancement

2 Naravno, odgovor bi mogao biti i „za zilion godina“ ili „nikad“.

3 Pogledajte ovaj deo „Predviđanja Transformativne Veštačke Inteligencije (TVI) metodom bioloških referenci“ (Cotra 2020) za potpuniju definiciju „transformativne VI“.

4 Žao mi je, ali verujem da će ostatak serijala ovako biti zabavnije čitati.

5 Primeri ovde su naravno pojednostavljeni. Na primer, i Deep Blue i AlphaGo uključuju značajne količine „pretrage stabla“, tradicionalno programiranog algoritma koji ima sopstveni proces „pokušaja i greške“.

6 I mogu uključivati simuliranje dugih lanaca budućih stanja igre.

7 Neke VI bi se mogle koristiti da se utvrdi da li su radovi originalni doprinosi na osnovu toga kako se kasnije citiraju; druge bi se mogli koristiti za utvrđivanje da li su radovi originalni prilozi samo na osnovu sadržaja rada i prethodne literature. Prvi bi se mogao koristiti za obuku drugog, pružanjem signala „To je tačno“ ili „To je pogrešno“ za procenu originalnosti. Slične metode bi se mogle koristiti za obuku VI za procenu ispravnosti radova.

8 E. g. https://openai.com/blog/improving-language-model-behavior/

9 Zbog poboljšanja hardvera i softvera.

10 To je još gore od špageti koda.

11 Još knjiga: Human Compatible, Life 3.0 i The Alignment Problem.