Kaj so nevronske mreže in kako delujejo

Danes bomo poskušali ugotoviti, kaj so nevronske mreže, kako delujejo in kakšna je njihova vloga pri ustvarjanju umetne inteligence.

Nevronske mreže. Ta stavek slišimo skoraj povsod. Pride do tega, da boste nevronske mreže našli tudi v hladilnikih (to ni hec). Nevronske mreže pogosto uporabljajo algoritmi strojnega učenja, ki jih danes ne najdemo le v računalnikih in pametnih telefonih, temveč tudi v številnih drugih elektronskih napravah, na primer v gospodinjskih aparatih. In ste se kdaj vprašali, kaj so te nevronske mreže?

Brez skrbi, to ne bo akademsko predavanje. Obstaja veliko publikacij, tudi v ukrajinskem jeziku, ki zelo strokovno in zanesljivo pojasnjujejo to problematiko na področju natančnih znanosti. Takšne publikacije so stare več kot ducat let. Kako je mogoče, da so te stare publikacije še vedno aktualne? Dejstvo je, da se osnove nevronskih mrež niso spremenile, sam koncept - matematični model umetnega nevrona - pa je nastal med drugo svetovno vojno.

Enako je z internetom, današnji internet je neprimerljivo bolj napreden kot takrat, ko je bila poslana prva elektronska pošta. Osnova interneta, temeljni protokoli, so obstajali že od samega začetka njegovega nastanka. Vsak kompleksen koncept je zgrajen na podlagi starih struktur. Enako je z našimi možgani, najmlajša možganska skorja ne more delovati brez najstarejšega evolucijskega elementa: možganskega debla, ki je v naših glavah že od časov, ki so daleč starejši od obstoja naše vrste na tem planetu.

Sem te malo zmedel? Torej, razumejmo podrobneje.

Zanimivo tudi: ChatGPT: Preprosta navodila za uporabo

VSEBINA

1. Kaj so nevronske mreže?

2. Najprej je bil umetni nevron

3. Od modela do inovativnih izvedb

4. Renesansa nevronskih mrež

5. Kako se nevronske mreže učijo?

Kaj so nevronske mreže?

Mreža je skupek določenih elementov. To je najpreprostejši pristop v matematiki, fiziki ali tehnologiji. Če je računalniško omrežje niz med seboj povezanih računalnikov, potem je nevronska mreža očitno niz nevronov.

Vendar ti elementi po kompleksnosti niti približno niso primerljivi z živčnimi celicami naših možganov in živčnega sistema, vendar so na določeni stopnji abstrakcije nekatere lastnosti umetnega nevrona in biološkega nevrona skupne. Vendar se je treba spomniti, da je umetni nevron veliko enostavnejši koncept kot njegov biološki dvojnik, o katerem še vedno ne vemo vsega.

- Oglas -

Preberite tudi: 7 najbolj kul uporab ChatGPT

Najprej je bil umetni nevron

Prvi matematični model umetnega nevrona sta leta 1943 (da, to ni napaka, med drugo svetovno vojno) razvila dva ameriška znanstvenika Warren McCulloch in Walter Pitts. To jim je uspelo na podlagi interdisciplinarnega pristopa, ki združuje osnovna znanja fiziologije možganov (spomnite se časa nastanka tega modela), matematike in takrat mladega IT pristopa (med drugim so uporabili teorijo izračunljivosti Alana Turinga). ). McCulloch-Pittsov model umetnega nevrona je zelo enostaven model, ima veliko vhodov, kjer vhodne informacije prehajajo skozi uteži (parametre), katerih vrednosti določajo obnašanje nevrona. Nastali rezultat se pošlje na en sam izhod (glejte diagram McCulloch-Pittsovega nevrona).

Takšno drevesno zgradbo povezujemo z biološkim nevronom, saj nam ob risbah, ki prikazujejo biološke živčne celice, pride na misel značilna drevesna struktura dendritov. Ne gre pa se podleči iluziji, da je umetni nevron vsaj nekoliko blizu pravi živčni celici. Ta dva raziskovalca, avtorja prvega umetnega nevrona, sta uspela dokazati, da je vsako izračunljivo funkcijo mogoče izračunati z uporabo mreže med seboj povezanih nevronov. Vendar ne pozabimo, da so ti prvi koncepti nastali le kot ideje, ki so obstajale le "na papirju" in niso imele prave interpretacije v obliki delujoče opreme.

Preberite tudi: O kvantnih računalnikih z enostavnimi besedami

Od modela do inovativnih izvedb

McCulloch in Pitts sta razvila teoretični model, vendar je bilo na ustvarjanje prve prave nevronske mreže treba čakati več kot deset let. Za njegovega tvorca velja še en pionir raziskovanja umetne inteligence, Frank Rosenblatt, ki je leta 1957 ustvaril mrežo Mark I Perceptron, sami pa ste pokazali, da je zahvaljujoč tej strukturi stroj pridobil sposobnost, ki je bila prej lastna le živalim in ljudem: lahko naučijo. Vendar zdaj vemo, da so dejansko obstajali drugi znanstveniki, ki so prišli na idejo, da bi se stroj lahko učil, tudi pred Rosenblattom.

Številni raziskovalci in pionirji računalništva so v petdesetih letih 1950. stoletja prišli na idejo, kako narediti stroj, da naredi tisto, česar sam ne zmore. Na primer, Arthur Samuel je razvil program, ki je igral damo s človekom, Allen Newell in Herbert Simon sta ustvarila program, ki je lahko neodvisno dokazoval matematične izreke. Še pred nastankom prve Rosenblattove nevronske mreže sta druga dva pionirja raziskav na področju umetne inteligence, Marvin Minsky in Dean Edmonds, leta 1952, torej še pred pojavom Rosenblattovega perceptrona, zgradila stroj, imenovan SNARC (Stochastic Neural Analog Reinforcement Calculator) - okrepitev stohastičnega nevronskega analognega kalkulatorja, za katerega mnogi menijo, da je prvi računalnik s stohastično nevronsko mrežo. Opozoriti je treba, da SNARC ni imel nobene zveze s sodobnimi računalniki.

Zmogljiv stroj je z uporabo več kot 3000 elektronskih cevi in rezervnega avtopilotskega mehanizma iz bombnika B-24 uspel simulirati delovanje 40 nevronov, kar se je izkazalo za dovolj za matematično simulacijo podganjega iskanja izhoda iz labirinta. . Podgane seveda ni bilo, šlo je le za proces dedukcije in iskanja optimalne rešitve. Ta avto je bil del doktorata Marvina Minskyja.

Drug zanimiv projekt na področju nevronskih mrež je bilo omrežje ADALINE, ki ga je leta 1960 razvil Bernard Withrow. Tako se lahko vprašamo: zakaj so raziskovalci že pred več kot pol stoletja poznali teoretične osnove nevronskih mrež in celo ustvarili prve delujoče izvedbe tovrstnih računalniških ogrodij, zakaj je trajalo tako dolgo, vse do 21. stoletja, ustvariti resnične rešitve na podlagi nevronskih mrež? Odgovor je eden: nezadostna računalniška moč, vendar to ni bila edina ovira.

Čeprav so bili v 1950. in 1960. letih XNUMX. stoletja številni pionirji umetne inteligence navdušeni nad možnostmi nevronskih mrež in nekateri med njimi so napovedovali, da bo strojni ekvivalent človeških možganov oddaljen le deset let. To je danes celo smešno brati, saj se še vedno nismo niti približali izdelavi strojnega ekvivalenta človeških možganov in smo še daleč od rešitve te naloge. Hitro je postalo jasno, da je bila logika prvih nevronskih mrež fascinantna in omejena. Prve implementacije AI z uporabo umetnih nevronov in algoritmov strojnega učenja so bile sposobne rešiti določen ozek obseg nalog.

Ko pa je šlo za širše prostore in reševanje nečesa res resnega, kot je prepoznavanje vzorcev in slik, simultano prevajanje, prepoznavanje govora in pisave ipd., torej stvari, ki jih računalniki in AI zmorejo že danes, se je izkazalo, da prve implementacije nevronskih mrež tega enostavno niso zmogle. Zakaj je temu tako? Odgovor je dala raziskava Marvina Minskyja (ja, istega iz SNARC) in Seymourja Papert, ki sta leta 1969 dokazala omejenost perceptronske logike in pokazala, da povečevanje zmogljivosti enostavnih nevronskih mrež zgolj zaradi skaliranja ne deluje. Obstajala je še ena, a zelo pomembna ovira – takrat razpoložljiva računalniška moč je bila premajhna, da bi se nevronske mreže lahko uporabljale, kot je bilo predvideno.

Zanimivo tudi:

- Oglas -

Renesansa nevronskih mrež

V sedemdesetih in osemdesetih letih prejšnjega stoletja so bile nevronske mreže praktično pozabljene. Šele ob koncu prejšnjega stoletja je razpoložljiva računalniška moč postala tako velika, da so se ljudje začeli vračati k njej in razvijati svoje sposobnosti na tem področju. Takrat so se pojavile nove funkcije in algoritmi, ki so lahko presegli omejitve prvih najpreprostejših nevronskih mrež. Takrat se je pojavila ideja o globokem strojnem učenju večplastnih nevronskih mrež. Kaj se pravzaprav zgodi s temi plastmi? Danes so skoraj vse uporabne nevronske mreže, ki delujejo v našem okolju, večplastne. Imamo vhodni sloj, katerega naloga je sprejemanje vhodnih podatkov in parametrov (uteži). Število teh parametrov se spreminja glede na kompleksnost računalniškega problema, ki ga mora rešiti omrežje.

Poleg tega imamo tako imenovane "skrite plasti" – tu se zgodi vsa "čarovnija", povezana z globokim strojnim učenjem. Skrite plasti so odgovorne za sposobnost te nevronske mreže, da se uči in izvaja potrebne izračune. Zadnji element je izhodna plast, torej plast nevronske mreže, ki daje želeni rezultat, v tem primeru: prepoznano pisavo, obraz, glas, oblikovano podobo na podlagi besedilnega opisa, rezultat tomografske analize diagnostična slika in še veliko več.

Preberite tudi: Preizkusil sem Bingov klepetalni robot in ga intervjuval

Kako se nevronske mreže učijo?

Kot že vemo, posamezni nevroni v nevronskih mrežah obdelujejo informacije s pomočjo parametrov (uteži), ki so jim dodeljene posamezne vrednosti in povezave. Te uteži se spreminjajo med procesom učenja, kar vam omogoča, da strukturo tega omrežja prilagodite tako, da ustvari želeni rezultat. Kako natančno se omrežje uči? Očitno je, da ga je treba nenehno trenirati. Naj vas ne preseneti ta rek. Tudi učimo se in ta proces ni kaotičen, ampak urejen, recimo. Temu pravimo izobraževanje. Vsekakor je mogoče nevronske mreže tudi učiti, in to običajno z ustrezno izbranim naborom vhodov, ki mrežo nekako pripravijo na naloge, ki jih bo opravljala v prihodnosti. In vse to se ponavlja korak za korakom, včasih učni proces do neke mere spominja na sam proces usposabljanja.

Na primer, če je naloga te nevronske mreže prepoznavanje obrazov, je vnaprej usposobljena na velikem številu slik, ki vsebujejo obraze. V procesu učenja se spreminjajo uteži in parametri skritih slojev. Strokovnjaki tukaj uporabljajo izraz "minimizacija stroškovne funkcije". Stroškovna funkcija je količina, ki nam pove, koliko napak dela določena nevronska mreža. Bolj kot lahko minimiziramo stroškovno funkcijo kot rezultat usposabljanja, bolje se bo ta nevronska mreža obnesla v resničnem svetu. Najpomembnejša značilnost, ki razlikuje katero koli nevronsko mrežo od naloge, programirane s klasičnim algoritmom, je ta, da mora programer v primeru klasičnih algoritmov korak za korakom oblikovati dejanja, ki jih bo program izvedel. V primeru nevronskih mrež se je mreža sama sposobna naučiti pravilno izvajati naloge. In nihče ne ve natančno, kako kompleksna nevronska mreža izvaja svoje izračune.

Danes se nevronske mreže pogosto uporabljajo in, morda presenetljivo, zelo pogosto brez razumevanja, kako računalniški proces v danem omrežju dejansko deluje. Ni potrebe po tem. Programerji uporabljajo že pripravljene strojno učene nevronske mreže, ki so pripravljene za vhodne podatke določene vrste, jih obdelajo na samo njim znan način in proizvedejo želeni rezultat. Programerju ni treba vedeti, kako poteka sklepanje znotraj nevronske mreže. To pomeni, da oseba ostane oddaljena od velike količine izračunov, metode pridobivanja informacij in njihove obdelave z nevronskimi mrežami. Od kod nekateri strahovi človeštva glede modelov umetne inteligence. Preprosto se bojimo, da si bo nekega dne nevronska mreža zastavila določeno nalogo in neodvisno, brez pomoči osebe, našla načine za njeno rešitev. To skrbi človeštvo, povzroča strah in nezaupanje v uporabo algoritmov strojnega učenja.

Ta utilitarni pristop je danes pogost. Pri nas je tako: vemo, kako nekoga usposobiti za določeno dejavnost, in vemo, da bo proces usposabljanja učinkovit, če bo pravilno izveden. Oseba bo pridobila želene veščine. Toda ali natančno razumemo, kako poteka proces odbitka v njegovih možganih, ki je povzročil ta učinek? Pojma nimamo.

Naloga znanstvenikov je čim bolj preučiti te probleme, da nam služijo in pomagajo, kjer je to potrebno, in kar je najpomembneje, ne postanejo grožnja. Kot ljudje se bojimo tistega, česar ne poznamo.

Zanimivo tudi:

Več od avtorja

Prijavite se

0 Komentarji

Vdelana mnenja

Prikaži vse komentarje

Drugi članki

Kaj so nevronske mreže in kako delujejo?

Kaj so nevronske mreže?

Najprej je bil umetni nevron

Od modela do inovativnih izvedb

Renesansa nevronskih mrež

Kako se nevronske mreže učijo?

Nedavni komentarji