Çfarë ndodh kur stërvitni një sistem të inteligjencës artificiale (AI) me të njëjtin ritëm si një fëmijë?
Një ekip studiuesish nga Universiteti i Nju Jorkut (NYU) pajisi një foshnjë me një kamerë të montuar në kokë dhe regjistroi video nga kur fëmija ishte gjashtë muajsh deri në ditëlindjen e tij të dytë.
Ata arritën të regjistronin rreth një për qind të orëve të zgjimit të fëmijës, të cilat i përdorën për të trajnuar një sistem AI ose rrjet nervor, një model llogaritës i aftë për të mësuar modele nga të dhënat hyrëse.
Ata publikuan gjetjet e tyre në revistën Science. Pavarësisht nga kjo sasi relativisht e ulët e të dhënave në krahasim me grupet e zakonshme të të dhënave masive të përdorura për të trajnuar AI, ajo ishte e mjaftueshme për mësimin e gjuhës.
"Ne tregojmë, për herë të parë, se një rrjet nervor i trajnuar mbi këtë input realist zhvillimor nga një fëmijë i vetëm mund të mësojë të lidhë fjalët me homologët e tyre vizualë," Wai Keen Vong, një shkencëtar hulumtues në Qendrën e NYU për Shkencën e të Dhënave dhe gazetës. autori i parë, thuhet në një deklaratë.
“Rezultatet tona tregojnë se si përparimet algoritmike të kohëve të fundit, të shoqëruara me përvojën natyraliste të një fëmije, kanë potencialin për të riformuar të kuptuarit tonë të gjuhës së hershme dhe përvetësimit të konceptit,” shtoi ai.
Një mjet për të ditur më shumë rreth mësimit të gjuhës
Sistemet e nivelit të lartë të inteligjencës artificiale i nënshtrohen trajnimit për grupet e të dhënave të tekstit që përmbajnë triliona fjalë, ndërsa fëmijët ekspozohen vetëm ndaj miliona fjalëve në vit.
Duke përdorur modele të inteligjencës artificiale për të studiuar mësimin e gjuhës, "ne mund të adresojmë debate klasike rreth asaj se çfarë përbërësish u duhen fëmijëve për të mësuar fjalët - nëse ata kanë nevojë për paragjykime specifike të gjuhës, njohuri të lindura ose thjesht të mësuarit shoqërues për të vazhduar", tha Brenden Lake, një profesor asistent. në NYU dhe autori i lartë i gazetës.
Studiuesit kishin komunikuar 60 orë filmime që përmbanin rreth 250,000 fjalë.
Këto fjalë shoqëroheshin me korniza video që kapnin atë që fëmija pa kur ato fjalë thuheshin gjatë aktiviteteve të tilla si vaktet, leximi i librave ose koha e lojës.
Studiuesit më pas përdorën dy module: një për korniza video dhe një tjetër për fjalimin e transkriptuar drejtuar fëmijës.
Këto u kombinuan dhe u trajnuan me të mësuarit kontrasiv, një lloj mësimi makinerie i përdorur për të trajnuar modelin për të kuptuar lidhjet midis shenjave vizuale dhe gjuhësore.
Hapi tjetër për kërkuesit ishte testimi i modelit i quajtur modeli Child's View for Contrastive Learning (CVCL) - në të njëjtën mënyrë që matën të mësuarit e fjalëve të foshnjave.
Ata i treguan modeles një fjalë dhe katër fotografi, duke i kërkuar të zgjidhte foton që përputhej me fjalën. Rezultatet zbuluan se modelja mësoi shumë fjalë nga përditshmëria e një fëmije.
Sistemi gjithashtu mund të aplikojë disa fjalë në fotografi të ndryshme që nuk shihen gjatë stërvitjes, të cilat fëmijët mësojnë gjithashtu t'i bëjnë.
“Këto gjetje sugjerojnë se ky aspekt i të mësuarit të fjalëve është i realizueshëm nga lloji i të dhënave natyraliste që marrin fëmijët duke përdorur mekanizma relativisht gjenerikë të të mësuarit, si ato që gjenden në rrjetet nervore,” tha Lake.