Sistemi i inteligjencës artificiale (AI)1, i trajnuar në miliona klipe audio të tingujve njerëzorë, mund të përdoret një ditë nga mjekët për të diagnostikuar sëmundjet duke përfshirë COVID-19 dhe tuberkulozin dhe për të vlerësuar se sa mirë funksionojnë mushkëritë e një personi.
Kjo nuk është hera e parë që një grup kërkimor ka eksploruar përdorimin e tingullit si një biomarker për sëmundjet. Koncepti fitoi tërheqje gjatë pandemisë COVID-19, kur shkencëtarët zbuluan se ishte e mundur të zbulohej sëmundja e frymëmarrjes përmes kollës së një personi2.
Çfarë ka të re në lidhje me sistemin e Google i quajtur Health Acoustic Representations (HeAR) - është grupi masiv i të dhënave mbi të cilin është trajnuar dhe fakti që ai mund të rregullohet mirë për të kryer detyra të shumta.
Studiuesit, të cilët raportuan mjetin në fillim të këtij muaji në një printim paraprak1 që ende nuk është rishikuar nga kolegët, thonë se është shumë herët për të thënë nëse HeAR do të bëhet një produkt komercial. Tani për tani, plani është që t'u jepet studiuesve të interesuar akses në model në mënyrë që ata të mund ta përdorin atë në hetimet e tyre. "Qëllimi ynë si pjesë e Google Research është të nxisë inovacionin në këtë fushë të sapolindur," thotë Sujay Kakarmath, një menaxher produkti në Google në New York City, i cili ka punuar në projekt.
Si ta trajnoni modelin tuaj
Shumica e mjeteve të inteligjencës artificiale që po zhvillohen në këtë hapësirë janë të trajnuar për regjistrime audio për shembull, të kollitjes - që shoqërohen me informacione shëndetësore për personin që ka bërë tingujt. Për shembull, klipet mund të etiketohen për të treguar se personi kishte bronkit në kohën e regjistrimit. Mjeti vjen për të lidhur veçoritë e tingujve me etiketën e të dhënave, në një proces trajnimi të quajtur mësimi i mbikëqyrur.
Në mjekësi tradicionalisht kemi përdorur shumë mësime të mbikëqyrura, gjë që është e mrekullueshme sepse keni një vërtetim klinik, "thotë Yael Bensoussan, një laringologe në Universitetin e Floridës Jugore në Tampa. "E keqja është se me të vërtetë kufizon grupet e të dhënave që mund të përdorni, sepse ka mungesë të grupeve të të dhënave të shënuara atje."
Në vend të kësaj, studiuesit e Google përdorën mësimin e vetë-mbikëqyrur, i cili mbështetet në të dhëna të paetiketuara. Përmes një procesi të automatizuar, ata nxorrën më shumë se 300 milionë video të shkurtra zanore të kollitjes, frymëmarrjes, pastrimit të fytit dhe tingujve të tjerë njerëzorë nga videot e disponueshme publikisht në YouTube.
Çdo klip u shndërrua në një paraqitje vizuale të tingullit të quajtur spektrogram. Pastaj studiuesit bllokuan segmente të spektrogrameve për të ndihmuar modelin të mësojë të parashikojë pjesët që mungojnë. Kjo është e ngjashme me mënyrën se si modeli i madh i gjuhës që qëndron në themel të chatbot-it ChatGPT u mësua të parashikonte fjalën tjetër në një fjali pasi ishte trajnuar në një mori shembujsh të tekstit njerëzor. Duke përdorur këtë metodë, studiuesit krijuan atë që ata e quajnë model themeli, i cili sipas tyre mund të përshtatet për shumë detyra.
Në rastin e HeAR, ekipi i Google e përshtati atë për të zbuluar COVID-19, tuberkulozin dhe karakteristika të tilla si nëse një person pi duhan. Për shkak se modeli ishte trajnuar në një gamë kaq të gjerë të tingujve njerëzorë, për ta rregulluar atë, studiuesve iu desh ta ushqenin atë vetëm me grupe të dhënash shumë të kufizuara të etiketuara me këto sëmundje dhe karakteristika.
Në një shkallë ku 0.5 përfaqëson një model që nuk funksionon më mirë se një parashikim i rastësishëm dhe 1 përfaqëson një model që bën një parashikim të saktë çdo herë, HeAR shënoi 0.645 dhe 0.710 për zbulimin e COVID-19, në varësi të cilës grup të dhënash u testua një performancë më e mirë se modelet ekzistuese të trajnuara për të dhënat e të folurit ose audio të përgjithshme. Për tuberkulozin, rezultati ishte 0.739.
Fakti që të dhënat origjinale të trajnimit ishin kaq të ndryshme me cilësi të ndryshme të zërit dhe burime njerëzore do të thotë gjithashtu se rezultatet janë të përgjithësueshme, thotë Kakarmath.
Ali Imran, një inxhinier në Universitetin e Oklahomas në Tulsa, thotë se vëllimi i madh i të dhënave të përdorura nga Google i jep rëndësi kërkimit. "Kjo na jep besimin se ky është një mjet i besueshëm," thotë ai.
Imran drejton zhvillimin e një aplikacioni të quajtur AI4COVID-19, i cili ka treguar premtim për të dalluar kollën COVID-19 nga llojet e tjera të kollës3. Ekipi i tij planifikon të aplikojë për miratim nga Administrata Amerikane e Ushqimit dhe Barnave (FDA) në mënyrë që aplikacioni të mund të kalojë përfundimisht në treg; ai aktualisht po kërkon fonde për të kryer provat e nevojshme klinike. Deri më tani, asnjë mjet i miratuar nga FDA nuk ofron diagnozë përmes tingujve.
Fusha e akustikës shëndetësore, ose 'audiomics', është premtuese, thotë Bensoussan. “Shkenca akustike ka ekzistuar për dekada. Ajo që është e ndryshme është se tani, me AI dhe mësimin e makinerive, ne kemi mjetet për të mbledhur dhe analizuar shumë të dhëna në të njëjtën kohë.” Ajo bashkë-drejton një konsorcium kërkimor të fokusuar në eksplorimin e zërit si një biomarker për të gjurmuar shëndetin.
"Ka një potencial të jashtëzakonshëm jo vetëm për diagnostikim, por edhe për shqyrtim" dhe monitorim, thotë ajo. “Ne nuk mund të përsërisim skanimet apo biopsitë çdo javë. Pra, kjo është arsyeja pse zëri bëhet një biomarker vërtet i rëndësishëm për monitorimin e sëmundjeve,” shton ajo. "Nuk është invaziv dhe është burim i ulët."