Од ЕПФЛ-а нови мултимодални модел за флексибилнији АИ

Може да учи из текста, слика, видеа и звука и, захваљујући модуларности, производи било који број или комбинацију предвиђања

Машинско учење: нови мултимодални модел за флексибилнији АИ из ЕПФЛ-а
Од ЕПФЛ-а нови мултимодални модел за флексибилнији АИ (Фото: Бриан Пенни/Пикабаи)

Било да говоримо о ОпенАИ или ЦхатГПТ, великој већини цхатботова генеративна вештачка интелигенција заснивају се на тзв Модел великог језика (ЛЛМ), модели дубоко учење у великој мери обучени да дају одговоре на питања која им се постављају учењем информација кроз велике количине текста.

Последња граница одгенеративна АИ да ли сам ја мултимодални модели, који комбинују разумевање језика и слике, видео и аудио да би понудили још напредније искуство и услугу.

Њихово стварање, међутим, представља неколико изазова, посебно ако је намера да се изграде мултимодални модели у малом обиму: чести присуство података који недостају због недоступности информација, скоро увек због делимичне доступности ресурса.

Укратко, ризик је да модел учи на основу недостатка и да су прорачуни и предвиђања искривљени. И ту је ЕПФЛ почео са својим новим пројектом.

Са Техничког универзитета у Лозани и Цириху коалиција за зелену енергију
У 3Д, технолошка рукавица која ће виртуелну стварност учинити опипљивом

Машинско учење
Кампус Федералне политехнике у Лозани (Фото: Фацебоок/ЕФПЛ)

МултиМодН, модуларни мултимодални модел рођен у Лозани

И рицерцатори дел Савезна политехника у Лозани (ЕПФЛ), један од најбољих универзитета на свету у смислу инжењеринга и информационих технологија, заправо су се развили МултиМодН, јединствени модуларни мултимодални модел недавно представљен на НеурИПС2023.

Истраживачи из лабораторија Машинско учење за образовање (МЛ4ЕД) и Машинско учење и оптимизација (МЛО) на ЕПФЛ-овој школи рачунарских наука и комуникација одлучили су да развију и тестирају управо супротно од великог, али размишљају у мањем обиму.

Предвођени учитељем Мери-Ен Хартли, директор Лабораторије за глобалне интелигентне здравствене технологије која је заједнички домаћин на МЛО и Медицинском факултету Јејла, и проф. Тања Касер, директор МЛ4ЕД, тим је направио мултимодални модел који може да учи из текста, слика, видео записа и звукова, али који се, за разлику од постојећих, састоји од променљиви број мањих модула, аутономан и специфичан за улаз.

Ово последње се може изабрати на основу доступних информација, а затим саставити у низ било ког броја, комбинације или врсте уноса. Стога може произвести било који број, или комбинацију, предвиђања.

"Оценили смо МултиМодН у десет стварних активности, укључујући подршку за медицинску дијагнозу, предвиђање академског учинка и временску прогнозу,“ је објаснио Винитра Свами, докторант на МЛ4ЕД и МЛО и први коаутор пројекта.

„Кроз ове експерименте, верујемо да је МултиМодН први приступ мултимодалном моделирању који се суштински тумачи и отпоран на недостајуће податке".

ЕПФЛ-ов „рецепт” за моћније квантне рачунаре
Од вештачке интелигенције, одлучујућег подстицаја до криптовалута?

Машинско учење
Школа информатике и комуникационих наука ЕПФЛ (Фото: Фацебоок/ЕПФЛ ИЦ)

Први случај употребе: клиничке одлуке за медицинско особље

Први случај употребе МултиМодН-а биће систем подршке за клиничке одлуке за медицинско особље у окружењима са ограниченим ресурсима.

У здравственом сектору, заправо, клинички подаци често недостају, можда због ограничених ресурса (пацијент не може приуштити одређени тест) или, обрнуто, због обиља ресурса и информација. МултиМодН је у стању да учи из ових података из стварног света без апсорбовања њихових такозваних предрасуда, и да прилагоди предвиђања било којој комбинацији или броју улаза.

"Недостајући подаци су обележје у контекстима са ограниченим ресурсима, а како модели уче ове обрасце који недостају, они могу да кодирају грешке у својим предвиђањима. истакао је Мери-Ен Хартли.

„Потреба за флексибилношћу суочена са непредвидиво доступним ресурсима је оно што је инспирисало МултиМодН".

У врхунском догађају утицај вештачке интелигенције и машинског учења на услуге
Сви разлози за све већи утицај АИ у дигиталној уметности

Машинско учење
Лабораторија за анализу (Фото: Мицхал Јармолук/Пикабаи)

Из лабораторије у стварни живот: у току је испитивање за упалу плућа и туберкулозу

Публикација је, међутим, само први корак ка имплементацији и тестирању на терену. Професор Хартли је радио са колегама у Универзитетској болници у Лозани (ЦХУВ) и Инселспиталу, Универзитетској болници у Берну, како би спровео клиничке студије фокусиран на дијагностиковање пнеумоније и туберкулозе у окружењима са ограниченим ресурсима и у процесу је регрутовања хиљада пацијената Јужна Африка, Танзанија, Намибија e Бенин.

Истраживачке групе су предузеле опсежну иницијативу за обуку, подучавање више од 100 лекара да систематски прикупља мултимодалне податке укључујући ултразвучне слике и видео записе, тако да МултиМодН може бити обучен да буде осетљив на стварне податке из региона са ниским ресурсима.

„Прикупљамо управо ону врсту сложених мултимодалних података са којима је МултиМодН дизајниран да рукује“, рекао је доктор Ноемие Боиллат-Бланцо, специјалиста за инфективне болести у ЦХУВ.

„Узбуђени смо што видимо модел који може да цени сложеност ресурса који недостају у нашим контекстима и систематски недостатак рутинских клиничких процена", додао је доктор Кристина Кајтел Инселспитала, универзитетске болнице у главном граду Швајцарске.

Безбедност вештачке интелигенције? Изјава Блетцхлеи Парка је кључна
Акел Спрингер-ОпенАИ осовина за АИ у служби новинарства

Иновација ЕПФЛ-а је дизајнирана да побољша клиничко доношење одлука пружањем приступа специјализованом медицинском знању (Фото: Ирван/Унспласх)

Машинско учење у служби јавног добра

Развој и обука МултиМодН-а представља наставак напора ЕПФЛ-а да прилагоди алате за машинско учење стварности и за јавно добро, и долази убрзо након покретања Медитрон, модел вештачке интелигенције посебно дизајниран за медицински сектор.

Медитрон такође спада у категорију великих језичких модела (ЛЛМ), али је за разлику од генералистичких модела, који служе широком спектру задатака, фокусиран на медицинска област, и компактнији је у смислу величине, али подједнако ефикасан.

Медитронов циљ је да демократизовати приступ медицинским информацијама високог квалитета, што помаже у доношењу клиничких одлука.

Истраживачи ЕПФЛ-а развили су две верзије са 7 милијарди и 70 милијарди параметара, респективно, а модели су обучени на одабраним, висококвалитетним изворима медицинских података, укључујући рецензирану научну литературу и различите клиничке смернице, обезбеђујући широку и тачну базу знања.

И Медитрон, представљен у новембру 2023., и МултиМодН су стога у складу са мисијом ЕПФЛ-овог новог АИ центра, који се фокусира на то како одговорна и ефикасна вештачка интелигенција може да промовише технолошке иновације за добробит свих сектора друштва.

Револуционарни сензори који могу да уштеде милионе батерија
АИ: Рат који ће ускоро избити неће бити онакав какав очекујемо...

Машинско учење: нови мултимодални модел за флексибилнији АИ из ЕПФЛ-а
Екстеријер ЕПФЛ кампуса са логом Савезне политехнике у Лозани (Фото: Фацебоок/ЕФПЛ ИЦ)