Key takeaways
- Et nytt kollektiv av utviklere bygger åpen kildekode AI-modeller.
- Gruppen bruker massive språkopplæringsmodeller som den vil gi ut under åpne lisenser.
- Åpen kildekode AI kan bidra til å gjøre den potensielt spillendrende kraften til den nye teknologien mindre utsatt for skjevheter og feil.
Det er mye forskning på kunstig intelligens fra store selskaper (AI), men en nettgruppe ønsker å demokratisere prosessen.
EleutherAI er et nylig dannet kollektiv av frivillige forskere, ingeniører og utviklere med fokus på åpen kildekode AI-forskning. Organisasjonen bruker GPT-Neo- og GPT-NeoX-kodebasene til å trene opp massive språkmodeller som den planlegger å utgi under åpne lisenser.
"Åpen kildekodedata er til fordel for forskere fordi forskere har flere gratis ressurser å bruke til å trene modeller og fullføre forskning," sa Edward Cui, administrerende direktør i AI-selskapet Graviti, til Lifewire i et e-postintervju. Selskapet hans er ikke involvert i EueutherAI. "Vi vet at mange AI-prosjekter ble holdt oppe av en generell mangel på data av høy kvalitet fra reelle brukssaker, så det er viktig å etablere veiledning som sikrer datakvalitet, med hjelp fra deltakende fellesskap."
This Is the Way
Begynnelsen av EleutherAI var ydmyk. I fjor la en uavhengig AI-forsker ved navn Connor Leahy ut følgende melding på en Discord-server: "Hei folkens, la [SIC] gi OpenAI en sjanse for pengene sine som i de gode gamle dager."
Og så ble gruppen dannet. Den har nå hundrevis av bidragsytere som legger ut koden sin på det elektroniske programvarelageret GitHub.
Open-source AI-tiltak er ikke nytt. Faktisk er Airbnbs Airflow arbeidsflytadministrasjonsplattform og Lyfts dataoppdagelsesmotor resultatet av å bruke åpen kildekode-verktøy for å gjøre datateam i stand til å jobbe bedre med data, påpekte Ali Rehman, prosjektleder for programvareselskapet CloudiTwins i et e-postintervju med Lifewire.
"Akkurat som åpen kildekode-revolusjonen har ført til en transformasjon av programvareutvikling, har den også drevet utviklingen og demokratiseringen av datavitenskap og kunstig intelligens," sa Rehman. "Åpen kildekode har blitt en kritisk muliggjører for bedriftsdatavitenskapelige løsninger, med flertallet av dataforskere som bruker åpen kildekode-verktøy."
Opening the Door
Utvikling av åpen kildekode AI kan bidra til å gjøre den potensielt spillendrende kraften til den nye teknologien mindre utsatt for skjevheter og feil, hevder noen observatører.
AI-forskning skjer nå først og fremst i det fri, med nesten alle selskaper, forskningslaboratorier og universiteter som presenterer resultatene sine umiddelbart i vitenskapelige publikasjoner, fort alte Kush Varshney, en AI-forsker ved IBM, til Lifewire i et e-postintervju.
"Dette åpne fellesskapet er viktig, siden det gir forbedrede nivåer av kontroller og balanser for å sikre at AI blir undersøkt, opprettet, distribuert og brukt på en ansvarlig måte," la Varshney til. "Dette er spesielt kritisk i situasjoner der disse systemene kan påvirke livene til våre mest sårbare medlemmer av samfunnet. Denne åpenheten gjelder ikke bare generell maskinlæring og dyplæringsalgoritmer, men også elementer av pålitelig AI."
Rehman sa at en av de kritiske forskjellene mellom proprietær og åpen kildekode-programvare er fleksibilitet og tilpasning. Proprietær AI-forskning vil ha problemer med sikkerhet, oppdateringer og optimaliseringer.
"Dette er fordi den fellesskapsbaserte tilnærmingen med åpen kildekode får verdifulle innspill fra tusenvis av bransjeeksperter som identifiserer potensielle sikkerhetssårbarheter som deretter utbedres raskere," la Rehman til."Konsensus i fellesskapet betyr at kvalitet er garantert og nye muligheter lettere identifiseres."
Et annet problem er at proprietær AI-forskning ikke vil være interoperabel, noe som betyr at den ikke kan fungere med ulike dataformater og sannsynligvis vil ha leverandørlåsing, noe som hindrer selskaper i å teste og prøve programvaren før de forplikter seg til en løsning, sa Rehman.
Men ikke alle aspekter av AI-forskning trenger å være åpen kildekode, sa Chris Kent, administrerende direktør i det medisinske AI-selskapet Reveal Surgical, til Lifewire i et e-postintervju. "Det er viktig å beskytte de økonomiske insentivene som driver den kommersielle utviklingen av nøkkelapplikasjoner for AI," sa han.
Men forskning på AI trenger en robust åpen kildekode-komponent, sa Kent. Han la til at åpen kildekode arbeider for å bygge tillit og bruke datasett som ikke er eller bør kontrolleres av enkeltinstitusjoner eller selskaper.
"En åpen kildekode-tilnærming er den beste måten å identifisere og kompensere for underliggende skjevheter som kan eksistere i treningssett og vil føre til mer helhetlige, kreative og pålitelige anvendelser av AI," sa Kent.