Den senaste utvecklingen inom AI-forskning markerar ofta milstolpar som kan förändra hur vi ser på teknikens potentiella tillämpningar. Ett utmärkt exempel på detta är introduktionen av Aya, en global satsning ledd av Cohere For AI. Aya är inte bara en modell eller dataset, utan symboliserar en omfattande internationell insats med över 3 000 självständiga forskare från 119 länder. Genom att driva den vetenskapliga forskningen framåt inom flerspråkig AI, ger Aya oss verktygen att förstå och kommunicera på hela 101 språk. Projektet drivs med principen om öppen vetenskap, vilket gör all data och modellering öppet tillgänglig för alla intresserade forskare och utvecklare.
Namnet "Aya" är hämtat från twi-språket, där det betyder "ormbunke". Ormbunken representerar uthållighet och kreativitet. Detta val av namn återspeglar Ays kärnvärden och målet att driva framsteg inom flerspråkig AI trots de utmaningar som området ställer. Den symboliska betydelsen av uthållighet och kreativitet är central för projektet, eftersom det kräver en långsiktig och resurssmart ansats för att kunna hantera och förbättra generativa AI-modeller på flera språk.
Det finns tre huvudsakliga modeller inom Aya-projektet: Aya 23 - 8B, Aya 23 - 35B, och Aya 101. Alla dessa modeller är skapade för att främja forskningen inom flerspråkig AI. Dessutom är Aya en av de största öppna vetenskapsinitiativen inom maskininlärning hittills, och har omdefinierat forskningslandskapet genom att samarbeta med oberoende forskare från hela världen.
Denna gemensamma insats har resulterat i ett helt öppet dataset samt modeller som kan laddas ner av forskare och utvecklare. Totalt omfattar projektet 513 miljoner datapunkter, och har samlat in över 204 000 originala mänskliga annoteringar. Med 56 språkambassadörer som bidrar från båda de mest utbredda och mindre dokumenterade språken, representeras en global mångfald som är unik i sitt slag.
Human evaluering av Aya-modellen påvisar konsistenta förbättringar. Det har visat sig att Aya följer instruktioner och genererar svar av signifikant högre kvalitet jämfört med tidigare modeller såsom mT0x. Baserat på mänskliga bedömningar från professionella annotatörer, som jämförde modellens svar med angivna instruktioner på flera språk, föredras Aya i genomsnitt 77% av gångerna.
Aya erbjuder en grund för språkunderservade i uppgifter som naturlig språkförståelse, sammanfattning och översättning. Mångfalden i de språk som täcks under Aya betyder att även språk som tidigare inte fått tillräcklig AI-uppmärksamhet nu kan dra nytta av teknologins framsteg. Detta är en enorm vinst för världens språkliga och kulturella mångfald. Genom att tillhandahålla verktyg för underservade språk, kan Aya bidra till att minska den digitala klyftan och skapa bättre tillgång till teknik och kommunikation för fler människor runt om i världen.
Är du redo att börja generera dina egna prompts? Aya-modellen är massiv och täcker 101 olika språk. Den finns tillgänglig för nedladdning för forskare och utvecklare som vill utforska dess potential ytterligare. Det finns även en "playground" där man kan prova de bästa Aya-modellerna som täcker 21 språk. Här kan forskare och utvecklare prova olika promts och se hur modellen presterar i verkliga användningssituationer.
Flera prestigefyllda medier har täckt lanseringen av Aya. Exempelvis skrev VentureBeat om hur Cohere lanserade Aya 23 med stöd för 23 språk. AI Business har tidigare rapporterat om hur Aya kan användas för att bygga flerspråkiga AI-lösningar. SiliconANGLE framhävde Ays bidrag till öppenkällkodsprojekt med stöd för 101 språk, medan Axios talade om lanseringen som ett steg mot att fylla det enorma språkglappet inom AI-området. Dessa artiklar är bara några exempel på det positiva mottagandet av Aya inom teknologivärlden och visar hur stor påverkan projektet redan har haft.
Vi är långt ifrån klara med Aya-projektet. I vår Aya 23-blogg kan du läsa om våra senaste framsteg, inklusive våra öppna modeller med 8 och 35 miljarder parametrar. För de som är intresserade av att bidra till forskningen och representera sitt språk för inkludering i framtida versioner, finns det många möjligheter att delta. Genom att delta i vårt Open Science-initiativ, kan forskare och utvecklare från hela världen samarbeta på förstklassig forskning inom maskininlärning.
Aya leds av Cohere For AI, en icke-vinstdrivande forskningslab som syftar till att lösa komplexa maskininlärningsproblem. Vår hängivenhet till grundläggande forskning och vårt fokus på att skapa fler ingångar till maskininlärningsforskning, placerar oss i framkant av teknologisk innovation. Vi stödjer forskare genom att tillhandahålla nödvändiga verktyg och resurser för att driva maskininlärningsfältet framåt.
För att sammanfatta, Aya representerar ett stort steg framåt för flerspråkig generativ AI. Genom en global, gemensam forskningsinsats har vi skapat en modell och dataset som inte bara ökar vår förståelse och kapabilitet inom AI, men också förbättrar tillgången till avancerade teknologier för språk som tidigare har varit försummade inom detta fält. Oavsett om du är forskare, utvecklare, eller bara intresserad av AI, erbjuder Aya fantastiska möjligheter att utforska och bidra till detta banbrytande område.
Aya 101 är den mest omfattande modellen i Aya-projektet, med stöd för hela 101 språk. Detta gör den till en av de mest mångsidiga flerspråkiga AI-modellerna som finns tillgängliga idag. Aya 101 är särskilt betydelsefull eftersom den inkluderar många mindre utbredda språk som ofta förbises i AI-utveckling. Detta innebär att Aya 101 kan bidra till att bevara och främja språklig mångfald i den digitala eran.
Valet av ormbunken som symbol för Aya-projektet är djupt rotat i dess etymologi och symboliska betydelse. I många kulturer representerar ormbunken återfödelse, uthållighet och anpassningsförmåga. Dessa egenskaper speglar perfekt Aya-projektets mål att kontinuerligt utveckla och anpassa AI-teknologi för att möta de varierande behoven hos världens olika språk och kulturer. Ormbunkens förmåga att överleva och frodas i olika miljöer symboliserar också Ayas ambition att fungera effektivt över ett brett spektrum av språk och användningsområden.
Som tidigare nämnts betyder "Aya" ormbunke på twi-språket, som talas i Ghana. Men betydelsen av Aya sträcker sig bortom dess bokstavliga översättning. I kontexten av AI-projektet representerar Aya en vision om en mer inkluderande och mångsidig framtid för artificiell intelligens. Namnet Aya symboliserar projektets mål att överbrygga språkliga och kulturella barriärer genom teknologi. Det representerar också en hyllning till den globala mångfalden av språk och kulturer som Aya-projektet strävar efter att tjäna och bevara genom sin banbrytande flerspråkiga AI-teknologi.