I dagens AI-landskap, där utvecklingen går med stormsteg, har Anthropic återigen lyckats höja ribban med sin senaste modell Claude 3.5 Sonnet. Denna nya version av Claude-familjen utlovar att erbjuda en överlägsen intelligens, samtidigt som den är snabbare och mer kostnadseffektiv än många av sina konkurrenter.
Claude 3.5 Sonnet har visat sig överlägsen andra modeller när det gäller akademisk resonemang, allmän kunskap och kodarfärdighet. Den har uppvisat betydande förbättringar i att uppfatta nyanser, humor och komplexa instruktioner. Modellen är exceptionell på att skriva högkvalitativ innehåll med en naturlig och relaterbar ton. Med sin höga intelligens och snabbhet är Claude 3.5 Sonnet perfekt för komplexa uppgifter som kontextuellt anpassat kundsupport och att orkestrera flerstegslösningar.
I en intern utvärdering av kodningsförmåga kunde Claude 3.5 Sonnet lösa 64% av problemen, vilket översteg Claude 3 Opus som endast kunde lösa 38%. När Claude 3.5 Sonnet instruerades och försågs med relevanta verktyg kunde den självständigt skriva, redigera och exekvera kod med sofistikerat resonemang och felsökningsförmåga. Den hanterar kodöversättningar med lätthet, vilket gör den särskilt effektiv för att uppdatera äldre applikationer och migrera kodplattformar.
Claude 3.5 Sonnet är Anthropics starkaste visionsmodell hittills och överträffar Claude 3 Opus på standardtester för visuell förmåga. Dessa stegvisa förbättringar är särskilt märkbara för uppgifter som kräver visuellt resonemang, som att tolka diagram och grafer. Claude 3.5 Sonnet kan även exakt transkribera text från imperfekta bilder – en kärnfunktion för detalj-, logistik- och finanssektorn, där AI kan extrahera mer insikter från en bild, grafik eller illustration än från enbart text.
Samtidigt som Claude 3.5 Sonnet introduceras har Anthropic också lanserat Artifacts på Claude.ai, en ny funktion som utökar hur användare kan interagera med Claude. När en användare ber Claude att generera innehåll som kodsnippet, textdokument eller webbdesigner, visas dessa Artifacts i ett dedikerat fönster bredvid deras konversation. Detta skapar en dynamisk arbetsyta där de kan se, redigera och bygga vidare på Claudes skapelser i realtid, och på ett smidigt sätt integrera AI-genererat innehåll i sina projekt och arbetsflöden.
Denna förhandsvisningsfunktion markerar Claudes utveckling från en konversations-AI till en samarbetsmiljö. Det är bara början på en bredare vision för Claude.ai, som snart kommer att expandera för att stödja teamsamarbete. I en nära framtid kommer team – och så småningom hela organisationer – att kunna samla sin kunskap, dokument och pågående arbete på ett säkert sätt i ett gemensamt utrymme, där Claude fungerar som ett ständigt tillgängligt team-medlem.
Anthropics modeller genomgår rigorösa tester och har tränats för att minska missbruk. Trots Claude 3.5 Sonnets språng i intelligens har deras "red team"-utvärderingar kommit fram till att Claude 3.5 Sonnet förblir på ASL-2-nivån (Anthropics skalnivå för ansvarsfull AI). Mer detaljer finns i tillägget till modellkortet.
Som en del av sitt åtagande för säkerhet och transparens har Anthropic engagerat externa experter för att testa och finslipa säkerhetsmekanismerna i den senaste modellen. De har nyligen tillhandahållit Claude 3.5 Sonnet till Storbritanniens AI-säkerhetsinstitut (UK AISI) för en säkerhetsutvärdering före lansering. Resultaten delades med det amerikanska AI-säkerhetsinstitutet (US AISI) som en del av ett samförståndsavtal, möjliggjort genom det partnerskap mellan US och UK AISI som tillkännagavs tidigare i år.
Anthropic har integrerat policyfeedback från externa ämnesexperter för att säkerställa att deras utvärderingar är robusta och tar hänsyn till nya trender i missbruk. Detta engagemang har hjälpt deras team att skala upp förmågan att utvärdera 3.5 Sonnet mot olika typer av missbruk. Till exempel användes feedback från barnsakerhetsexperter på Thorn för att uppdatera deras klassificerare och finslipa modellerna.
En av Anthropics kärnprinciper som väglett utvecklingen av deras AI-modeller är integritet. De tränar inte sina generativa modeller på data som användare har skickat in, såvida inte användaren ger uttrycklig tillåtelse för detta. Hittills har de inte använt någon kund- eller användardata för att träna sina generativa modeller.
Anthropics mål är att väsentligt förbättra avvägningen mellan intelligens, hastighet och kostnad var tredje till fjärde månad. För att komplettera Claude 3.5-modellfamiljen kommer de att släppa Claude 3.5 Haiku och Claude 3.5 Opus senare i år.
Utöver att arbeta på sin nästa generations modellfamilj utvecklar Anthropic nya modaliteter och funktioner för att stödja fler användningsområden för företag, inklusive integrationer med företagsprogram. Deras team utforskar också funktioner som Minne, vilket kommer att göra det möjligt för Claude att komma ihåg en användares preferenser och interaktionshistorik enligt specifikation, för att göra upplevelsen ännu mer personlig och effektiv.
Anthropic arbetar ständigt för att förbättra Claude och älskar att få feedback från sina användare. Du kan skicka in feedback om Claude 3.5 Sonnet direkt i produkten för att informera deras utvecklingsväg och hjälpa deras team att förbättra din upplevelse. Som vanligt ser de fram emot att se vad du bygger, skapar och upptäcker med Claude.