AI, joka miettii ennen kuin se puhuu? Claude 3.7 Sonnet esittelee hybridireasonointia

Image by TechCrunch, from Flickr

AI, joka miettii ennen kuin se puhuu? Claude 3.7 Sonnet esittelee hybridireasonointia

Reading Time: 2 min

Updated 2 times since publishing

Anthropic on julkaissut Claude 3.7 Sonnetin, uuden version AI-mallistaan, joka esittelee valinnaisen ”laajennetun ajattelun” tilan, antaen käyttäjille enemmän kontrollia siitä, miten malli käsittelee monimutkaisia tehtäviä.

Kiire? Tässä ovat pikafaktat!

  • Malli parantaa päättely- ja ongelmanratkaisutaitoja mahdollistamalla itsetutkiskelun ennen vastaamista.
  • Laajennettu ajattelutila on saatavilla vain maksullisissa suunnitelmissa.
  • Claude Code, koodausavustaja, on rajoitetussa esikatselussa kehittäjille

Anthropic on julkaissut päivitetyn tekoälymallin, Claude 3.7 Sonnetin, joka esittelee hybridiajattelun, mahdollistaen käyttäjille valinnan nopeiden vastausten ja laajennetun ajattelun välillä.

Tämän uuden lähestymistavan tavoitteena on parantaa ongelmanratkaisua antamalla mallille lisäaikaa arvioida ja hiota vastauksiaan tarvittaessa.

Vakiomoodissa Claude 3.7 Sonnet toimii iteratiivisena parannuksena edeltäjäänsä, Claude 3.5 Sonnetiin nähden. Laajennetussa ajattelutilassa malli kuitenkin harjoittaa itsetutkiskelua ennen vastauksen antamista.

Michael Gerstenhaber, Anthropicin tuotepäällikkö AI:lle, kuvasi ominaisuutta keinona, jolla käyttäjät voivat tasapainottaa vasteaikaa ja päättelyn syvyyttä. ”[Käyttäjällä] on paljon kontrollia käyttäytymiseen – kuinka kauan se ajattelee, ja voi vaihtaa päättelykykyä ja älykkyyttä ajan ja budjetin kanssa”, hän sanoi, kuten WIRED raportoi.

Tämä prosessi on tarkoitettu parantamaan tarkkuutta aloilla, jotka vaativat monivaiheista päättelyä, kuten matematiikka, fysiikka, koodaus ja ohjeiden noudattaminen. Käyttäjät, jotka ovat vuorovaikutuksessa mallin kanssa API:n kautta, voivat määrittää rajan sille, kuinka monta merkkiä se käyttää ”ajattelemiseen”, mikä mahdollistaa vasteajan ja kustannusten hallinnan.

WIRED huomauttaa, että päivitys sisältää myös ”raaputuslevy”-ominaisuuden, joka tekee mallin päättelyvaiheet näkyviksi sen käsitellessä pyyntöä. Tämä lähestymistapa on samankaltainen kuin menetelmät, joita käytetään muissa tekoälymalleissa, kuten DeepSeek:ssä.

Anthropic ilmoittaa, että Claude 3.7 Sonnet on optimoitu todellisen maailman sovelluksiin kilpailutyylisen suorituskykymittauksen sijaan. Varhaiset testit viittaavat siihen, että laajennettu päättelytila parantaa suorituskykyä tehtävissä, jotka liittyvät monimutkaisiin koodikantoihin, edistyneeseen työkalujen käyttöön ja koko pinon ohjelmistokehitykseen.

Mallia on arvioitu SWE-bench Verified ja TAU-bench -alustoilla, jossa sen kerrotaan suoriutuvan paremmin kuin edelliset versiot, kuten Anthropic on raportoinut.

CNN huomauttaa, että Anthropic on pitänyt Claude 3.7 -mallin hinnan samana kuin aiemmissa malleissa, sijoittaen sen alle OpenAI:n viimeisimpien tarjousten. Sen hinta on 3 dollaria miljoonaa syötetokenia kohti ja 15 dollaria miljoonaa tulostetokenia kohti, verrattuna OpenAI:n 15 dollariin ja 60 dollariin vastaavissa tasoissa.

Did you like this aricle? Rate It!
Average form Rating Comment 1 Average form Rating Comment 2 Average form Rating Comment 3 Average form Rating Comment 4 Average form Rating Comment 5

We're thrilled you enjoyed our work!

As a valued reader, would you mind giving us a shoutout on Trustpilot? It's quick and means the world to us. Thank you for being amazing!

Rate us on Trustpilot
0 Voted by 0 Users
Title
Comment
Thanks for your Feed Back