DeepSeekin tekoäly oppii ajattelemaan itseään varten

Image by Matheus Bertelli, from Pexels

DeepSeekin tekoäly oppii ajattelemaan itseään varten

Reading Time: 2 min

Updated 2 times since publishing

Kiinalainen startup-yritys DeepSeek on yhteistyössä Tsinghua-yliopiston kanssa kertonut kehittäneensä älykkäämmän tavan auttaa tekoälymalleja ajattelemaan paremmin ja nopeammin, ilman tarvetta suurille tietokoneille tai kalliille resursseille.

Kiire? Tässä tiivistettynä tärkeimmät faktat:

  • DeepSeek loi itseään parantavan tekoälyn käyttämällä itseperiaatteellista kritiikin säätöä (SPCT).
  • SPCT opettaa tekoälyä arvioimaan omaa työtään itse luotujen sääntöjen avulla.
  • Menetelmä parantaa suorituskykyä ilman massiivista laskentatehoa.

Läpimurto tulee uudesta tekniikasta, jota kutsutaan itseohjautuvaksi kritiikin säätämiseksi (Self-Principled Critique Tuning, SPCT). SPCT eroaa tavasta parantaa tekoälyn suorituskykyä yksinkertaisesti tekemällä AI-malleista suurempia – SPCT ei vaadi paljon energiaa eikä laskentatehoa opettaakseen tekoälyn arvioimaan omaa työtään itse luotujen sääntöjen avulla.

Se toimii sisäänrakennetun ”tuomarin” kautta, joka varmistaa, että tekoälyn vastaus noudattaa sen sisäisiä päättelysääntöjä ja vaikuttaa sopivalta ihmisen tuotannolle. Kun tekoäly antaa vankkaa palautetta, se saa positiivista palautetta, mikä auttaa parantamaan sen kykyä vastata samankaltaisiin kysymyksiin tulevaisuudessa.

DeepSeek soveltaa tätä menetelmää osana DeepSeek-GRM-järjestelmäänsä, joka tarkoittaa Generative Reward Modelingiä. GRM toimii eri tavalla kuin perinteiset menetelmät, koska se suorittaa rinnakkaisia tarkistuksia parantaakseen sekä tarkkuutta että johdonmukaisuutta.

”Ehdotamme Self-Principled Critique Tuning (SPCT) -menetelmää, joka edistää skaalautuvien palkkioiden luontikäyttäytymistä”, tutkijat kirjoittivat artikkelissaan. ”SPCT mahdollistaa [mallin] sopeutuvan periaatteisiin ja kritiikkiin input-kyselyn ja vastausten perusteella, mikä johtaa parempiin lopputulospalkkioihin.”

Tämän järjestelmän avulla DeepSeek väittää, että sen tekoäly kykenee nyt suoriutumaan paremmin kuin kilpailijansa, kuten Googlen Gemini, Metan Llama ja OpenAI:n GPT-4o, erityisesti monimutkaisten tehtävien, kuten päättelyn tai päätöksenteon suhteen, kuten Euronews on huomauttanut.

On tärkeää huomata, että DeepSeek ilmoittaa aikovansa julkaista nämä uudet työkalut avoimen lähdekoodin ohjelmistoina, vaikka julkaisupäivää ei ole vielä jaettu.

Did you like this aricle? Rate It!
Average form Rating Comment 1 Average form Rating Comment 2 Average form Rating Comment 3 Average form Rating Comment 4 Average form Rating Comment 5

We're thrilled you enjoyed our work!

As a valued reader, would you mind giving us a shoutout on Trustpilot? It's quick and means the world to us. Thank you for being amazing!

Rate us on Trustpilot
0 Voted by 0 Users
Title
Comment
Thanks for your Feed Back