Image by Matheus Bertelli, from Pexels

DeepSeekin tekoäly oppii ajattelemaan itseään varten

Reading Time: 2 min

First published Apr 8, 2025

Updated 2 times since publishing

Written by: Kiara Fabbri Entinen tekniikkauutisten toimittaja
Translated by Lokalisointi- ja käännöstiimi Lokalisointi- ja käännöspalvelut

Kiinalainen startup-yritys DeepSeek on yhteistyössä Tsinghua-yliopiston kanssa kertonut kehittäneensä älykkäämmän tavan auttaa tekoälymalleja ajattelemaan paremmin ja nopeammin, ilman tarvetta suurille tietokoneille tai kalliille resursseille.

Kiire? Tässä tiivistettynä tärkeimmät faktat:

DeepSeek loi itseään parantavan tekoälyn käyttämällä itseperiaatteellista kritiikin säätöä (SPCT).
SPCT opettaa tekoälyä arvioimaan omaa työtään itse luotujen sääntöjen avulla.
Menetelmä parantaa suorituskykyä ilman massiivista laskentatehoa.

Läpimurto tulee uudesta tekniikasta, jota kutsutaan itseohjautuvaksi kritiikin säätämiseksi (Self-Principled Critique Tuning, SPCT). SPCT eroaa tavasta parantaa tekoälyn suorituskykyä yksinkertaisesti tekemällä AI-malleista suurempia – SPCT ei vaadi paljon energiaa eikä laskentatehoa opettaakseen tekoälyn arvioimaan omaa työtään itse luotujen sääntöjen avulla.

Se toimii sisäänrakennetun ”tuomarin” kautta, joka varmistaa, että tekoälyn vastaus noudattaa sen sisäisiä päättelysääntöjä ja vaikuttaa sopivalta ihmisen tuotannolle. Kun tekoäly antaa vankkaa palautetta, se saa positiivista palautetta, mikä auttaa parantamaan sen kykyä vastata samankaltaisiin kysymyksiin tulevaisuudessa.

DeepSeek soveltaa tätä menetelmää osana DeepSeek-GRM-järjestelmäänsä, joka tarkoittaa Generative Reward Modelingiä. GRM toimii eri tavalla kuin perinteiset menetelmät, koska se suorittaa rinnakkaisia tarkistuksia parantaakseen sekä tarkkuutta että johdonmukaisuutta.

”Ehdotamme Self-Principled Critique Tuning (SPCT) -menetelmää, joka edistää skaalautuvien palkkioiden luontikäyttäytymistä”, tutkijat kirjoittivat artikkelissaan. ”SPCT mahdollistaa [mallin] sopeutuvan periaatteisiin ja kritiikkiin input-kyselyn ja vastausten perusteella, mikä johtaa parempiin lopputulospalkkioihin.”

Tämän järjestelmän avulla DeepSeek väittää, että sen tekoäly kykenee nyt suoriutumaan paremmin kuin kilpailijansa, kuten Googlen Gemini, Metan Llama ja OpenAI:n GPT-4o, erityisesti monimutkaisten tehtävien, kuten päättelyn tai päätöksenteon suhteen, kuten Euronews on huomauttanut.

On tärkeää huomata, että DeepSeek ilmoittaa aikovansa julkaista nämä uudet työkalut avoimen lähdekoodin ohjelmistoina, vaikka julkaisupäivää ei ole vielä jaettu.

DeepSeekin tekoäly oppii ajattelemaan itseään varten

We're thrilled you enjoyed our work!