Alibaba julkaisee uuden Qwen-tekoälymallin ja väittää sen suoriutuvan paremmin kuin DeepSeek-V3

Photo by John Schnobrich on Unsplash

Alibaba julkaisee uuden Qwen-tekoälymallin ja väittää sen suoriutuvan paremmin kuin DeepSeek-V3

Reading Time: 2 min

Updated 2 times since publishing

Kiinalainen jättiläinen Alibaba julkaisi uusimman version lippulaiva tekoälymallistaan, Qwenistä, tänä keskiviikkona. Yhtiö väittää, että se pystyy suorittamaan tehtäviä paremmin kuin suosittu DeepSeek-V3.

Kiire? Tässä ovat nopeat faktat!

  • Alibaba julkaisi uusimman päättelymallinsa Qwen 2.5-Max tämän keskiviikon.
  • Kiinalainen jättiläinen väittää, että se suoriutuu paremmin kuin suositut mallit, kuten DeepSeek-V3, GPT-4o ja Llama-3.1-405B.
  • Yhtiö lanseerasi myös Qwen2.5-VL:n tällä viikolla, tekoälymallin, joka pystyy käsittelemään kuvia ja toimimaan tekoälyagenttina tietokoneiden ja mobiililaitteiden avulla tehtävien suorittamiseen.

Reutersin mukaan Alibaba lanseerasi uuden Qwen 2.5-Max -nimisen päättelymallin juuri Kiinan kuun uudenvuoden juhlien aikana. Tämä uutuus liittyy osaksi viime päivinä tapahtunutta valtavaa tekoälykehitystä ja lisää kotimaista kilpailua.

Maanantaina DeepSeek nousi ensimmäiseksi Apple’n App Storessa Yhdysvalloissa, ohittaen ChatGPT:n, mikä huolestutti muita tekoälyalan yrityksiä ja säikäytti sijoittajat—Nvidian osakkeet laskivat 17% vain yhdessä päivässä.

Nyt Alibaba on ilmoittanut julkaisevansa uusimmat Qwen-mallinsa—se julkaisi 100 avoimen lähdekoodin tekoälymallia Qwen-sarjaan viime vuoden syyskuussa—lupaten parempia tuloksia kuin suositut eturintaman mallit.

”Qwen 2.5-Max suoriutuu paremmin (…) lähes kaikilla mittareilla kuin GPT-4o, DeepSeek-V3 ja Llama-3.1-405B,” kirjoitti yritys virallisella WeChat-tilillään.

Uuden päättelymallin Qwen 2.5-Maxin API on saatavilla Alibaban pilvipalvelun kautta ja käyttäjät voivat myös testata mallia sen chat-sivulla.

”Kehitämme Qwen2.5-Maxia, suurimittakaavaista MoE-mallia, joka on esikoulutettu yli 20 biljoonalla tunnuksella ja jota on edelleen jälkikoulutettu kuratoiduilla Supervised Fine-Tuning (SFT) ja Reinforcement Learning from Human Feedback (RLHF) -menetelmillä”, kirjoitti Qwen-tiimi Githubissa.

Kiinalainen jättiläinen julkaisi myös maanantaina Qwen2.5-VL:n, joukon multimodaalisia tekoälymalleja, jotka voivat myös käsitellä kuvia ja päästä käsiksi matkapuhelimiin ja tietokoneisiin tehtävien suorittamiseksi. OpenAI ilmoitti samanlaisesta ominaisuudesta, Operator, joka antaa ChatGPT:n suorittaa tehtäviä itsenäisesti ottaen käyttäjän tietokoneen hallintaan.

Alibaban tiimin mukaan kaikki Qwen-mallit suoriutuvat paremmin kuin vastaavat versiot OpenAI:lta, Microsoftilta, Googlelta, Metalta ja DeepSeekiltä.

Did you like this aricle? Rate It!
Average form Rating Comment 1 Average form Rating Comment 2 Average form Rating Comment 3 Average form Rating Comment 4 Average form Rating Comment 5

We're thrilled you enjoyed our work!

As a valued reader, would you mind giving us a shoutout on Trustpilot? It's quick and means the world to us. Thank you for being amazing!

Rate us on Trustpilot
0 Voted by 0 Users
Title
Comment
Thanks for your Feed Back