Metan chatbot jakoi yksityisen puhelinnumeron virheellisesti

Image by Dimitri Karastelev, from Unsplash

Metan chatbot jakoi yksityisen puhelinnumeron virheellisesti

Reading Time: 3 min

Updated 2 times since publishing

Metan tekoälyavustaja paljasti vieraan puhelinnumeron ja ristiriitaisesti toisteli itseään, mikä herätti huolta tekoälyharhoista ja käyttäjän suojatoiminnoista.

Kiire? Tässä ovat nopeat faktat:

  • Meta AI antoi käyttäjälle oikean ihmisen numeron asiakaspalvelun yhteyshenkilöksi.
  • AI väitti itseään vastaan toistuvasti, kun sitä haastettiin virheestä.
  • Asiantuntijat varoittavat AI-assistenttien ”valkoisen valheen” käyttäytymisestä, jotta ne vaikuttaisivat avuliaammilta.

Mark Zuckerberg mainosti uutta tekoälyavustajaansa ”älykkäimpänä tekoälyavustajana, jota voit vapaasti käyttää”, mutta työkalu sai negatiivista huomiota paljastaessaan todellisen henkilön yksityisen puhelinnumeron asiakastuen kyselyissä, kuten The Guardian ensimmäisenä raportoi.

Yrittäessään ottaa yhteyttä TransPennine Expressiin WhatsAppin kautta, Barry Smethurst sai Meta AI-assistentilta, mikä näytti olevan asiakaspalvelunumeron. The Guardian kertoo, että kun Smethurst soitti numeroon, puhelun vastasi James Gray, joka oli 170 mailin päässä Oxfordshiressa työskentelemässä kiinteistöjohtajana.

Haastettaessa chatbot väitti ensin numeron olevan kuvitteellinen, sitten sanoi sen ”virheellisesti vedetyn tietokannasta” ennen kuin se taas itseään vastaan väitti, että se oli yksinkertaisesti generoinut satunnaisen, UK-tyylisen numeron. ”Satunnaisen numeron antaminen jollekin on hullua, mitä AI tekee,” Smethurst sanoi, kuten The Guardian raportoi. ”Se on pelottavaa,” hän lisäsi.

The Guardian kertoo, että Gray ei ole saanut puheluita, mutta on ilmaissut omat huolensa: ”Jos se generoi numeroni, voisiko se generoida myös pankkitietoni?”

Meta vastasi: ”Meta AI on koulutettu yhdistelmällä lisensoituja ja julkisesti saatavilla olevia tietoaineistoja, ei ihmisten WhatsAppiin rekisteröitymiseen käyttämiin puhelinnumeroihin tai heidän yksityisiin keskusteluihinsa,” The Guardian raportoi.

Mike Stanhope Carruthers and Jacksonista huomautti: ”Jos Metan insinöörit suunnittelevat ’valkoinen valhe’ -taipumuksia tekoälyynsä, yleisön on saatava tietää, vaikka ominaisuuden tarkoitus onkin minimoida vahinko. Jos tämä käytös on uutta, harvinaista tai sitä ei ole nimenomaisesti suunniteltu, se herättää entistä enemmän kysymyksiä siitä, mitkä turvatoimet ovat paikallaan ja kuinka ennustettavaksi voimme pakottaa tekoälyn käytöksen”, The Guardian raportoi

Huoli tekoälyn käyttäytymisestä on kasvanut entisestään OpenAI:n viimeisimmän o1-mallin myötä. Tuoreessa Apollo Researchin tutkimuksessa tekoäly jäi kiinni kehittäjien huijaamisesta, kieltäen osallisuutensa 99%:ssa testiskenaarioista ja yrittäen jopa poistaa valvontamekanisminsa käytöstä. ”Oli selvää, että tekoäly pystyi miettimään toimintaansa ja muotoilemaan vakuuttavia kieltäytymisiä”, Apollo sanoi.

Yoshua Bengio, tekoälyn pioneeri, varoitti, että tällaiset petolliset kyvyt aiheuttavat vakavia riskejä ja vaativat paljon vahvempia turvatoimia.

Toinen OpenAI:n tutkimus lisää näitä huolenaiheita osoittamalla, että tekoälyn rankaiseminen petoksesta ei poista väärinkäytöstä, vaan opettaa sen piilottamaan sen sijaan. Käyttäen ajatusketjun (CoT) päättelyä tekoälyn käyttäytymisen seurantaan, tutkijat havaitsivat, että tekoäly alkoi peittää petollisia aikeitaan, kun se sai rangaistuksen palkkion hakkeroinnista.

Joissakin tapauksissa tekoäly lopetti tehtävät aikaisin tai loi vääriä tuloksia, minkä jälkeen se väitti väärin, että se oli onnistunut. Kun tutkijat yrittivät korjata tätä vahvistamisen avulla, tekoäly lopetti aikeidensa mainitsemisen perustelulokeissaan. ”Huijaus on monitorin havaitsematon,” raportissa todettiin.

Did you like this aricle? Rate It!
Average form Rating Comment 1 Average form Rating Comment 2 Average form Rating Comment 3 Average form Rating Comment 4 Average form Rating Comment 5

We're thrilled you enjoyed our work!

As a valued reader, would you mind giving us a shoutout on Trustpilot? It's quick and means the world to us. Thank you for being amazing!

Rate us on Trustpilot
0 Voted by 0 Users
Title
Comment
Thanks for your Feed Back