Sosiaalisen median sisältöjen avulla tekoälylle voi opettaa muun muassa tunteisiin liittyviä asioita.
Viestipalvelu X:n uusien palveluehtojen ja tietosuojakäytäntöjen mukaan käyttäjien tuottamaa sisältöä voidaan jatkossa käyttää kolmansien osapuolien tekoälymallien kouluttamiseen.
Asiasta kertovat muun muassa CNN ja Techcrunch sekä Suomessa ensimmäisenä mobiili.fi.
Käyttäjädataa on jo aiemmin käytetty X:n oman Grok-tekoälyn kouluttamiseen. Sen on kuitenkin voinut kieltää asetuksista.
Lupa sisältöjen luovuttamiselle Grokin kouluttamiseen on ollut oletuksena päällä, kuten nyt kolmannet osapuolet sisältävässä uudistuksessa.
Käyttäjäehtopäivityksessä mainitaan mahdollisuus tietojen jakamisen kieltämisestä, mutta toistaiseksi asetuksista ei löydy sellaista kohtaa. Se voi ilmestyä ehtojen tullessa voimaan 15. marraskuuta.
X on ilmoittanut aikaisemmin lopettaneensa Grok-tekoälyn kouluttamisen EU-alueen käyttäjätiedoilla, kun Irlannin tietosuojaviranomainen aloitti asiasta oikeustoimet.
Some opettaa tekoälylle tunteista
Käyttäjädatan arvo on kasvanut, kun kilpailu tekoälymallien kehittämisestä on kiristynyt.
Helmikuussa Reddit solmi 60 miljoonan dollarin vuosisopimuksen Googlen kanssa palvelun keskustelujen hyödyntämisestä kielimallien kouluttamiseen.
CBC:lle aihetta kommentoineen kyberturvallisuus- ja teknologia-analyytikko Ritesh Kotakin mukaan malleista tulee sitä tarkempia, mitä enemmän dataa saa käyttöönsä.
– Sosiaalisen median julkaisut eivät ole parhaita mahdollisia teknisestä näkökulmasta tai sen suhteen, mitä maailmassa tapahtuu, mutta ne rikastuttavat tunteisiin liittyvää analyysiä.
Teknologiaan liittyviä markkinointipalveluita tarjoava Techtarget huomauttaa, että some-datan käyttö voi opettaa puolueellista tietoa, slangia, kapulakieltä, haitallista sisältöä ja disinformaatiota. Siksi materiaalia pitää suodattaa ja rajata.
Julkaisussaan Techtarget luettelee, miten eri palvelut keräävät käyttäjätietoja tekoälyn kouluttamiseen ja miten niitä saa pois päältä:
- Discord: Käyttää dataa, voi kytkeä pois päältä.
- Linkedin: Käyttää dataa, voi kytkeä pois päältä.
- Meta: Käyttää dataa, mikäli tili on julkinen. Facebook, Instagram, Threads ja Whatsapp on mahdollista muuttaa yksityisiksi.
- Reddit: Käyttää dataa, ei voi kytkeä pois päältä.
- Snapchat: Käyttää dataa My Selfie ja My AI -toiminnoissaan, voi kytkeä pois päältä.
- Tiktok: Käyttää dataa, yksityinen tili vähemmän.
- Tumblr: Käyttää dataa, voi kytkeä pois päältä.