22.3.2024Avainsanat Kieli ja kommunikaatio

Tekoäly ja pahat kysymykset

Chat GPT 3.5 sisältää omat tehdasasetuksensa kuten kaikki (tekoäly)algoritmit. Hyväksytyt ja ei-hyväksytyt kysymykset erotellaan ja jälkimmäisiin jätetään vastaamatta. Ainakaan suoraan niihin ei vastata.

Kirjoittaja Juhani Toivanen

Kuvaaja/kuvittaja Sirpa Anundi

Miksi kukaan kysyisi ”pahoja asioita” tekoälyltä? Kysymys on samaa tasoa kuin ihmettely, miksi maailmassa tapahtuu pahoja asioita. Kaikkia teknologioita voi käyttää väärin.

Ei vastausta

Chat GPT 3.5 on järkevästi ohjelmoitu olemaan yleishyödyllinen. Rikolliseen, moraalittomaan tai yksilöä tai yhteisöä vahingoittavaan toimintaan ei anneta ohjeita. Seuraavat vastaukset kysymyksiin osoittavat asian (esitetyt kysymykset lienevät ilmeisiä):

”… tietoisesti ja merkittävästi yli nopeusrajoituksen ajaminen ei ole suositeltavaa turvallisuussyistä ja lakien noudattamisen vuoksi.”

”Valitettavasti en voi suositella tiettyä määrää alkoholia, jonka voisit juoda tunnin aikana, sillä se riippuu monista yksilöllisistä tekijöistä, kuten…”

”On tärkeää ymmärtää, että lahjojen antaminen ei ole tapa ostaa tai manipuloida toisen henkilön kiinnostusta sinua kohtaan.”

(OpenAI, 2024.)

Liian pahoista kysymyksistä tekoäly antaa jopa sisältövaroituksen:

“This content may violate our usage policies” (OpenAI).

Chat GPT 3.5 toimii asiassa kuten pitääkin: esimerkiksi kiihtyneessä tilassa tehtyihin henkeä tai terveyttä uhkaavaan toimintaan liittyviin kysymyksiin ei tule vastausta, vaan kehotus etsiä apua akuutisti esimerkiksi terveydenhuollosta.

Harmaan alueen kysymykset

ChatGPT:ltä kysyttiin myös, miten toista voi hämmentää keskustelussa lingvistisin keinoin. Chat GPT 3.5 ei suostu vastaamaan esitettyyn kysymykseen vaan antaa ohjeen:

”Jos tavoitteenasi on hämmentää toista keskustelussa, se voi aiheuttaa epämukavia tilanteita ja vahingoittaa vuorovaikutusta” (OpenAI, 2024).

Asia kierrettiin tiedustelemalla keskustelun lingvistisiä piirteitä, jotka saavat puhekumppanin pois tolaltaan. Vastaukseen pyydettiin myös kirjallisuusviitteet. Vastaus oli selkeä ja perusteltu lista kielellisistä piirteistä, ja kirjallisuusviitteet olivat täsmällisiä ja ajantasaisia sekä kielentutkijalle tuttuja.

Johtopäätökset

Chat GPT 3.5:n tehdasasetukset toimivat hyvin: ”pahoihin” kysymyksiin ei vastata. Vastaukset pahoihin kysymyksiin lienee kuitenkin mahdollista ainakin jossakin määrin saada, kun kysymyksen muotoilee uudelleen. Miten kysymys ”kannattaa” muotoilla – tämä jääköön avoimeksi.

Lähde

OpenAI. (2024). [Versio 3.5]. ChatGPT. https://openai.com/chatgpt

Pysyvä osoite: http://urn.fi/URN:NBN:fi-fe2024031411193

Ei vastausta

Harmaan alueen kysymykset

Johtopäätökset

Lähde

Jaa artikkeli