Tekoäly tekstintuotossa – renki vai isäntä?
Automaattisesti aiheesta kuin aiheesta tekstiä tuottavat tekoälyjärjestelmät aiheuttavat oppilaitoksissa plagiointiaaltopelkoa. Osin syystä, osin syyttä. Mikä olisi rakentava lähestymistapa?
Chat GPT on tällä hetkellä tunnetuin (ja kiistellyin) automaattisesti tekstiä generoiva tekoälyjärjestelmä. GPT pystyy tuottamaan tekstiä lähes millä kielellä tahansa ja aiheesta kuin aiheesta – toki tekstin sisältämien väitteiden todenperäisyys voi vaihdella paljonkin. Oppilaitoksissa on jo ehätetty pohtimaan GPT:n käyttökieltoa.
Toisaalta Jyväskylän yliopiston kauppakorkeakoulu ilmoitti tammikuussa 2023, että järjestelmä sallitaan jopa opinnäytetyössä, kunhan opiskelija ei esitä järjestelmän tuottamaa tekstiä omanaan (Loula, 2023). Uskottavan oloinen perustelu linjaukselle on, että tekoälyä käytetään joka tapauksessa (tulevaisuuden) työelämässä, joten sen asianmukainen käyttö on opittava jo opiskeluaikana.
Tekoälyn teksti
Opiskelija voi pyytää Chat GPT:tä vastaamaan esimerkiksi kysymykseen:
Mikä on inflaation merkitys korkean teknologian työpaikkojen määrään?
Saatu vastaus on monisanainen muttei kovin informatiivinen. GPT:n tuottamien tekstin taso ja informaatioarvo riippuu täysin siitä, millaiseen syötteeseen (tekstitietokantaan) järjestelmä perustaa vastauksensa. Jos tietokanta on kyseisen teeman osalta laadukasta, vastaus on laadukas. Ellei, vanha tietojenkäsittelytieteen periaate pätee:
Shit in, shit out.
Koko opinnäytetyön tuottaminen Chat GPT:llä, niin että lopputulos on uskottava, taitaa olla vielä mahdoton tehtävä. Poikkeuksia voi olla, mutta niissä tapauksissa työn tilaaja (vilpillinen opiskelija) lienee myös itse voimallisesti editoinut GPT:n tekstiä.
Koko opinnäytetyön tuottaminen Chat GPT:llä, niin että lopputulos on uskottava, taitaa olla vielä mahdoton tehtävä.
Chat GPT, yhtä vähän kuin muutkaan tekoälyjärjestelmät, eivät automaattisesti koosta valmiita (kvantitatiivisia tai kvalitatiivisia) analyyseja opiskelijan raakadatasta (Rocha, 2022) – saatikka että ne lähtisivät keräämään dataa opiskelijan pyynnöstä. Järjestelmät eivät ole tieteiskirjallisuuden kaikkeen pystyviä tekoälyentiteettejä. Datan jatkojalostaminen on tiettyyn määrään mahdollista GPT:llä, mutta siinä onnistumiseen vaaditaankin jo koodaustaitoja (Rocha, 2022).
Tekstigeneraattorin (Chat GPT:n tai jonkin muun) käyttäminen vaikkapa seminaariesitelmässä on toki mahdollista ja tuotettu teksti saattaa olla yllättävän hyvää, mutta opiskelijan on silti tehtävä huolellinen faktantarkastus ja kieliasun tarkastus. Chat GPT tyypillisesti hyödyntää valtavaa opetusaineistoaan ”faktoja” tarjoillessaan. Valitettavasti jotkut faktat eivät ole paikkansapitäviä, joten tekstin tilaajan on käytettävä aikaa tarkistaessaan automaattisen tekstigeneraattorin tuotosta. Saman ajan voisi ehkä käyttää itsenäiseen tekstintuottoonkin.
Sovelluskohteita
Rakenteinen teksti on ollut olemassa muodossa tai toisessa satoja vuosia. Rakenteinen tekstidokumentointi luotiin jo kirjapainotaidon alussa: tekstin yhteyteen merkitään sen rakenne, ja eri julkaisualustat toteuttavat tekstin omien spesifisten tyyliasetustensa mukaiseksi. Esimerkki olkoon EMS-dokumentointi (Emergency Medical Services). Siinä ensivasteen ambulanssihenkilökunta täyttää tarkkaan strukturoidut paperiset tai digitaaliset lomakkeet, jotka sairaalassa muunnetaan strukturoiduiksi jatkohoitodokumenteiksi. Luovaa kielellistä variaatiota ei dokumenteissa yleensä tarvita. Oleellisia muuttujia ovat oireet, kliininen arvio, ensihoito, jatkohoito, kotiutusohjeet jne.
Opinnäytetyön abstrakti, ainakin monilla luonnontieteellisillä aloilla, on rakenteinen, protokollaa noudattava tekstilaji. Kielellinen taituruus, esimerkiksi hyvin harvinaisten kirjallisten sanojen muodossa, ei ole toivottavaa. Ei olekaan ihme, että abstraktigeneraattoreita on ollut jo pitkään olemassa eri tieteenaloille. Tuotetun tekstin laadun taso vaihtelee, mutta periaate on sama: koska tieteellinen abstrakti on pitkälti määrämuotoinen, sen tuottaminen voidaan myös pitkälti automatisoida. Parhaassa (tai pahimmassa) tapauksessa abstraktin tilaajan tarvitsee vain lisätä oma (numeerinen) data syötteeseen.
Johtopäätökset
Opinnäytetyön tärkein arvo on sen uutuusarvo: Mitä uusia tuloksia saatiin? Mitä uusia asioita havaittiin? Millaisia teknisiä tai sosiaalisia innovaatioita tuotettiin? Tekstin tuottaminen on ”välttämätön paha”, joka tietysti tulee tehdä mahdollisimman hyvin. Tekoäly ei tee tiedonkeruuta, analyysia tai johtopäätöksiä opiskelijan puolesta ainakaan vielä, mutta tekstintuottamisessa se voi auttaa. Esimerkiksi tekoälyn suorittama esikielentarkastus on järkevä toimenpide, ja kehittyneiltä kielimalleilta se onnistuu pääosin erinomaisesti. Opettajaa tämäkään ei korvaa: teksti voi olla leksikaalisesti ja syntaktisesti sujuvaa mutta sisällöltään epäkoherenttia. Opinnäytetyön kielen logiikkaa tai sen puutetta tekoäly ei pysty fiksaamaan.
Lähteet
Loula, P. (26.1.2023). Opiskelija saa nyt käyttää tekoälyä apunaan jopa gradussa – Jyväskylän yliopistossa tehtiin historiallinen linjaus. Helsingin Sanomat.
Rocha, R. (27.10.2022). Getting Tabular Data from Unstructured Text with GPT-3: An Ongoing Experiment. Machine Learning Times,.
Pysyvä osoite: http://urn.fi/URN:NBN:fi-fe2023030329534