Een stel Amerikaanse wetenschappers heeft een machinelearningalgoritme getraind dat naar eigen zeggen 'met meer dan 99 procent accuraatheid' wetenschappelijke teksten kan herkennen die zijn gegenereerd door ChatGPT. Het team heeft om dit voor elkaar te krijgen 64 'echte' wetenschappelijke artikelen vergeleken met 128 AI-gegenereerde artikelen over dezelfde onderzoeksonderwerpen. Hierbij moest het algoritme letten op verscheidende inhoudelijke en stilistische verschillen tussen hoe mensen doorgaans schrijven, en hoe dat verschilt van de schrijfmethodes van ChatGPT.
Hier kwam bijvoorbeeld uit dat ChatGPT veel minder zinnen en woorden per paragraaf gebruikte dan mensen. Ook wisselen mensen vaker af qua de lengte van hun zinnen, terwijl de gemiddelde hoeveelheid woorden per zin bij de AI-tekst gelijker verdeeld was. Ook bleek dat in menselijke wetenschappelijke teksten er meer gebruikgemaakt wordt van leestekens, zoals vraagtekens, puntkomma's en haakjes. Ook zijn ze specifieker; waar AI vaak zaken als 'andere wetenschappers' schreef, kozen mensen er veelal voor om om de wetenschappers die ze bedoelen bij naam te benoemen.
Hoewel de wetenschappers toegeven dat er aanvullend onderzoek nodig is om de generaliseerbaarheid van deze gevonden kenmerken voor alle menselijke wetenschapsartikelen vast te stellen, bleek dit relatief kleinschalige experiment al genoeg om een zeer nauwkeurige 'AI-contentdetector' in elkaar te zetten, wordt in het onderzoek beweert. Er zijn 192 wetenschappelijke artikelen door de tool gehaald (zowel echt als nep), die op basis van slechts twintig kenmerken in 99,5 procent van de gevallen een correcte classificatie gegeven zou hebben. Wanneer er enkel losse paragrafen worden gevoed aan het algoritme, zakt de accuraatheid echter naar 92 procent.
Er zijn inmiddels al veel tools verschenen die AI-content beweren te herkennen, maar die zijn veelal niet te vertrouwen. Veel experts raden dus af om dergelijke programma's te gebruiken om andermans teksten te controleren. Desalniettemin is een betrouwbare AI-contentdetector wel broodnodig, zegt een van de wetenschappers. "Een groot probleem is dat AI zijn tekst samenstelt vanuit verschillende bronnen, maar deze tekst vervolgens niet checkt op accuraatheid." Vooral voor wetenschappelijke teksten zouden AI-identificatietools nog tekortschieten. Of deze tool ook voor niet-wetenschappelijke teksten soelaas moet bieden, is niet onderzocht.
Online AI-contentdetectors zijn vaak niet accuraat.
Bronnen: EurekAlert, Cell