Naar welk niveau van de hel gaat de huidige AI (GPT-3, bijvoorbeeld) ons brengen?
Mijn basale redenering stemt in ieder geval voorlopig, helemaal niet hoopgevend. Fundamentele beperkingen van AI, afnemende meerkosten en de economische wetten leiden wat mij betreft tot een deprimerende cocktail.
Recente berichten over AI gegenereerde content zien er veelbelovend uit. GPT3 en andere Large Language Models produceren redelijk leesbare en unieke content. Hiermee kunnen studenten, journalisten, marketeers en andere contentmakers dus lekker snel uit de voeten. Hoe luier de producent, gedreven door sturing op output en snelheid of gewoon, lui vanuit zichzelf, hoe minder werk hij zal willen steken in de content en in de kwaliteit ervan.
AI content: Middelmatig op zijn best
Kijken we dan in meer detail naar die geproduceerde content, dan is die middelmatig op zijn best. Teksten zitten op dit moment nog boordevol (zie “Links & Bronnen” voor een verwijzing naar de fouten):
- Kleine en grote fouten (2 en 7)
- Persoonsverwisselingen (3)
- Fake news en niet bestaande links (4)
- Veel (meer of minder subtiele) vooroordelen. (5 en 8)
“It’s hilariously bad.”
(Meta Galactica AI)
De oorsprong van demiddelmatigheid
Deze fouten komen voort uit de aanpak die op hoofdlijnen hetzelfde is:
- Veel voorkomend wordt versterkt, daarom kent AI bijvoorbeeld geen mannelijke verpleger
- Trainingsset is altijd historisch en nieuwe kennis wordt maar langzaam mainstream
- Samenhang (coherentie) wordt sterker beoordeeld dan accuraatheid (4)
Daarom heeft Stackoverflow (discussie-forum voor software developers) GPT-3 gegenereerde antwoorden al verboden op hun website (1)
“Overall, because the average rate of getting correct answers from ChatGPT is too low, the posting of answers created by ChatGPT is substantially harmful to the site and to users who are asking or looking for correct answers.”
(StackOverflow)
Aftellen tot een spamexplosie
Het grootste voordeel van deze content is dat het (bijna) niks kost. Iedereen met een computer en internet kan binnen enkele seconden een artikel produceren over zo’n beetje elk onderwerp (6). Als je dat automatiseert, kun je een eindeloze stroom content (tweets, artikelen, checklists, enzovoort) publiceren over ieder onderwerp naar keuze.
De marginale kosten van contentcreatie dalen daarmee naar vrijwel nul. Met e-mail hebben we gezien wat er gebeurt als kosten dalen naar bijna nul. Spamberichten bestonden immers ook in je fysieke brievenbus, maar explodeerden pas bij de de opkomst van e-mail.
AI tools hebben data maar geen kennis
In een situatie waarbij enig inzicht en creativiteit wordt verwacht, zou niemand ooit de content van AI content creatie accepteren. De output is vaak een saai lijstje met niet écht onderscheidende bulletpoints, of een amorfe verzameling halve waarheden of losse kreten (4). Coherentie is voor AI belangrijker dan accuraatheid.
Het gevaar daarvan is dat de antwoorden er geloofwaardig uitzien, maar dat vaak niet zijn. Het zijn unieke stukken door de enorme rekenkracht in de modellen. Maar het is nooit origineel, heeft geen enkele redenering of opbouw en de inhoud zakt in elkaar op het moment dat je die serieus bevraagt, bijvoorbeeld door op een link te klikken of een jaartal te controleren.
Allerlei hele simpele kennis (common knowledge) ontbreekt bij AI-tooling. Daardoor gaan AI soms enorm de mist in omdat het bijvoorbeeld het verschil tussen een vogel en een zoogdier niet blijkt te kunnen maken (2). Of omdat het niet ‘weet’ dat we geen ‘zwarte piet’ meer zeggen. Of: zouden moeten zeggen.
“If you present AI generated text without understanding it, in any real-world scenario that will rapidly become obvious.”
Er zijn helaas veel content producenten die niet de benodigde kennis, tijd en energie kunnen of willen investeren in goede content. Dus zullen we overspoeld raken met content die vrijwel ‘gratis’ is gegenereerd en daarna via e-mail en sociale media massaal verspreid zal worden. Om die verspreiding nog verder te versnellen of te optimaliseren zullen AI social media profielen deze content nog verder verspreiden door gebruik te maken van likes, comments en re-shares.
Artificial Intelligence content inception
Combineren we deze twee effecten dan belanden we in de AI content inceptie. AI geproduceerde content overspoelt e-mail en social media. AI profielen boosten deze content zodat die nog beter scoort, wat daarna weer nog meer AI geproduceerde content aantrekt. De marginale kosten van deze vicieuze cirkel zijn vrijwel nul, waardoor de kans dat het gaat gebeuren bijna 100% is.
Via Artificial Intelligence gegenereerde content is als fastfood
AI gegenereerde content kan je dus zien als de fastfood van content marketing. Het ziet er lekker uit, ruikt goed en smaakt goed, maar je blijft achter met een gezondheidsprobleem, een leeg gevoel en geen echt plezier of genot. Hoe verleidelijk op de korte termijn, zul je hier op de lange termijn aan kapot gaan.
Links & Bronnen
- https://meta.stackoverflow.com/questions/421831/temporary-policy-chatgpt-is-banned
- https://sikm.groups.io/g/main/message/10594 (ChatGPT weet het verschil tussen een zoogdier en een vogel niet)
- https://sikm.groups.io/g/main/message/10561 (Fouten en persoonsverwisselingen)
- https://sikm.groups.io/g/main/message/10589 (Jaartallen en percentages Franse economie)
- https://algorithmwatch.org/en/google-translate-gender-bias/ (Male nurse does not exist)
- (Marketing content generator)
- https://futurism.com/the-byte/facebook-takes-down-galactica-ai (Facebook science AI)
- https://www.nrc.nl/nieuws/2022/12/04/als-de-computer-beter-wordt-met-taal-dan-wij-a4150269#/krant/2022/12/05/#208 (nurse (EN) vertaald naar infirmière (FR) terwijl het ook een mannelijke verpleger kan zijn)
Bart is co-founder and CEO of GuruScan. He lectures on knowledge management and organizational network analysis at multiple universities (Netherlands, Italy and US). He is also an experienced international speaker on Knowledge, HR, networks and innovation for conferences like Henley Forum and companies like Philips and Telefonica. Bart works from Amsterdam (the Netherlands) where he lives with his wife and two kids. To relax he likes to do long endurance bike rides and races.
Author: Jacob Nguyen
Last Updated: 1702460762
Views: 889
Rating: 3.9 / 5 (106 voted)
Reviews: 84% of readers found this page helpful
Name: Jacob Nguyen
Birthday: 1920-11-18
Address: 456 Elizabeth Greens Apt. 638, Jameston, CT 92863
Phone: +4562617372857317
Job: Actor
Hobby: Whiskey Distilling, Telescope Building, Fishing, Card Games, Beekeeping, Gardening, Juggling
Introduction: My name is Jacob Nguyen, I am a irreplaceable, rich, artistic, Colorful, fearless, dedicated, capable person who loves writing and wants to share my knowledge and understanding with you.