Hoe ZuidWest Tekst TV berichten laat herschrijven door AI

feed Nieuws
edit_note 07 augustus 2024

Generatieve AI biedt de mogelijkheid om bepaalde taken op de redactie (deels) te automatiseren. Je kunt bijvoorbeeld interviews automatisch uitschrijven of video’s met één druk op de knop ondertitelen. Een andere interessante toepassing is het herschrijven van artikelen voor specifieke toepassingen. Zo genereert Streekomroep ZuidWest automatisch berichten voor Tekst TV op basis van de nieuwsartikelen die worden geschreven voor de website.

Het inkorten van berichten voor Tekst TV, zodat ze op één scherm passen, was altijd een vervelend klusje voor de redactie van ZuidWest, de streekomroep van West-Brabant. Het kost tijd en energie die redacteurs liever besteden aan andere dingen, maar het moet nou eenmaal gebeuren. Het is tevens een taak waar een AI-taalmodel prima toe in staat zou moeten zijn. Voor de omroep reden om hiermee te experimenteren.

Het klinkt redelijk simpel: je voert artikelen aan GPT, het taalmodel van OpenAI, met de opdracht om het te herschrijven tot een artikel met een maximaal aantal woorden. Om dit voor elkaar te krijgen bouwde Raymon Mens, de Manager Techniek van ZuidWest, via een zogeheten API een koppeling tussen GPT en het CMS WordPress, dat de omroep gebruikt voor zijn website en app.

Zo’n integratie is belangrijk volgens Raymon. “We zagen dat sommige mensen op de redactie wel eens ChatGPT gebruiken, maar het was lastig omdat je naar de site van ChatGPT moet gaan, een eigen account nodig hebt, er vragen waren over privacy etc. Dus toen dachten we: zo’n technische koppeling zorgt voor een goede bescherming qua data en privacy en maakt het een stuk makkelijker voor de redactie.”

Met behulp van ChatGPT

Het bouwen van de integratie kostte Raymon een dag of drie. “Ik heb een deel van de code door ChatGPT laten schrijven. Die weet heel veel over de werking van zijn eigen API en heeft ook kennis van hoe WordPress-plugins werken.”

Het resultaat is dat een nieuwsbericht, nadat het is geschreven, vanuit WordPress met één druk op de knop naar GPT wordt gestuurd en er een korte versie terugkomt. Deze wordt vervolgens gecontroleerd door de redacteur, voordat het Tekst TV-bericht wordt gepubliceerd. Een belangrijke stap, want AI kan fouten maken en die wil je uiteraard niet publiceren.

In de eerste testfase moesten 4 van de 10 berichten nog worden herschreven. Bijvoorbeeld omdat ze uiteindelijk alsnog te lang waren voor Tekst TV of de kern van het nieuws ontbrak. Daarnaast duurde het genereren van de korte artikelen relatief lang. Soms moest een redacteur wel een halve minuut wachten.

Bekijk de video en krijg een indruk van hoe het werkt. De tekst gaat onder de video verder.

Daarop besloot Raymon een aantal aanpassingen te doen. In plaats van het nieuwste taalmodel, GPT 4.0, werd een ouder, sneller model gebruikt: GPT 3.5. Daarnaast werd de opdracht die aan GPT werd gegeven uitgebreid om tot een beter resultaat te komen. Het zorgde ervoor dat het systeem een stuk sneller werkte: in 3 seconden was het Tekst TV-bericht klaar, maar door het gebruik van een ouder taalmodel ging de kwaliteit van de berichten omlaag.

De oplossing? GPT 3.5 extra trainen met heel veel voorbeelden. Raymon verzamelde een heleboel artikelen en bijbehorende Tekst TV-berichten uit de tijd dat deze nog met de hand werden geschreven. Voor 35 dollar werd daarmee het taalmodel gefinetuned, zoals dat heet, voor deze specifieke toepassing. “Je vertelt GPT eigenlijk gewoon: als ik je dit geef, verwacht ik dit terug”, legt Raymon uit. “Dat klinkt ingewikkeld, maar je logt in op een speciale website voor ontwikkelaars, waar je die data kunt uploaden en de rest gaat vanzelf.” Het resultaat? Nog maar 2 op de 10 berichten hoeft handmatig te worden aangepast.

Om te zorgen dat het systeem steeds beter wordt, worden gegenereerde berichten die door de redactie achteraf nog worden aangepast opnieuw aan GPT gevoerd als trainingsdata. Daar leert het taalmodel weer van. Dit gefinetunede model is enkel voor de maker ervan beschikbaar en de ingevoerde data wordt verder ook niet door OpenAI gebruikt voor andere toepassingen.

Daarnaast dook er nog één groot probleem op: bij hele korte artikelen, voornamelijk 112-nieuws, verzon het systeem feiten om te zorgen dat het bericht langer werd. De oplossing bleek simpel: als een artikel korter is dan de maximale lengte van een Tekst TV-bericht, wordt hij niet langer herschreven door AI.

Na het vele testen en aanpassen werkt het systeem nu erg goed. En omdat handmatige aanpassingen weer worden gevoerd aan GPT als trainingsdata, wordt het systeem nog beter. Er blijft altijd een redacteur meekijken, want je wil niet ongecheckt dingen die door AI zijn geschreven online plaatsen, maar ingrijpen is nog maar zelden nodig.

Kunstmatige intelligentie ook voor andere werkzaamheden

Dat betekent dat ZuidWest nu wil kijken of kunstmatige intelligentie ook bij andere werkzaamheden kan worden ingezet. “We hebben op de radio op het halve uur een bulletin met regionieuws. Er is nu iemand op de redactie die daarvoor de nieuwsartikelen omzet naar spreektaal en ik wil proberen dat te automatiseren”, vertelt Raymon.

“Daarbij wil ik meteen gebruik maken van het archief aan radioberichten dat we hebben als trainingsdata en ook het verder trainen van GPT met de aanpassingen die de redactie doet op de gegenereerde berichten zoveel mogelijk automatiseren. Het opzetten van zo’n trainingssessie is nu nog een uur of twee handwerk en gebeurt eens per maand. Door het te automatiseren zijn verbeteringen straks sneller merkbaar. Stip op de horizon is 99,9 procent betrouwbaarheid. Ik verwacht dat we dat trainen na drie maanden automatisch trainen kunnen bereiken.”

Meer over te weten komen over AI? Bekijk dan deze pagina en ontdek onder andere de trainingsdag voor omroepmedewerkers. 

Vergelijkbaar

Wellicht interessant