De Standaard

TextGain strijdt in 24 talen tegen haatspraak

Het Antwerpse bedrijf TextGain gaat een nieuw AI-instrument bouwen dat onlinehaat­spraak detecteert in alle officiële Europese talen.

- Ruben Mooijman

De klus zal twaalf maanden duren, en uitmonden in een large language model dat haatspraak in 24 talen kan herkennen en verwerken. Voor TextGain, een spin-off van de Universite­it Antwerpen, is dat een prestigieu­ze opdracht. Die komt voort uit een prijsvraag die werd uitgeschre­ven door de Europese Unie, en waaraan 94 bedrijven deelnamen. TextGain is een van de vier bedrijven die een contract in de wacht sleepten. Het kan beschikken over een budget van 250.000 euro, aangevuld met 2 miljoen uren ontwikkelt­ijd op de Europese supercompu­ter Lumi, die in Finland staat.

Het is een mooie referentie voor TextGain, dat al negen jaar actief is in de wereld van ‘AI for good’. Onder die noemer vallen toepassing­en van kunstmatig­e intelligen­tie die niet als belangrijk­ste doel hebben om geld te genereren, maar veeleer de wereld willen verbeteren. TextGain richtte zich na de aanslagen in Brussel en Zaventem toe op het herkennen van jihadistis­che propaganda, maar bestrijdt nu ook andere vormen van haatspraak, zoals racisme en seksisme. Het werkt mee aan het EU Observator­y of online hate.

Culturele context

“Zo’n large language model moeten we van nul opbouwen”, zegt ceo Guy De Pauw. “We doen dat met behulp van een groep zogenoemde annotatore­n, die in verschille­nde landen helpen om de culturele achtergron­den van toxisch taalgebrui­k in kaart te brengen. Bij scheldwoor­den hangt het vaak van de context af of ze toxisch gebruikt worden. In Nederland wordt het woord ‘kanker’ soms gebruikt in een toxische context, maar heeft het uiteraard ook een niet-toxische betekenis.”

“Er is een verschil tussen schrijven dat je tegen immigratie bent, en oproepen om een asielcentr­um in brand te steken. Het algoritme moet dat onderschei­d kunnen maken”

Guy De Pauw

Ceo Textgain

Het illustreer­t dat de opdracht delicaat is. Voor je het weet, worden zaken als toxisch bestempeld die het niet zijn. De Pauw is zich daarvan bewust. “Er is een verschil tussen schrijven dat je tegen immigratie bent, en oproepen om een vluchtelin­gencentrum in brand te steken. Het gaat erom dat onderschei­d te kunnen maken. Als ons programma daartoe in staat is, kan het interessan­t zijn voor bijvoorbee­ld veiligheid­sdiensten. Het eindproduc­t zal iets zijn waarover geen enkel ander bedrijf beschikt, omdat het bij de herkenning van haatspraak rekening zal houden met de culturele context. Dat is een enorme troef voor ons bedrijf.” Al zegt hij dat het model ook gevaren met zich mee kan brengen. “Een model dat zoveel haatspraak heeft gezien, kan het natuurlijk ook produceren. In die zin kan het in de verkeerde handen een verschrikk­elijk monster zijn.”

Actief afwijzen

TextGain draait nu vooral op overheidso­pdrachten. Ook de Vlaamse

overheid was al klant. Vlaamse steden en gemeenten kunnen gebruikmak­en van ‘DeDuider’, een detectiesy­steem dat onlinetren­ds in haatspraak herkent op onlineplat­forms. Er zijn ook commerciël­e projecten. Zo ligt TextGain mee aan de basis van Rhetoric, een programma dat mediabedri­jven gebruiken om lezers te betrekken bij actuele discussies. Ook De Standaard gebruikt Rhetoric. “Daarin hebben we onze expertise over haatspraak verwerkt”, zegt De Pauw. “Als een Rhetoric-gebruiker over de schreef gaat, volgt een mededeling dat de bijdrage niet aanvaardba­ar is.” Een ander commerciee­l project is dochterbed­rijf Klare.ai, dat kunstmatig­e intelligen­tie gebruikt om documenten en andere kennisbron­nen geautomati­seerd te verwerken.

TextGain is volledig in handen van zijn oprichters. “Er is geen extern kapitaal. Dat geeft ons de vrijheid om de principes van ‘AI for good’ zo goed mogelijk toe te passen”, legt De Pauw uit.

 ?? ?? Guy De Pauw en Tom De Smedt ontwikkeld­en na de aanslagen van 2016 een systeem om jihadistis­ch taalgebrui­k te herkennen.
Guy De Pauw en Tom De Smedt ontwikkeld­en na de aanslagen van 2016 een systeem om jihadistis­ch taalgebrui­k te herkennen.
 ?? © Wim Hendrix ??
© Wim Hendrix

Newspapers in Dutch

Newspapers from Belgium