Hoe is deze GPT 5: hier zijn de eerste meningen van internationale experts

Technologie

Het nieuwe GPT 5-model vertegenwoordigt de volwassenheidshorizon voor kunstmatige intelligentie. Een kwalitatieve, in plaats van kwantitatieve, evolutie die de tot nu toe geboekte vooruitgang consolideert en deze bruikbaarder maakt. Effectiever, over de hele linie. GPT 5 verschuift dus verder de focus van generatieve AI. Dit lijkt de eerste consensus te zijn in de internationale vakpers over de komst van GPT 5, dat – vergeet niet – al beschikbaar is in Italië, inclusief gratis op ChatGPT.

Wie weet of het echt – zoals OpenAI-hoofd Sam Altman beweert – een stap voorwaarts is richting algemene kunstmatige intelligentie. Waarschijnlijker is dat experts het zien als een overgang naar "operationele intelligentie". De vakpers is onder de indruk van de vele praktische en meetbare verbeteringen. GPT 5 demonstreert robuustere redeneringen in taakketens, de mogelijkheid om bewerkingen uit te voeren die voorheen meer menselijke orkestratie vereisten, en state-of-the-art codeerprestaties, zoals opgemerkt door de Amerikaanse publicatie Tom's Guide.

Interface

Velen zijn onder de indruk van de overzichtelijke interface van Chatgpt, die niet langer om het model vraagt en automatisch kiest of er moet worden geredeneerd. Deze vooruitgang toont een toename in autonome besluitvormingsmogelijkheden, evenals in energie- en rekenefficiëntie, aldus de MIT Technology Review. Deze efficiëntie blijkt ook uit de beslissing om Gpt 5 gratis te maken voor iedereen in Chatgpt. Gebruikers kunnen natuurlijk nog steeds de "denk langer"-functie en andere tools met één klik forceren; en als Chatgpt begint te redeneren, kunnen ze in plaats daarvan een onmiddellijke reactie forceren.

De eerste beoordelingen van de kwaliteit van de redenering die wordt toegepast op praktijkproblemen zijn positief. Volgens testers en technische commentatoren (Tom's Hardware, Techtarget) laat GPT 5 een verbeterde consistentie zien bij het aanpakken van meerstapsproblemen en een grotere neiging om reeksen bewerkingen uit te voeren zonder de draad kwijt te raken. Deze vooruitgang heeft invloed op de manier waarop het wordt gebruikt. Het model reageert nu niet langer simpelweg, maar stuurt workflows aan die zoekopdrachten, datamanipulatie en de uiteindelijke output integreren. De rapporten van vroege testers op referentiewebsites lijken te bevestigen dat de vooruitgang niet willekeurig en geïmproviseerd is; het is in feite het resultaat van OpenAI-aanpassingen die specifiek gericht zijn op deze praktische scenario's. Houd er rekening mee dat de ontwikkeling van OpenAI van model 4 naar model 5 twee jaar heeft geduurd.

Over praktische vooruitgang gesproken: het bedrijf zegt ook dat hallucinaties met 26 procent zijn afgenomen en dat de kans dat een antwoord een significante feitelijke fout bevat, nu 44 procent lager is. Voorlopig is het bedrijf de enige die hierover spreekt, maar experts zeggen al dat zelfs als dit het geval zou zijn, het nog steeds niet optimaal zou zijn: het betekent dat één op de tien antwoorden nog steeds hallucinaties zou kunnen bevatten, merkt Mashable op, en dit is uiterst ernstig gezien een steeds vaker voorkomend gebruik: het vragen van medische adviezen aan Chatgpt.

OpenAI testte GPT-5 op zijn interne benchmark, Simple QA. Deze test bestaat uit een verzameling "feitenonderzoeksvragen met korte antwoorden die de nauwkeurigheid van het model voor de beantwoordingspogingen meten", aldus de systeembeschrijving. Voor deze evaluatie had GPT-5 geen internettoegang, waardoor het aantal hallucinaties zeer hoog was: 47 procent (40 procent met redenering), tegenover 52 procent voor GPT-5.

Beth Barnes, oprichter van de non-profitorganisatie Metr die onderzoek doet naar kunstmatige intelligentie, ontdekte al snel een onjuistheid in een antwoord van GPT-5 waarin werd uitgelegd hoe de vliegtuigen werken.

Velen noemen de vooruitgang in programmeren als een van de belangrijkste prestaties van GPT 5, waarmee de kloof met Anthropic's Claude Sonnet (nu de meest gebruikte AI-tool voor programmeren) wordt gedicht. Gegevens die door OpenAI zijn gedeeld en die worden herhaald in technische publicaties, tonen aan dat het model hogere scores behaalt in softwaregerichte benchmarks (SWE-Bench en vergelijkbare benchmarks); het gebruikt minder tokens en minder aanroepen van externe tools om hetzelfde probleem op te lossen. De kloof hier is tweeledig: het model is niet alleen nauwkeuriger in het produceren van bruikbare code, maar doet dat ook efficiënter. Dit verlaagt de gebruikskosten op grote schaal en vergroot de aantrekkelijkheid ervan voor commerciële producten die een deel van de ontwikkelingscyclus willen automatiseren. Uitgebreide tests zullen zeker nodig zijn om de werkelijke kwaliteit ervan ten opzichte van concurrenten te begrijpen, zowel in de praktijk als wat betreft integratie met systemen van derden.

Minder centraal in het debat, maar daarom niet minder belangrijk, zijn twee andere kwesties: het contextuele venster en multimodaliteit. Technische analyses melden dat GPT 5 is ontworpen om veel grotere contexten te verwerken – de aantallen variëren afhankelijk van de bron en configuratie, maar de richting is duidelijk: werken met lange documenten, multipart-projecten of gesprekken met een uitgebreid geheugen wordt haalbaar zonder constant informatie te hoeven herhalen. Deze mogelijkheid is door veel experts (Tom's Hardware, PanelsAI) geïnterpreteerd als een facilitator voor professionele toepassingen: contractbeoordelingen, continue rapportage en financiële analyses die consistentie over honderden pagina's vereisen, kunnen nu worden beheerd met minder menselijke tussenkomst. Tegelijkertijd benadrukken technische bronnen dat de term "multimodaal" pragmatisch moet worden opgevat: betere integratie van tekst, afbeeldingen en gestructureerde data is al aanwezig; audio en video zijn potentieel werk in uitvoering, maar praktische robuustheid hangt af van use cases en integratiepijplijnen.

Een ander terugkerend thema op de gespecialiseerde pagina's betreft agentische mogelijkheden en de tools die daarvoor zijn ontworpen. De vakpers (Techcrunch, Digital Watch Observatory) heeft uitgebreid aandacht besteed aan de nieuwe infrastructuurfuncties die bij het model horen: Responses API, Agents SDK en routeringssystemen waarmee het model kan beslissen of een "denkmodus" of een snelle respons moet worden gebruikt, zijn allemaal elementen die GPT 5 transformeren tot een platform voor aangepaste agents in plaats van een eenvoudig eindpunt voor tekstuele aanvullingen. Experts leggen uit dat ontwikkelaars en bedrijven dankzij deze API's en SDK's stacks – webzoekopdrachten, interne databaseaanroepen, artefactgeneratie (dia's, spreadsheets, code) – kunnen orkestreren met beveiligingsmaatregelen en back-ups. Dit verkleint de kloof tussen prototype en productieproduct.

Naast de positieve toon hanteert de vakpers echter een kritische en gematigde toon: gezaghebbende blogs en analisten pleiten voor onafhankelijke verificatie en reproduceerbare benchmarks alvorens de release als een definitieve "doorbraak" te beschouwen. Platformer, Hacker News en andere commentatoren in de branche wijzen erop dat de statistieken die in briefings of persberichten worden gepresenteerd, beïnvloed kunnen worden door vooraf geselecteerde testsets en afstemmingscondities die niet automatisch in alle productieomgevingen worden gerepliceerd. De open community en technische forums – waar geïmproviseerde tests en grassroots-vergelijkingen ontstaan – merken ook op dat de perceptie van bruikbaarheid radicaal kan verschillen, afhankelijk van het domein: wat goed werkt voor het schrijven van code, is niet automatisch overdraagbaar naar klinische evaluatietaken of gereguleerde processen. Deze vraag naar onafhankelijke metingen is een terugkerend refrein in de vakpers.

Kosten en toegang vormen een ander cruciaal punt. Verschillende artikelen (zoals Platformer en The Verge) benadrukken hoe OpenAI heeft gekozen voor een meerlagige strategie: "mini"- en "nano"-modellen voor low-cost en low-latency-toepassingen, een "standaard"-versie voor zware taken en directe integratie in Chatgpt. Branchepublicaties hebben opgemerkt dat deze stap de gebruikersbasis zal verbreden. Tegelijkertijd wijzen experts erop dat de echte economische parameter om te monitoren de prijs per token in productiepijplijnen blijft: de efficiëntie van Gpt 5 bij het genereren van responsen met minder tokens en minder tool calls zou zich kunnen vertalen in een concurrentievoordeel, maar de kostenberekening is strikt afhankelijk van het type workload en de gebruikspatronen. Daarom is voorzichtigheid geboden.

Maar vooral op het gebied van beveiliging en governance is de vakpers voorzichtig: het uitgebreide vermogen van het model om complexe artefacten te genereren en acties op externe bronnen te orkestreren, vereist nieuwe audittools, toegangslimieten en operationeel beleid. Technische experts benadrukken dat de uitdaging niet alleen ligt in het verminderen van hallucinaties, maar ook in het beheren van afhankelijkheden tussen het model en bedrijfssystemen: hoe een respons wordt geverifieerd, wie verantwoordelijk is voor de output en hoe de keten van beslissingen wordt getraceerd in de aanwezigheid van autonome agents. Technische discussies benadrukken praktische kwesties: logging, testen in geïsoleerde omgevingen, verplichte menselijke goedkeuring voor gevoelige output en duidelijke criteria voor het blokkeren van risicovolle functies.

Dit klinkt ons Europeanen allemaal heel bekend in de oren, aangezien op 2 augustus de verplichtingen uit de AI Act voor aanbieders van algemene modellen (zoals Gpt 5) van kracht zijn geworden, met ook gevolgen voor de bedrijven die deze modellen gebruiken.

Nieuws en inzichten over politieke, economische en financiële gebeurtenissen.

Aanmelden