OpenAI lanceert Codex

OpenAI heeft de release aangekondigd van Codex, een cloudgebaseerde software engineering agent die is ontworpen om ontwikkelaars te ondersteunen bij het uitvoeren van parallelle codeertaken, zoals het schrijven van functies, het oplossen van bugs, het beantwoorden van vragen over codebases en het indienen van pull-requests. De tool is nu beschikbaar als research preview voor ChatGPT Pro-, Enterprise- en Team-gebruikers, en ondersteuning voor Plus en Edu wordt binnenkort verwacht.

Codex wordt aangestuurd door Codex-1, een versie van OpenAI's o3-model, speciaal geoptimaliseerd voor softwareontwikkeling. Volgens OpenAI is Codex-1 getraind met behulp van reinforcement learning op basis van realistische programmeerscenario's om menselijke programmeerstijlen nauwgezet te benaderen, instructies nauwkeurig op te volgen en de output te testen totdat deze slaagt.

Hoe Codex werkt

Gebruikers hebben toegang tot Codex via de ChatGPT-zijbalk door prompts of codevragen in te voeren en taken toe te wijzen. Elke taak wordt uitgevoerd in een beveiligde, geïsoleerde cloud-sandboxomgeving die vooraf is geladen met de repository van de gebruiker. Codex kan code lezen, bewerken en testen met tools zoals testharnesses, linters en typecheckers. De uitvoeringstijd van een taak varieert van 1 tot 30 minuten en gebruikers kunnen de voortgang in realtime volgen.

Zodra een taak is voltooid, commit Codex de wijzigingen binnen de omgeving en levert verifieerbare output via terminallogs en testresultaten. Deze output kan worden beoordeeld, herzien of geïntegreerd in GitHub pull requests of lokale codebases. Ontwikkelaars kunnen Codex configureren om hun daadwerkelijke ontwikkelomgevingen nauwgezet te spiegelen.

Codex-functies en ontwikkelaarscontroles

Ontwikkelaars kunnen het gedrag van Codex sturen met behulp van AGENTS.md bestanden – vergelijkbaar met README.md – om projectspecifieke instructies, opdrachtvoorkeuren en testprocedures te definiëren. Hoewel Codex het beste presteert met aangepaste omgevingen en documentatie, tonen interne tests aan dat de prestaties zelfs zonder aangepaste scaffolding sterk blijven.

Codex-taken werken onafhankelijk en veilig, zonder internettoegang tijdens de uitvoering. Deze isolatie garandeert de veiligheid en beheersing van elke taak.

Om veiligheidsredenen is Codex volgens OpenAI getraind om onderscheid te maken tussen legitieme en kwaadaardige taken en is het uitgerust om verzoeken die verband houden met malwareontwikkeling expliciet te weigeren. Gebruikers kunnen agentuitvoer verifiëren via logs, citaties en testresultaten, en Codex waarschuwt gebruikers wanneer er testfouten of onzekerheden optreden. OpenAI benadrukt echter de noodzaak van handmatige controle voordat door de agent gegenereerde code wordt geïmplementeerd.

Codex CLI en lichtere modelvariant

Naast de lancering van de kerncodex werkt OpenAI ook aan de Codex CLI, een lokale terminalagenttool. Een kleinere, snellere versie van codex-1, genaamd codex-mini-latest, is nu beschikbaar. Deze versie is geoptimaliseerd voor Q&A en codebewerking met lage latentie en is toegankelijk via de Responses API. De prijs bedraagt $ 1,50 per 1 miljoen invoertokens en $ 6 per 1 miljoen uitvoertokens, met 75% korting voor promptcaching.

Codex CLI-gebruikers kunnen nu hun ontwikkelaarsaccounts koppelen via ChatGPT-aanmelding, wat de API-configuratie vereenvoudigt. Vanaf vandaag kunnen Plus- en Pro-gebruikers respectievelijk $ 5 en $ 50 aan gratis API-tegoed inwisselen voor de komende 30 dagen.

Vroege gebruiksgevallen en beperkingen

Intern gebruiken OpenAI-teams Codex al voor achtergrondtaken zoals refactoring, documentatie, debuggen en het schrijven van tests, waardoor contextwisselingen worden verminderd en de teamfocus wordt verbeterd. Hoewel Codex nuttig is gebleken voor diverse taken in de praktijk, erkent OpenAI de beperkingen ervan. De agent biedt momenteel geen ondersteuning voor beeldinvoer, realtime correctie tijdens de uitvoering en kan langer duren om taken te voltooien in vergelijking met interactieve bewerking.

Naarmate OpenAI Codex verder ontwikkelt, verwacht het bedrijf een verschuiving naar asynchrone samenwerking tussen menselijke ontwikkelaars en autonome agenten die langere en complexere software engineering-verantwoordelijkheden kunnen beheren.

Codex wordt uitgebracht in overeenstemming met de iteratieve implementatiestrategie van OpenAI en zal voor een beperkte tijd gratis zijn voor daarvoor in aanmerking komende gebruikers. Daarna wordt de toegang beperkt en zijn er flexibele prijsopties.

Afbeelding: OpenAI

Small BusinessTrends