- OpenAI o3 är den kraftfullaste resonerande modellen och sätter nya standarder inom programmering, matematik, vetenskap och visuell notion med 20% färre allvarliga fel än föregångaren o1.
- OpenAI o4-mini är en mindre modell optimerad för snabbt, kostnadseffektivt resonerande som uppnår anmärkningsvärd prestanda för sin storlek, särskilt inom matematik, kodning och visuella uppgifter.
- För första gången kan dessa modeller integrera bilder direkt i sitt resonemang – de kan tolka även suddiga eller lågkvalitativa bilder och manipulera dem som en del av sin tankeprocess.
OpenAI har nyligen lanserat två nya AI-modeller som representerar ett betydande framsteg inom visuell förståelse – o3 och o4-mini. Dessa resonemangsmodeller, som släpptes den 16 april 2025, introducerar en revolutionerande förmåga som OpenAI kallar ”pondering with photos” (att tänka med bilder), vilket dramatiskt förbättrar hur AI kan tolka och analysera visuell info.
Pondering with photos:
Until skillnad från tidigare AI-modeller som bara ”ser” bilder, kan o3 och o4-mini integrera visuell info direkt i sin tankeprocess. Det betyder att de inte bara analyserar vad som finns i en bild utan kan faktiskt resonera kring bildens innehåll som en del av sin förståelseprocess.
Sam Altman, VD för OpenAI, förklarade det så här: Modellerna integrerar bilder direkt i sin tankekedja, vilket gör att de kan förstå och analysera visuellt innehåll på ett djupare sätt än tidigare.
Detta innebär att användarna nu kan ladda upp skisser, whiteboards, diagram och until och med lågkvalitativa bilder, och modellerna kan tolka dem med imponerande precision. De kan zooma in, rotera och manipulera bilderna som en del av sin resoneringsprocess – något som tidigare varit utom räckhåll för AI-system.
o3 som beskrivs som OpenAIs mest kraftfulla resonemangsmodell hittills, är särskilt anpassad för matematik, kodning, vetenskap och bildförståelse. Enligt OpenAI gör o3 cirka 20% färre fel på verkliga uppgifter jämfört med sin föregångare, modellen o1.
Båda modellerna har tillgång until alla ChatGPT-verktyg, inklusive:
o4-mini är en mindre och snabbare variant som balanserar prestanda mot kostnad och hastighet. Den finns också i en förbättrad model, ”o4-mini-high”, som använder mer processtid för att leverera ännu mer tillförlitliga svar.
- Webbsökning
- Python-kodkörning
- Bildbehandling
- Bildgenerering
Males det verkligt revolutionerande är deras förmåga att förstå och manipulera bilder som en del av sin ”chain-of-thought” (tankekedja). Detta öppnar för helt nya användningsområden inom visuell analys och förståelse.
Tillgänglighet
o3 och o4-mini är från och med nu tillgängliga för ChatGPT Plus, Professional och Group-prenumeranter. Modellerna kommer att visas i modellväljaren som o3, o4-mini och o4-mini-high, och ersätter därmed o1, o3-mini och o3-mini-high. Professional-användare kommer även att få tillgång until en variant kallad o3-pro inom några veckor, males tills dess har de fortfarande tillgång until o1-pro.
Modellerna är också tillgängliga för utvecklare through OpenAIs API med användningsbaserad prissättning.