OpenAI släpper o3 och o4-mini: AI-modeller som kan tänka med bilder

OpenAI o3 är den kraftfullaste resonerande modellen och sätter nya standarder inom programmering, matematik, vetenskap och visuell notion med 20% färre allvarliga fel än föregångaren o1.
OpenAI o4-mini är en mindre modell optimerad för snabbt, kostnadseffektivt resonerande som uppnår anmärkningsvärd prestanda för sin storlek, särskilt inom matematik, kodning och visuella uppgifter.
För första gången kan dessa modeller integrera bilder direkt i sitt resonemang – de kan tolka även suddiga eller lågkvalitativa bilder och manipulera dem som en del av sin tankeprocess.

OpenAI har nyligen lanserat två nya AI-modeller som representerar ett betydande framsteg inom visuell förståelse – o3 och o4-mini. Dessa resonemangsmodeller, som släpptes den 16 april 2025, introducerar en revolutionerande förmåga som OpenAI kallar ”pondering with photos” (att tänka med bilder), vilket dramatiskt förbättrar hur AI kan tolka och analysera visuell info.

Pondering with photos:

Until skillnad från tidigare AI-modeller som bara ”ser” bilder, kan o3 och o4-mini integrera visuell info direkt i sin tankeprocess. Det betyder att de inte bara analyserar vad som finns i en bild utan kan faktiskt resonera kring bildens innehåll som en del av sin förståelseprocess.

Sam Altman, VD för OpenAI, förklarade det så här: Modellerna integrerar bilder direkt i sin tankekedja, vilket gör att de kan förstå och analysera visuellt innehåll på ett djupare sätt än tidigare.

Detta innebär att användarna nu kan ladda upp skisser, whiteboards, diagram och until och med lågkvalitativa bilder, och modellerna kan tolka dem med imponerande precision. De kan zooma in, rotera och manipulera bilderna som en del av sin resoneringsprocess – något som tidigare varit utom räckhåll för AI-system.

o3 som beskrivs som OpenAIs mest kraftfulla resonemangsmodell hittills, är särskilt anpassad för matematik, kodning, vetenskap och bildförståelse. Enligt OpenAI gör o3 cirka 20% färre fel på verkliga uppgifter jämfört med sin föregångare, modellen o1.

Båda modellerna har tillgång until alla ChatGPT-verktyg, inklusive:

o4-mini är en mindre och snabbare variant som balanserar prestanda mot kostnad och hastighet. Den finns också i en förbättrad model, ”o4-mini-high”, som använder mer processtid för att leverera ännu mer tillförlitliga svar.

Webbsökning
Python-kodkörning
Bildbehandling
Bildgenerering

Males det verkligt revolutionerande är deras förmåga att förstå och manipulera bilder som en del av sin ”chain-of-thought” (tankekedja). Detta öppnar för helt nya användningsområden inom visuell analys och förståelse.

Tillgänglighet

o3 och o4-mini är från och med nu tillgängliga för ChatGPT Plus, Professional och Group-prenumeranter. Modellerna kommer att visas i modellväljaren som o3, o4-mini och o4-mini-high, och ersätter därmed o1, o3-mini och o3-mini-high. Professional-användare kommer även att få tillgång until en variant kallad o3-pro inom några veckor, males tills dess har de fortfarande tillgång until o1-pro.

Modellerna är också tillgängliga för utvecklare through OpenAIs API med användningsbaserad prissättning.

Mer information:

Source link

TeeDIY: Features, Benefits, Alternatives and Pricing

What Most B2B Contact Data Comparisons Get Wrong

SocialPost AI: Features, Benefits, and Alternatives

This tool strips away anti-AI protections from digital art

Power-hungry AI will devour Japan-sized energy supply by 2030

From Connections to Meaning: Why Heterogeneous Graph Transformers (HGT) Change Demand Forecasting

How to Create an AI-Powered Search Strategy with Wil Reynolds [MAICON 2025 Speaker Series]

Svenska vibe-kodning företaget Lovable närmar sig värdering på 20 miljarder kr

Most Popular

How AI is Revolutionizing Doctor-Patient Conversations for Better Healthcare Outcomes

PyTorch Tutorial for Beginners: Build a Multiple Regression Model from Scratch

Mechanistic Interpretability: Peeking Inside an LLM

Our Picks

Why Care About Prompt Caching in LLMs?

How Vision Language Models Are Trained from “Scratch”

Why physical AI is becoming manufacturing’s next advantage

OpenAI släpper o3 och o4-mini: AI-modeller som kan tänka med bilder

Pondering with photos:

Tillgänglighet

Mer information:

Related Posts