Close Menu
    Trending
    • OpenAI’s latest product lets you vibe code science
    • Going Beyond the Context Window: Recursive Language Models in Action
    • Data Science as Engineering: Foundations, Education, and Professional Identity
    • From Connections to Meaning: Why Heterogeneous Graph Transformers (HGT) Change Demand Forecasting
    • Layered Architecture for Building Readable, Robust, and Extensible Apps
    • In-House vs Outsourced Data Labeling: Pros & Cons
    • Inside OpenAI’s big play for science 
    • Why chatbots are starting to check your age
    ProfitlyAI
    • Home
    • Latest News
    • AI Technology
    • Latest AI Innovations
    • AI Tools & Technologies
    • Artificial Intelligence
    ProfitlyAI
    Home » Microsoft-studie avslöjar att AI-modeller har svårt med felsökning av kod
    Latest AI Innovations

    Microsoft-studie avslöjar att AI-modeller har svårt med felsökning av kod

    ProfitlyAIBy ProfitlyAIApril 13, 2025No Comments2 Mins Read
    Share Facebook Twitter Pinterest LinkedIn Tumblr Reddit Telegram Email
    Share
    Facebook Twitter LinkedIn Pinterest Email


    En ny studie från Microsoft visar att AI-modeller fortfarande har betydande utmaningar när det kommer until att felsöka kod. Trots att dessa modeller har blivit allt mer avancerade och kan skriva fungerande kod från scratch, så är felsökning en helt annan sak. Det är som att de kan bygga ett hus males inte hitta en läckande kran.

    Studien, som publicerades på Microsofts forskningsblogg, introducerar en miljö kallad Debug Gymnasium. Här tränas AI-modeller att identifiera och åtgärda buggar på samma sätt som mänskliga programmerare gör. Males resultaten visar att det finns en tydlig skillnad mellan hur människor och AI närmar sig problemet. Människor använder logik, instinct och erfarenhet, medan AI-modeller förlitar sig på mönsterigenkänning och statistiska sannolikheter.

    Imponerande males otillräckliga resultat

    I sin studie testade Microsoft-forskarna nio olika AI-modeller på SWE-bench Lite, ett populärt riktmärke för felsökning. Resultaten var blandade:

    • Claude 3.7 Sonnet presterade bäst med en framgångsfrekvens på 48,4%
    • OpenAI:s o1 och o3-mini visade lägre framgångsfrekvenser på 30,2% respektive 22,1%

    Även med tillgång until felsökningsverktyg löste den enkla agenten sällan mer än hälften av problemuppgifterna. Microsoft-forskarna tillskriver den suboptimala prestandan until bristen på knowledge som representerar sekventiellt beslutsfattande.

    Varför AI kämpar med felsökning: Microsoft-forskarna förklarar utmaningarna ”Vi tror att detta beror på bristen på knowledge som representerar sekventiellt beslutsfattande beteende (t.ex. felsökningsspår) i den nuvarande LLM-träningskorpusen”.

    Males den betydande prestandaförbättringen när modellerna får tillgång until felsökningsverktyg visar att detta är en lovande forskningsriktning. Dagens AI-kodningsverktyg kan öka produktiviteten och utmärka sig i att föreslå lösningar för buggar baserat på tillgänglig kod och felmeddelanden. Males until skillnad från mänskliga utvecklare söker dessa verktyg inte efter ytterligare info när lösningar misslyckas, vilket lämnar vissa buggar olösta.

    Mer data:

    1. Microsoft Research Blog: Debug Gym
    2. Microsoft Research
    3. debug-gym – https://microsoft.github.io/debug-gym



    Source link

    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
    Previous ArticleTransformer Lab: Öppen källkods-plattform förenklar arbetet med AI-språkmodeller
    Next Article ChatGPT får långtidsminne – kommer nu ihåg alla dina konversationer
    ProfitlyAI
    • Website

    Related Posts

    Latest AI Innovations

    AI-musik splittrar Sverige: hitlåt portas från topplistan

    January 22, 2026
    Latest AI Innovations

    Nvidia blåsväder efter kontakt med piratbiblioteket Anna’s Archive

    January 22, 2026
    Latest AI Innovations

    AI Voice Agents for Shopify: 24/7 Phone Support That Turns Questions Into Conversions

    January 21, 2026
    Add A Comment
    Leave A Reply Cancel Reply

    Top Posts

    Three big things we still don’t know about AI’s energy burden

    September 9, 2025

    Skapa webbappar utan kodning med DeepSite

    April 14, 2025

    Test: ChatGPT vs Googles Imagen 4 vs FLUX 1.1 – Vilken AI-bildgenerator är bäst?

    June 9, 2025

    The Product Health Score: How I Reduced Critical Incidents by 35% with Unified Monitoring and n8n Automation

    November 28, 2025

    Claude Education en ny AI-chattbot utformad för högre utbildningsinstitutioner

    April 4, 2025
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    Most Popular

    Microsoft lanserar MAI-Image-1 deras första egenutvecklade text-till-bild-modell

    October 15, 2025

    Automated Data Extraction for AI Workflows: A Complete Guide

    September 2, 2025

    How a furniture retailer automated order confirmation processing

    April 24, 2025
    Our Picks

    OpenAI’s latest product lets you vibe code science

    January 27, 2026

    Going Beyond the Context Window: Recursive Language Models in Action

    January 27, 2026

    Data Science as Engineering: Foundations, Education, and Professional Identity

    January 27, 2026
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    • Privacy Policy
    • Disclaimer
    • Terms and Conditions
    • About us
    • Contact us
    Copyright © 2025 ProfitlyAI All Rights Reserved.

    Type above and press Enter to search. Press Esc to cancel.