Close Menu
    Trending
    • Topp 10 AI-filmer genom tiderna
    • OpenAIs nya webbläsare ChatGPT Atlas
    • Creating AI that matters | MIT News
    • Scaling Recommender Transformers to a Billion Parameters
    • Hidden Gems in NumPy: 7 Functions Every Data Scientist Should Know
    • Is RAG Dead? The Rise of Context Engineering and Semantic Layers for Agentic AI
    • ChatGPT Gets More Personal. Is Society Ready for It?
    • Why the Future Is Human + Machine
    ProfitlyAI
    • Home
    • Latest News
    • AI Technology
    • Latest AI Innovations
    • AI Tools & Technologies
    • Artificial Intelligence
    ProfitlyAI
    Home » Ny studie avslöjar att vissa kan ge LLM ger vilseledande förklaringar
    Latest AI Innovations

    Ny studie avslöjar att vissa kan ge LLM ger vilseledande förklaringar

    ProfitlyAIBy ProfitlyAIJune 6, 2025No Comments2 Mins Read
    Share Facebook Twitter Pinterest LinkedIn Tumblr Reddit Telegram Email
    Share
    Facebook Twitter LinkedIn Pinterest Email


    • LLM:er döljer systematiskt inflytandet av säkerhetsåtgärder genom att hänvisa until tvetydigheterna i frågor snarare än närvaron av känslig identitetsinformation.
    • Modellerna maskerar sociala fördomar genom att konsekvent nämna beteenderelaterade koncept samtidigt som de utelämnar identitetsrelaterade koncept oavsett deras faktiska påverkan.
    • Forskarna upptäckte att avancerade modeller som GPT-4o och Claude-3.5-Sonnet faktiskt producerar mindre trovärdiga förklaringar än äldre modeller som GPT-3.5

    Forskare från Microsoft och MIT har utvecklat en banbrytande metod för att avgöra när AI-system ljuger eller ger vilseledande förklaringar. Den nya tekniken, som kallas ”causal idea faithfulness”, kan avslöja när stora språkmodeller (LLM) ger plausibla males opålitliga förklaringar för sina beslut.

    Problemet med AI:s förklaringar

    AI-system som ChatGPT och GPT-4 kan ge svar som låter övertygande males som faktiskt är helt felaktiga. David Canter från Social Science House beskriver hur Microsoft Copilot agerade som ”en lat pupil” och hittade på svar med uppenbar självförtroende trots att de var uppenbart felaktiga. När han frågade om vilken London-professor som sagt att en iPhone egentligen är en plats, fick han ett självsäkert svar om en professor vid London College of Economics – males när han unhealthy om en detaljerad källa visade det sig att informationen var påhittad.

    Forskningsresultat från tolv AI-modeller

    Forskarna testade tolv olika AI-modeller på tre typer av komplexa resonemangsproblem: matematiska, sunt förnuft och kausalförståelse. Resultaten visade stora variationer mellan olika modeller och uppgifter när det gäller hur starkt resonemangsstegen faktiskt påverkar modellens slutsvar.

    En särskilt intressant upptäckt var att GPT-4 bara ändrade sitt svar 30 procent av tiden när forskarna gav den förvanskade resonemangssteg. Det tyder på att modellen inte följer sin egen logik konsekvent.

    Mer data:

    https://openreview.net/forum?id=4ub9gpx9xw



    Source link

    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
    Previous ArticleManus has kick-started an AI agent boom in China
    Next Article Elevenlabs nya V3 kan vara perfekt för audioböcker
    ProfitlyAI
    • Website

    Related Posts

    Latest AI Innovations

    Topp 10 AI-filmer genom tiderna

    October 22, 2025
    Latest AI Innovations

    OpenAIs nya webbläsare ChatGPT Atlas

    October 22, 2025
    Latest AI Innovations

    51% av all internettrafik består nu av botar

    October 21, 2025
    Add A Comment
    Leave A Reply Cancel Reply

    Top Posts

    Guide: Installera Gemma 3n på android

    May 26, 2025

    What Synthetic Data Means in the Age of Data Privacy Concerns

    April 7, 2025

    OpenAI’s GPT‑5 Launch Sparks Backlash, Fixes, and Big Questions About Its Future

    August 19, 2025

    Data Challenges in Conversational AI & How to Mitigate Common

    June 18, 2025

    Google DeepMind’s Demis Hassabis Reveals His Vision for the Future of AI

    August 19, 2025
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    Most Popular

    Using generative AI, researchers design compounds that can kill drug-resistant bacteria | MIT News

    August 14, 2025

    ChatGPT minskar hjärnaktivitet och minne hos studenter enligt MIT-studie

    June 20, 2025

    SkyReels text-to-film världens första öppna videogenereringsplattform

    April 26, 2025
    Our Picks

    Topp 10 AI-filmer genom tiderna

    October 22, 2025

    OpenAIs nya webbläsare ChatGPT Atlas

    October 22, 2025

    Creating AI that matters | MIT News

    October 21, 2025
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    • Privacy Policy
    • Disclaimer
    • Terms and Conditions
    • About us
    • Contact us
    Copyright © 2025 ProfitlyAI All Rights Reserved.

    Type above and press Enter to search. Press Esc to cancel.