Close Menu
    Trending
    • A better method for planning complex visual tasks | MIT News
    • 3 Questions: Building predictive models to characterize tumor progression | MIT News
    • How Joseph Paradiso’s sensing innovations bridge the arts, medicine, and ecology | MIT News
    • Hybrid Neuro-Symbolic Fraud Detection: Guiding Neural Networks with Domain Rules
    • What Most B2B Contact Data Comparisons Get Wrong
    • Building a Like-for-Like solution for Stores in Power BI
    • How Pokémon Go is helping robots deliver pizza on time
    • What Are Agent Skills Beyond Claude?
    ProfitlyAI
    • Home
    • Latest News
    • AI Technology
    • Latest AI Innovations
    • AI Tools & Technologies
    • Artificial Intelligence
    ProfitlyAI
    Home » Samsungs lilla AI-modell TRM utmanar större LLM-modeller
    Latest AI Innovations

    Samsungs lilla AI-modell TRM utmanar större LLM-modeller

    ProfitlyAIBy ProfitlyAIOctober 9, 2025No Comments2 Mins Read
    Share Facebook Twitter Pinterest LinkedIn Tumblr Reddit Telegram Email
    Share
    Facebook Twitter LinkedIn Pinterest Email


    • TRM är en liten AI-modell med endast 7 miljoner parametrar som överträffar större språkmodeller på komplexa resoneringsuppgifter.
    • Modellen använder en rekursiv metod där nätverket iterativt förfinar sina svar genom upp until 16 upprepningar.
    • Modellen presterar märkbart bättre än stora språkmodeller som Deepseek R1 och Gemini 2,5 Professional på specifika uppgifter.
    • RM har potential för användning i resursbegränsade miljöer som robotik och personlig databehandling.

    Samsung forskare har utvecklat en ny öppen resonemangsmodell kallad TRM (Tiny Recursion Mannequin) som överträffar modeller som är 10 000 gånger större på specifika drawback. Modellen som bygger på rekursivt resonemang visar att små nätverk kan uppnå hög prestanda utan stora investeringar i GPU: och kraft.

    TRM är öppen källkod beneath en MIT-licens och är utformad för strukturerade, visuella och grid-baserade drawback vilket utmanar den dominerande filosofin att ”skala är allt som behövs” inom AI-forskningen.

    Med bara två lager i sitt neurala nätverk simulerar TRM en djupare arkitektur utan att belasta minnet eller kräva massiva beräkningsresurser. Den rekursiva cykeln körs upp until 16 gånger för varje uppgift, vilket gör att modellen kan göra allt mer exakta förutsägelser – lite som hur stora språkmodeller använder steg-för-steg-resonemang, quick här uppnås det med en smal, effektiv design.

    Träningskostnad beneath 500 greenback

    En annan fascinerande detalj är att träningen av TRM kostade beneath 500 greenback och tog bara två dagar på fyra H100-GPU:er. Det här står i skarp kontrast until de miljarder som spenderas på att träna de största språkmodellerna. Resultaten visar att genom att designa arkitekturer som kan resonera iterativt och själv-korrigera är det möjligt att lösa extremt svåra drawback med en bråkdel av beräkningsresurserna.

    Forskningspapperet och koden är öppet tillgängliga på GitHub för den som vill experimentera vidare. Det här kan öppna dörrar för mer forskning kring små, effektiva modeller som kan köras på enheter med begränsade resurser.

    Mer data:



    Source link

    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
    Previous ArticleGoogle släpper Computer Use – AI:n som kan klicka och surfa åt dig
    Next Article How to Prepare Knowledge Workers for an AI-Powered Future with Paul Roetzer [MAICON 2025 Speaker Series]
    ProfitlyAI
    • Website

    Related Posts

    Latest AI Innovations

    What Most B2B Contact Data Comparisons Get Wrong

    March 10, 2026
    Latest AI Innovations

    SocialPost AI: Features, Benefits, and Alternatives

    February 12, 2026
    Latest AI Innovations

    Seedance 2.0: Features, Benefits, and Alternatives

    February 11, 2026
    Add A Comment
    Leave A Reply Cancel Reply

    Top Posts

    Recap of all types of LLM Agents

    July 9, 2025

    Five things you need to know about AI right now

    July 22, 2025

    Meta släpper Llama 4 – AI nyheter

    April 6, 2025

    “Create a replica of this image. Don’t change anything” AI trend takes off

    May 6, 2025

    Building Cost-Efficient Agentic RAG on Long-Text Documents in SQL Tables

    February 18, 2026
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    Most Popular

    How to Context Engineer to Optimize Question Answering Pipelines

    September 5, 2025

    Ny AI från Tencent skapar kompletta 3D-världar från bara en mening eller en bild-

    July 28, 2025

    The Data Team’s Survival Guide for the Next Era of Data

    March 6, 2026
    Our Picks

    A better method for planning complex visual tasks | MIT News

    March 11, 2026

    3 Questions: Building predictive models to characterize tumor progression | MIT News

    March 10, 2026

    How Joseph Paradiso’s sensing innovations bridge the arts, medicine, and ecology | MIT News

    March 10, 2026
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    • Privacy Policy
    • Disclaimer
    • Terms and Conditions
    • About us
    • Contact us
    Copyright © 2025 ProfitlyAI All Rights Reserved.

    Type above and press Enter to search. Press Esc to cancel.