Close Menu
    Trending
    • Undetectable AI vs. Grammarly’s AI Humanizer: What’s Better with ChatGPT?
    • Do You Really Need a Foundation Model?
    • xAI lanserar AI-sällskap karaktärer genom Grok-plattformen
    • How to more efficiently study complex treatment interactions | MIT News
    • Claude får nya superkrafter med verktygskatalog
    • How Metrics (and LLMs) Can Trick You: A Field Guide to Paradoxes
    • Så här påverkar ChatGPT vårt vardagsspråk
    • Deploy a Streamlit App to AWS
    ProfitlyAI
    • Home
    • Latest News
    • AI Technology
    • Latest AI Innovations
    • AI Tools & Technologies
    • Artificial Intelligence
    ProfitlyAI
    Home » MiniMax M1: En ny utmanare till DeepSeek-R1 med hälften av beräkningskraften
    Latest AI Innovations

    MiniMax M1: En ny utmanare till DeepSeek-R1 med hälften av beräkningskraften

    ProfitlyAIBy ProfitlyAIJune 18, 2025No Comments2 Mins Read
    Share Facebook Twitter Pinterest LinkedIn Tumblr Reddit Telegram Email
    Share
    Facebook Twitter LinkedIn Pinterest Email


    • MiniMax M1 är världens första öppna resonerandemodell med hybrid-attention arkitektur och 456 miljarder parametrar.
    • Modellen kan hantera en kontextlängd på 1 miljon tokens, vilket är åtta gånger större än DeepSeek R1.
    • Modellen utvecklades på bara tre veckor med 512 H800 GPU:er och en kostnad på 534 700 greenback.
    • MiniMax har gjort M1 tillgänglig som öppen källkod by way of GitHub och Hugging Face.

    Shanghai-baserade AI-startupen MiniMax har gjort ett rejält intåg på marknaden för resonemangsmodeller med lanseringen av MiniMax-M1, som påstås vara betydligt mer effektiv än konkurrenten DeepSeek-R1. Det här är inte bara ännu en AI-modell – det är ett försök att visa att man kan få mer gjort med mindre resurser.

    MiniMax som backas av teknikjättarna Tencent och Alibaba positionerar sig som en stark konkurrent until DeepSeek på den kinesiska AI-marknaden. Företaget hävdar att M1 överträffar alla stängda kinesiska konkurrenter i flera benchmarks.

    Males det finns också begränsningar. I SimpleQA benchmark, som testar faktakunskap presterar M1 betydligt sämre än DeepSeek-R1 med bara 18,5% jämfört med 30,1%. Det visar att ingen modell är perfekt på alla områden.

    Teknisk arkitektur och Effektivitet

    • Bygger på MiniMax-Textual content-01 med 456 miljarder parametrar
    • Använder hybrid Mixture-of-Experts (MoE) arkitektur
    • Implementerar ”Lightning Attention” mekanism för snabbare beräkningar
    • Aktiverar endast 45,9 miljarder parametrar per token för optimerad effektivitet

    Prestandajämförelser

    Aspekt MiniMax-M1 DeepSeek-R1
    Beräkningskraft (100K tokens) 25% av DeepSeek-R1 100%
    Sammanhangslängd 1 miljon tokens 125 000 tokens
    Utdatakapacitet 80 000 tokens 64 000 tokens

    Träningskostnad och effektivitet

    • Total träningskostnad: $534,700
    • Använde endast 512 Nvidia H800 GPU-enheter under tre veckor
    • Representerar en betydande kostnadsbesparing jämfört med DeepSeek-R1 som kostade $5-6 miljoner att träna

    Tillgänglighet och framtid

    MiniMax har gjort M1 tillgänglig som öppen källkod via GitHub och Hugging Face med två versioner – en med 40K och en med 80K ”pondering finances”. Det betyder att utvecklare och forskare kan experimentera med modellen utan att behöva betala för API-åtkomst.

    Modellen finns också tillgänglig by way of vLLM för produktionsdistribution, vilket gör det enklare för företag att integrera den i sina system.

    Mer data:



    Source link

    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
    Previous ArticleAbstract Classes: A Software Engineering Concept Data Scientists Must Know To Succeed
    Next Article Data Challenges in Conversational AI & How to Mitigate Common
    ProfitlyAI
    • Website

    Related Posts

    Latest AI Innovations

    xAI lanserar AI-sällskap karaktärer genom Grok-plattformen

    July 16, 2025
    Latest AI Innovations

    Claude får nya superkrafter med verktygskatalog

    July 16, 2025
    Latest AI Innovations

    Så här påverkar ChatGPT vårt vardagsspråk

    July 16, 2025
    Add A Comment
    Leave A Reply Cancel Reply

    Top Posts

    Forskare skapar AI-verktyg som beräknar biologisk ålder från selfies

    May 12, 2025

    Claude uttrycker värderingar i verkliga konversationer enligt en studie

    April 25, 2025

    How Much Data Is Needed to Train Successful ML Models in 2024?

    April 6, 2025

    Katy Perry Didn’t Attend the Met Gala, But AI Made Her the Star of the Night

    May 7, 2025

    Off-the-Shelf AI Training Data: Benefits, Use Cases, and Vendor Selection Tips

    April 3, 2025
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    Most Popular

    Should Sapling AI Be Your AI Detector: Sapling Review

    April 3, 2025

    Understanding Ethical AI: The Importance of Fairness and How to Avoid Common Biases in AI Systems

    April 9, 2025

    How to Measure Real Model Accuracy When Labels Are Noisy

    April 11, 2025
    Our Picks

    Undetectable AI vs. Grammarly’s AI Humanizer: What’s Better with ChatGPT?

    July 16, 2025

    Do You Really Need a Foundation Model?

    July 16, 2025

    xAI lanserar AI-sällskap karaktärer genom Grok-plattformen

    July 16, 2025
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    • Privacy Policy
    • Disclaimer
    • Terms and Conditions
    • About us
    • Contact us
    Copyright © 2025 ProfitlyAI All Rights Reserved.

    Type above and press Enter to search. Press Esc to cancel.