Close Menu
    Trending
    • Topp 10 AI-verktyg för sömn och meditation
    • The brain power behind sustainable AI | MIT News
    • When Transformers Sing: Adapting SpectralKD for Text-Based Knowledge Distillation
    • How to Keep AI Costs Under Control
    • How to Control a Robot with Python
    • Redefining data engineering in the age of AI
    • Multiple Linear Regression, Explained Simply (Part 1)
    • En ny super prompt kan potentiellt öka kreativiteten i LLM
    ProfitlyAI
    • Home
    • Latest News
    • AI Technology
    • Latest AI Innovations
    • AI Tools & Technologies
    • Artificial Intelligence
    ProfitlyAI
    Home » MiniMax M1: En ny utmanare till DeepSeek-R1 med hälften av beräkningskraften
    Latest AI Innovations

    MiniMax M1: En ny utmanare till DeepSeek-R1 med hälften av beräkningskraften

    ProfitlyAIBy ProfitlyAIJune 18, 2025No Comments2 Mins Read
    Share Facebook Twitter Pinterest LinkedIn Tumblr Reddit Telegram Email
    Share
    Facebook Twitter LinkedIn Pinterest Email


    • MiniMax M1 är världens första öppna resonerandemodell med hybrid-attention arkitektur och 456 miljarder parametrar.
    • Modellen kan hantera en kontextlängd på 1 miljon tokens, vilket är åtta gånger större än DeepSeek R1.
    • Modellen utvecklades på bara tre veckor med 512 H800 GPU:er och en kostnad på 534 700 greenback.
    • MiniMax har gjort M1 tillgänglig som öppen källkod by way of GitHub och Hugging Face.

    Shanghai-baserade AI-startupen MiniMax har gjort ett rejält intåg på marknaden för resonemangsmodeller med lanseringen av MiniMax-M1, som påstås vara betydligt mer effektiv än konkurrenten DeepSeek-R1. Det här är inte bara ännu en AI-modell – det är ett försök att visa att man kan få mer gjort med mindre resurser.

    MiniMax som backas av teknikjättarna Tencent och Alibaba positionerar sig som en stark konkurrent until DeepSeek på den kinesiska AI-marknaden. Företaget hävdar att M1 överträffar alla stängda kinesiska konkurrenter i flera benchmarks.

    Males det finns också begränsningar. I SimpleQA benchmark, som testar faktakunskap presterar M1 betydligt sämre än DeepSeek-R1 med bara 18,5% jämfört med 30,1%. Det visar att ingen modell är perfekt på alla områden.

    Teknisk arkitektur och Effektivitet

    • Bygger på MiniMax-Textual content-01 med 456 miljarder parametrar
    • Använder hybrid Mixture-of-Experts (MoE) arkitektur
    • Implementerar ”Lightning Attention” mekanism för snabbare beräkningar
    • Aktiverar endast 45,9 miljarder parametrar per token för optimerad effektivitet

    Prestandajämförelser

    Aspekt MiniMax-M1 DeepSeek-R1
    Beräkningskraft (100K tokens) 25% av DeepSeek-R1 100%
    Sammanhangslängd 1 miljon tokens 125 000 tokens
    Utdatakapacitet 80 000 tokens 64 000 tokens

    Träningskostnad och effektivitet

    • Total träningskostnad: $534,700
    • Använde endast 512 Nvidia H800 GPU-enheter under tre veckor
    • Representerar en betydande kostnadsbesparing jämfört med DeepSeek-R1 som kostade $5-6 miljoner att träna

    Tillgänglighet och framtid

    MiniMax har gjort M1 tillgänglig som öppen källkod via GitHub och Hugging Face med två versioner – en med 40K och en med 80K ”pondering finances”. Det betyder att utvecklare och forskare kan experimentera med modellen utan att behöva betala för API-åtkomst.

    Modellen finns också tillgänglig by way of vLLM för produktionsdistribution, vilket gör det enklare för företag att integrera den i sina system.

    Mer data:



    Source link

    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
    Previous ArticleAbstract Classes: A Software Engineering Concept Data Scientists Must Know To Succeed
    Next Article Data Challenges in Conversational AI & How to Mitigate Common
    ProfitlyAI
    • Website

    Related Posts

    Latest AI Innovations

    Topp 10 AI-verktyg för sömn och meditation

    October 24, 2025
    Latest AI Innovations

    En ny super prompt kan potentiellt öka kreativiteten i LLM

    October 23, 2025
    Latest AI Innovations

    Topp 10 AI-filmer genom tiderna

    October 22, 2025
    Add A Comment
    Leave A Reply Cancel Reply

    Top Posts

    OpenAI can rehabilitate AI models that develop a “bad boy persona”

    June 18, 2025

    The AI Hype Index: The White House’s war on “woke AI”

    July 30, 2025

    LLaVA on a Budget: Multimodal AI with Limited Resources

    June 17, 2025

    Helping data storage keep up with the AI revolution | MIT News

    August 6, 2025

    Why Most Cyber Risk Models Fail Before They Begin

    April 24, 2025
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    Most Popular

    Optimizing food subsidies: Applying digital platforms to maximize nutrition | MIT News

    October 14, 2025

    How to Spin Up a Project Structure with Cookiecutter

    October 13, 2025

    The enterprise path to agentic AI

    April 9, 2025
    Our Picks

    Topp 10 AI-verktyg för sömn och meditation

    October 24, 2025

    The brain power behind sustainable AI | MIT News

    October 24, 2025

    When Transformers Sing: Adapting SpectralKD for Text-Based Knowledge Distillation

    October 23, 2025
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    • Privacy Policy
    • Disclaimer
    • Terms and Conditions
    • About us
    • Contact us
    Copyright © 2025 ProfitlyAI All Rights Reserved.

    Type above and press Enter to search. Press Esc to cancel.