Close Menu
    Trending
    • Deploy a Streamlit App to AWS
    • How to Ensure Reliability in LLM Applications
    • Automating Deep Learning: A Gentle Introduction to AutoKeras and Keras Tuner
    • From Equal Weights to Smart Weights: OTPO’s Approach to Better LLM Alignment
    • The Future of AI Agent Communication with ACP
    • Vad världen har frågat ChatGPT under 2025
    • Google’s generative video model Veo 3 has a subtitles problem
    • MedGemma – Nya AI-modeller för hälso och sjukvård
    ProfitlyAI
    • Home
    • Latest News
    • AI Technology
    • Latest AI Innovations
    • AI Tools & Technologies
    • Artificial Intelligence
    ProfitlyAI
    Home » MiniMax M1: En ny utmanare till DeepSeek-R1 med hälften av beräkningskraften
    Latest AI Innovations

    MiniMax M1: En ny utmanare till DeepSeek-R1 med hälften av beräkningskraften

    ProfitlyAIBy ProfitlyAIJune 18, 2025No Comments2 Mins Read
    Share Facebook Twitter Pinterest LinkedIn Tumblr Reddit Telegram Email
    Share
    Facebook Twitter LinkedIn Pinterest Email


    • MiniMax M1 är världens första öppna resonerandemodell med hybrid-attention arkitektur och 456 miljarder parametrar.
    • Modellen kan hantera en kontextlängd på 1 miljon tokens, vilket är åtta gånger större än DeepSeek R1.
    • Modellen utvecklades på bara tre veckor med 512 H800 GPU:er och en kostnad på 534 700 greenback.
    • MiniMax har gjort M1 tillgänglig som öppen källkod by way of GitHub och Hugging Face.

    Shanghai-baserade AI-startupen MiniMax har gjort ett rejält intåg på marknaden för resonemangsmodeller med lanseringen av MiniMax-M1, som påstås vara betydligt mer effektiv än konkurrenten DeepSeek-R1. Det här är inte bara ännu en AI-modell – det är ett försök att visa att man kan få mer gjort med mindre resurser.

    MiniMax som backas av teknikjättarna Tencent och Alibaba positionerar sig som en stark konkurrent until DeepSeek på den kinesiska AI-marknaden. Företaget hävdar att M1 överträffar alla stängda kinesiska konkurrenter i flera benchmarks.

    Males det finns också begränsningar. I SimpleQA benchmark, som testar faktakunskap presterar M1 betydligt sämre än DeepSeek-R1 med bara 18,5% jämfört med 30,1%. Det visar att ingen modell är perfekt på alla områden.

    Teknisk arkitektur och Effektivitet

    • Bygger på MiniMax-Textual content-01 med 456 miljarder parametrar
    • Använder hybrid Mixture-of-Experts (MoE) arkitektur
    • Implementerar ”Lightning Attention” mekanism för snabbare beräkningar
    • Aktiverar endast 45,9 miljarder parametrar per token för optimerad effektivitet

    Prestandajämförelser

    Aspekt MiniMax-M1 DeepSeek-R1
    Beräkningskraft (100K tokens) 25% av DeepSeek-R1 100%
    Sammanhangslängd 1 miljon tokens 125 000 tokens
    Utdatakapacitet 80 000 tokens 64 000 tokens

    Träningskostnad och effektivitet

    • Total träningskostnad: $534,700
    • Använde endast 512 Nvidia H800 GPU-enheter under tre veckor
    • Representerar en betydande kostnadsbesparing jämfört med DeepSeek-R1 som kostade $5-6 miljoner att träna

    Tillgänglighet och framtid

    MiniMax har gjort M1 tillgänglig som öppen källkod via GitHub och Hugging Face med två versioner – en med 40K och en med 80K ”pondering finances”. Det betyder att utvecklare och forskare kan experimentera med modellen utan att behöva betala för API-åtkomst.

    Modellen finns också tillgänglig by way of vLLM för produktionsdistribution, vilket gör det enklare för företag att integrera den i sina system.

    Mer data:



    Source link

    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
    Previous ArticleAbstract Classes: A Software Engineering Concept Data Scientists Must Know To Succeed
    Next Article Data Challenges in Conversational AI & How to Mitigate Common
    ProfitlyAI
    • Website

    Related Posts

    Latest AI Innovations

    Vad världen har frågat ChatGPT under 2025

    July 15, 2025
    Latest AI Innovations

    MedGemma – Nya AI-modeller för hälso och sjukvård

    July 15, 2025
    Latest AI Innovations

    Grok 4 – xAI:s nya AI-modell

    July 11, 2025
    Add A Comment
    Leave A Reply Cancel Reply

    Top Posts

    We Need a Fourth Law of Robotics in the Age of AI

    May 7, 2025

    The Westworld Blunder | Towards Data Science

    May 13, 2025

    Agentic AI 102: Guardrails and Agent Evaluation

    May 16, 2025

    Applications of Density Estimation to Legal Theory

    June 10, 2025

    Regression Discontinuity Design: How It Works and When to Use It

    May 7, 2025
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    Most Popular

    Parquet File Format – Everything You Need to Know!

    May 14, 2025

    Shopify’s CEO Just Issued a Bold AI Ultimatum to His Entire Team

    April 15, 2025

    FCA Just Dropped Big News on Live AI Testing for UK Firms

    April 30, 2025
    Our Picks

    Deploy a Streamlit App to AWS

    July 15, 2025

    How to Ensure Reliability in LLM Applications

    July 15, 2025

    Automating Deep Learning: A Gentle Introduction to AutoKeras and Keras Tuner

    July 15, 2025
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    • Privacy Policy
    • Disclaimer
    • Terms and Conditions
    • About us
    • Contact us
    Copyright © 2025 ProfitlyAI All Rights Reserved.

    Type above and press Enter to search. Press Esc to cancel.