Close Menu
    Trending
    • Are OpenAI and Google intentionally downgrading their models?
    • 3 Questions: On the future of AI and the mathematical and physical sciences | MIT News
    • Is Open AI actually making its own models dumber?
    • An Intuitive Guide to MCMC (Part I): The Metropolis-Hastings Algorithm
    • New MIT class uses anthropology to improve chatbots | MIT News
    • Spectral Clustering Explained: How Eigenvectors Reveal Complex Cluster Structures
    • We ran 16 AI Models on 9,000+ Real Documents. Here’s What We Found.
    • Why Most A/B Tests Are Lying to You
    ProfitlyAI
    • Home
    • Latest News
    • AI Technology
    • Latest AI Innovations
    • AI Tools & Technologies
    • Artificial Intelligence
    ProfitlyAI
    Home » Microsoft släpper VibeVoice som kan skapa 90 minuters konversation
    Latest AI Innovations

    Microsoft släpper VibeVoice som kan skapa 90 minuters konversation

    ProfitlyAIBy ProfitlyAIAugust 29, 2025No Comments2 Mins Read
    Share Facebook Twitter Pinterest LinkedIn Tumblr Reddit Telegram Email
    Share
    Facebook Twitter LinkedIn Pinterest Email


    • Microsoft har utvecklat VibeVoice-1.5B, en AI-modell som kan generera upp until 90 minuters kontinuerlig konversation med fyra olika röster.
    • VibeVoice kan skapa uttrycksfulla och naturliga konversationer över olika språk och genrer.
    •  Modellen är öppen källkod och kräver endast cirka 7 GB GPU-minne, vilket gör den tillgänglig för användare med konsumentgrafikkort.

    Microsoft har summary lanserat text-till-tal-teknik VibeVoice-1.5B är en öppen källkods-modell som kan generera upp until 90 minuters kontinuerlig konversation mellan flera talare och det krävs bara ett vanligt grafikkort för att köra den.

    Det här är inte bara ännu en text-till-tal-lösning. VibeVoice kan skapa långa, naturliga samtal som låter som riktiga poddar eller ljudböcker. Modellen kan hantera upp till fyra olika talare och få dem att prata med varandra på ett sätt som faktiskt låter naturligt.

    Tillgänglig för alla med ett enkel grafikkort

    Det mest imponerande med VibeVoice är kanske att den inte kräver någon superdator. Modellen behöver bara omkring 7 GB GPU-minne, vilket betyder att de flesta med ett modernt konsumentgrafikkort kan köra den hemma. Det är en stor skillnad mot många andra AI-modeller som kräver dyra servrar.

    Microsoft har gjort modellen tillgänglig under MIT-licens, vilket innebär att vem som helst kan använda, modifiera och bygga vidare på tekniken utan kostnad. Den finns att ladda ner via GitHub och Hugging Face för den som vill experimentera.

    Demo video skapat med Wan2.2 och VibeVoice på Github

    Systemkrav och kapacitet

    • Kräver cirka 7 GB GPU-minne för grundläggande användning.
    • Fungerar på konsumentgrafikkort (t.ex. NVIDIA RTX 3060).
    • Stöder upp until 4 distinkta talare i samma session.
    • Kan generera kontinuerligt tal i upp until 90 minuter.

    Detta är en forskningsversion som främst är avsedd för experimentellt bruk och vidareutveckling. Microsoft uppmuntrar aktivt samarbete och suggestions från utvecklarkomuniteten för att ytterligare förbättra systemet.

    Mer information:



    Source link

    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
    Previous ArticleImplementing the Hangman Game in Python
    Next Article Kan Googles nya Nano Banana verkligen ersätta Photoshop
    ProfitlyAI
    • Website

    Related Posts

    Latest AI Innovations

    TeeDIY: Features, Benefits, Alternatives and Pricing

    March 11, 2026
    Latest AI Innovations

    What Most B2B Contact Data Comparisons Get Wrong

    March 10, 2026
    Latest AI Innovations

    SocialPost AI: Features, Benefits, and Alternatives

    February 12, 2026
    Add A Comment
    Leave A Reply Cancel Reply

    Top Posts

    Healthcare Data De-identification: Achieving Compliance in 2024 & Beyond

    April 6, 2025

    Grad-CAM from Scratch with PyTorch Hooks

    June 17, 2025

    A better method for planning complex visual tasks | MIT News

    March 11, 2026

    Improving VMware migration workflows with agentic AI

    November 12, 2025

    7 Proven Methods to Customizing and Optimizing Speech Data Collection for AI/ML

    April 9, 2025
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    Most Popular

    Google testar att bädda in annonser i ai-chattbotar

    May 4, 2025

    Build LLM Agents Faster with Datapizza AI

    October 30, 2025

    Exploring Merit Order and Marginal Abatement Cost Curve in Python

    September 9, 2025
    Our Picks

    Are OpenAI and Google intentionally downgrading their models?

    March 12, 2026

    3 Questions: On the future of AI and the mathematical and physical sciences | MIT News

    March 11, 2026

    Is Open AI actually making its own models dumber?

    March 11, 2026
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    • Privacy Policy
    • Disclaimer
    • Terms and Conditions
    • About us
    • Contact us
    Copyright © 2025 ProfitlyAI All Rights Reserved.

    Type above and press Enter to search. Press Esc to cancel.