Close Menu
    Trending
    • Automated Data Extraction for AI Workflows: A Complete Guide
    • What health care providers actually want from AI
    • Alibaba har lanserat Qwen-Image-Edit en AI-bildbehandlingsverktyg som öppenkällkod
    • Can an AI doppelgänger help me do my job?
    • Therapists are secretly using ChatGPT during sessions. Clients are triggered.
    • Anthropic testar ett AI-webbläsartillägg för Chrome
    • A Practical Blueprint for AI Document Classification
    • Top Priorities for Shared Services and GBS Leaders for 2026
    ProfitlyAI
    • Home
    • Latest News
    • AI Technology
    • Latest AI Innovations
    • AI Tools & Technologies
    • Artificial Intelligence
    ProfitlyAI
    Home » Microsoft släpper VibeVoice som kan skapa 90 minuters konversation
    Latest AI Innovations

    Microsoft släpper VibeVoice som kan skapa 90 minuters konversation

    ProfitlyAIBy ProfitlyAIAugust 29, 2025No Comments2 Mins Read
    Share Facebook Twitter Pinterest LinkedIn Tumblr Reddit Telegram Email
    Share
    Facebook Twitter LinkedIn Pinterest Email


    • Microsoft har utvecklat VibeVoice-1.5B, en AI-modell som kan generera upp until 90 minuters kontinuerlig konversation med fyra olika röster.
    • VibeVoice kan skapa uttrycksfulla och naturliga konversationer över olika språk och genrer.
    •  Modellen är öppen källkod och kräver endast cirka 7 GB GPU-minne, vilket gör den tillgänglig för användare med konsumentgrafikkort.

    Microsoft har summary lanserat text-till-tal-teknik VibeVoice-1.5B är en öppen källkods-modell som kan generera upp until 90 minuters kontinuerlig konversation mellan flera talare och det krävs bara ett vanligt grafikkort för att köra den.

    Det här är inte bara ännu en text-till-tal-lösning. VibeVoice kan skapa långa, naturliga samtal som låter som riktiga poddar eller ljudböcker. Modellen kan hantera upp till fyra olika talare och få dem att prata med varandra på ett sätt som faktiskt låter naturligt.

    Tillgänglig för alla med ett enkel grafikkort

    Det mest imponerande med VibeVoice är kanske att den inte kräver någon superdator. Modellen behöver bara omkring 7 GB GPU-minne, vilket betyder att de flesta med ett modernt konsumentgrafikkort kan köra den hemma. Det är en stor skillnad mot många andra AI-modeller som kräver dyra servrar.

    Microsoft har gjort modellen tillgänglig under MIT-licens, vilket innebär att vem som helst kan använda, modifiera och bygga vidare på tekniken utan kostnad. Den finns att ladda ner via GitHub och Hugging Face för den som vill experimentera.

    Demo video skapat med Wan2.2 och VibeVoice på Github

    Systemkrav och kapacitet

    • Kräver cirka 7 GB GPU-minne för grundläggande användning.
    • Fungerar på konsumentgrafikkort (t.ex. NVIDIA RTX 3060).
    • Stöder upp until 4 distinkta talare i samma session.
    • Kan generera kontinuerligt tal i upp until 90 minuter.

    Detta är en forskningsversion som främst är avsedd för experimentellt bruk och vidareutveckling. Microsoft uppmuntrar aktivt samarbete och suggestions från utvecklarkomuniteten för att ytterligare förbättra systemet.

    Mer information:



    Source link

    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
    Previous ArticleImplementing the Hangman Game in Python
    Next Article Kan Googles nya Nano Banana verkligen ersätta Photoshop
    ProfitlyAI
    • Website

    Related Posts

    Latest AI Innovations

    Alibaba har lanserat Qwen-Image-Edit en AI-bildbehandlingsverktyg som öppenkällkod

    September 2, 2025
    Latest AI Innovations

    Anthropic testar ett AI-webbläsartillägg för Chrome

    September 2, 2025
    Latest AI Innovations

    YouTube tillämpar AI-förbättringar på videor utan skaparnas medgivande

    August 29, 2025
    Add A Comment
    Leave A Reply Cancel Reply

    Top Posts

    Apple arbetar på nya chip för AI-servrar, Mac-datorer och smarta glasögon

    May 13, 2025

    Flight Deals är ett nytt AI-drivet sökverktyg i Google Flights

    August 17, 2025

    Work Data Is the Next Frontier for GenAI

    July 9, 2025

    MIT Learn offers “a whole new front door to the Institute” | MIT News

    July 21, 2025

    What It Means and Where It’s Headed

    April 10, 2025
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    Most Popular

    OpenAI Releases o3 and o4-mini, AI Is Causing “Quiet Layoffs,” Executive Order on Youth AI Education & GPT-4o’s Controversial Update

    April 29, 2025

    Forecast demand with precision using advanced AI for SAP IBP

    April 30, 2025

    AI-agenter har potential att bli kraftfulla verktyg för cyberattacker

    April 9, 2025
    Our Picks

    Automated Data Extraction for AI Workflows: A Complete Guide

    September 2, 2025

    What health care providers actually want from AI

    September 2, 2025

    Alibaba har lanserat Qwen-Image-Edit en AI-bildbehandlingsverktyg som öppenkällkod

    September 2, 2025
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    • Privacy Policy
    • Disclaimer
    • Terms and Conditions
    • About us
    • Contact us
    Copyright © 2025 ProfitlyAI All Rights Reserved.

    Type above and press Enter to search. Press Esc to cancel.