Close Menu
    Trending
    • Gemini introducerar funktionen schemalagda åtgärder i Gemini-appen
    • AIFF 2025 Runway’s tredje årliga AI Film Festival
    • AI-agenter kan nu hjälpa läkare fatta bättre beslut inom cancervård
    • Not Everything Needs Automation: 5 Practical AI Agents That Deliver Enterprise Value
    • Prescriptive Modeling Unpacked: A Complete Guide to Intervention With Bayesian Modeling.
    • 5 Crucial Tweaks That Will Make Your Charts Accessible to People with Visual Impairments
    • Why AI Projects Fail | Towards Data Science
    • The Role of Luck in Sports: Can We Measure It?
    ProfitlyAI
    • Home
    • Latest News
    • AI Technology
    • Latest AI Innovations
    • AI Tools & Technologies
    • Artificial Intelligence
    ProfitlyAI
    Home » AI-hörlurar översätter flera talare samtidigt klonar deras röster i 3D
    Latest AI Innovations

    AI-hörlurar översätter flera talare samtidigt klonar deras röster i 3D

    ProfitlyAIBy ProfitlyAIMay 12, 2025No Comments2 Mins Read
    Share Facebook Twitter Pinterest LinkedIn Tumblr Reddit Telegram Email
    Share
    Facebook Twitter LinkedIn Pinterest Email


    Forskare vid College of Washington (UW) har utvecklat ett banbrytande hörlursystem kallat Spatial Speech Translation, som kan översätta flera talare samtidigt, samtidigt som det bevarar riktningen och egenskaperna hos deras röster. Detta system använder sig av vanliga brusreducerande hörlurar med inbyggda mikrofoner för att skapa en mer naturlig och användbar översättningsupplevelse i bullriga miljöer.

    Systemet använder två huvudsakliga AI-modeller

    1. En modell som skannar rummet i 360 grader för att identifiera och spåra talare.
    2. En modell som översätter talet samtidigt som den bevarar röstkaraktären.

    Teknologin baseras på två huvudsakliga AI-modeller. Den första modellen identifierar talarna och deras riktning genom att dela upp det omgivande ljudlandskapet i mindre segment. Den andra modellen översätter talet från språk som spanska, franska och tyska till engelska samt bevarar de unika kännetecknen och känslomässiga tonerna i talarens röst.

    Demo video av Spatial Speech Translation

    Systemet fungerar på vanliga enheter med Apple M2-chip och undviker molnanvändning för integritet. Testning i olika miljöer visade att användare föredrog en fördröjning på 3-4 sekunder för bättre noggrannhet.

    Systemet kan revolutionera kommunikationssituationer, särskilt i miljöer med mycket bakgrundsljud, som museer, skolor eller på flygplatser, genom att möjliggöra för användare att lyssna på specifika talare utan att distraheras av omgivande ljud. Det kan också potentiellt förbättra tillgången till information för personer med hörselnedsättning.

    Mer info:

    AI headphones translate multiple speakers at once

    Spatial-Speech-Translation Github



    Source link

    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
    Previous ArticleMeta planerar att förse sina Ray-Ban AI-glasögon med ansiktsigenkänning
    Next Article Enigma Labs Multiverse en avancerad AI-modell för multiplayer-världar
    ProfitlyAI
    • Website

    Related Posts

    Latest AI Innovations

    Gemini introducerar funktionen schemalagda åtgärder i Gemini-appen

    June 7, 2025
    Latest AI Innovations

    AIFF 2025 Runway’s tredje årliga AI Film Festival

    June 7, 2025
    Latest AI Innovations

    AI-agenter kan nu hjälpa läkare fatta bättre beslut inom cancervård

    June 7, 2025
    Add A Comment
    Leave A Reply Cancel Reply

    Top Posts

    Elevenlabs nya V3 kan vara perfekt för audioböcker

    June 6, 2025

    This benchmark used Reddit’s AITA to test how much AI models suck up to us

    May 30, 2025

    Sesame  Speech Model:  How This Viral AI Model Generates Human-Like Speech

    April 12, 2025

    AI learns how vision and sound are connected, without human intervention | MIT News

    May 22, 2025

    Website Feature Engineering at Scale: PySpark, Python & Snowflake

    May 5, 2025
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    Most Popular

    Why AI leaders can’t afford fragmented AI tools

    April 5, 2025

    This AI Startup Is Making an Anime Series and Giving Away $1 Million to Creators

    May 2, 2025

    Nya Firebase Studio från Google förvandlar idéer till applikationer med AI-kraft

    April 10, 2025
    Our Picks

    Gemini introducerar funktionen schemalagda åtgärder i Gemini-appen

    June 7, 2025

    AIFF 2025 Runway’s tredje årliga AI Film Festival

    June 7, 2025

    AI-agenter kan nu hjälpa läkare fatta bättre beslut inom cancervård

    June 7, 2025
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    • Privacy Policy
    • Disclaimer
    • Terms and Conditions
    • About us
    • Contact us
    Copyright © 2025 ProfitlyAI All Rights Reserved.

    Type above and press Enter to search. Press Esc to cancel.