Close Menu
    Trending
    • Gemini introducerar funktionen schemalagda åtgärder i Gemini-appen
    • AIFF 2025 Runway’s tredje årliga AI Film Festival
    • AI-agenter kan nu hjälpa läkare fatta bättre beslut inom cancervård
    • Not Everything Needs Automation: 5 Practical AI Agents That Deliver Enterprise Value
    • Prescriptive Modeling Unpacked: A Complete Guide to Intervention With Bayesian Modeling.
    • 5 Crucial Tweaks That Will Make Your Charts Accessible to People with Visual Impairments
    • Why AI Projects Fail | Towards Data Science
    • The Role of Luck in Sports: Can We Measure It?
    ProfitlyAI
    • Home
    • Latest News
    • AI Technology
    • Latest AI Innovations
    • AI Tools & Technologies
    • Artificial Intelligence
    ProfitlyAI
    Home » AI-hörlurar översätter flera talare samtidigt klonar deras röster i 3D
    Latest AI Innovations

    AI-hörlurar översätter flera talare samtidigt klonar deras röster i 3D

    ProfitlyAIBy ProfitlyAIMay 12, 2025No Comments2 Mins Read
    Share Facebook Twitter Pinterest LinkedIn Tumblr Reddit Telegram Email
    Share
    Facebook Twitter LinkedIn Pinterest Email


    Forskare vid College of Washington (UW) har utvecklat ett banbrytande hörlursystem kallat Spatial Speech Translation, som kan översätta flera talare samtidigt, samtidigt som det bevarar riktningen och egenskaperna hos deras röster. Detta system använder sig av vanliga brusreducerande hörlurar med inbyggda mikrofoner för att skapa en mer naturlig och användbar översättningsupplevelse i bullriga miljöer.

    Systemet använder två huvudsakliga AI-modeller

    1. En modell som skannar rummet i 360 grader för att identifiera och spåra talare.
    2. En modell som översätter talet samtidigt som den bevarar röstkaraktären.

    Teknologin baseras på två huvudsakliga AI-modeller. Den första modellen identifierar talarna och deras riktning genom att dela upp det omgivande ljudlandskapet i mindre segment. Den andra modellen översätter talet från språk som spanska, franska och tyska till engelska samt bevarar de unika kännetecknen och känslomässiga tonerna i talarens röst.

    Demo video av Spatial Speech Translation

    Systemet fungerar på vanliga enheter med Apple M2-chip och undviker molnanvändning för integritet. Testning i olika miljöer visade att användare föredrog en fördröjning på 3-4 sekunder för bättre noggrannhet.

    Systemet kan revolutionera kommunikationssituationer, särskilt i miljöer med mycket bakgrundsljud, som museer, skolor eller på flygplatser, genom att möjliggöra för användare att lyssna på specifika talare utan att distraheras av omgivande ljud. Det kan också potentiellt förbättra tillgången till information för personer med hörselnedsättning.

    Mer info:

    AI headphones translate multiple speakers at once

    Spatial-Speech-Translation Github



    Source link

    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
    Previous ArticleMeta planerar att förse sina Ray-Ban AI-glasögon med ansiktsigenkänning
    Next Article Enigma Labs Multiverse en avancerad AI-modell för multiplayer-världar
    ProfitlyAI
    • Website

    Related Posts

    Latest AI Innovations

    Gemini introducerar funktionen schemalagda åtgärder i Gemini-appen

    June 7, 2025
    Latest AI Innovations

    AIFF 2025 Runway’s tredje årliga AI Film Festival

    June 7, 2025
    Latest AI Innovations

    AI-agenter kan nu hjälpa läkare fatta bättre beslut inom cancervård

    June 7, 2025
    Add A Comment
    Leave A Reply Cancel Reply

    Top Posts

    How Not to Write an MCP Server

    May 9, 2025

    OpenAI’s new image generator aims to be practical enough for designers and advertisers

    April 3, 2025

    Ny AI-jailbreak-teknik kringgår säkerhetsåtgärder hos stora språkmodeller

    May 1, 2025

    Understanding Ethical AI: The Importance of Fairness and How to Avoid Common Biases in AI Systems

    April 9, 2025

    Think. Know. Act. How AI’s Core Capabilities Will Shape the Future of Work

    May 6, 2025
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    Most Popular

    How a furniture retailer automated order confirmation processing

    April 24, 2025

    Why Students Need An AI Detector in 2025

    April 3, 2025

    Predicting the NBA Champion with Machine Learning

    April 24, 2025
    Our Picks

    Gemini introducerar funktionen schemalagda åtgärder i Gemini-appen

    June 7, 2025

    AIFF 2025 Runway’s tredje årliga AI Film Festival

    June 7, 2025

    AI-agenter kan nu hjälpa läkare fatta bättre beslut inom cancervård

    June 7, 2025
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    • Privacy Policy
    • Disclaimer
    • Terms and Conditions
    • About us
    • Contact us
    Copyright © 2025 ProfitlyAI All Rights Reserved.

    Type above and press Enter to search. Press Esc to cancel.