Close Menu
    Trending
    • Achieving 5x Agentic Coding Performance with Few-Shot Prompting
    • Why the Sophistication of Your Prompt Correlates Almost Perfectly with the Sophistication of the Response, as Research by Anthropic Found
    • From Transactions to Trends: Predict When a Customer Is About to Stop Buying
    • America’s coming war over AI regulation
    • “Dr. Google” had its issues. Can ChatGPT Health do better?
    • Evaluating Multi-Step LLM-Generated Content: Why Customer Journeys Require Structural Metrics
    • Why SaaS Product Management Is the Best Domain for Data-Driven Professionals in 2026
    • Stop Writing Messy Boolean Masks: 10 Elegant Ways to Filter Pandas DataFrames
    ProfitlyAI
    • Home
    • Latest News
    • AI Technology
    • Latest AI Innovations
    • AI Tools & Technologies
    • Artificial Intelligence
    ProfitlyAI
    Home » AI-hörlurar översätter flera talare samtidigt klonar deras röster i 3D
    Latest AI Innovations

    AI-hörlurar översätter flera talare samtidigt klonar deras röster i 3D

    ProfitlyAIBy ProfitlyAIMay 12, 2025No Comments2 Mins Read
    Share Facebook Twitter Pinterest LinkedIn Tumblr Reddit Telegram Email
    Share
    Facebook Twitter LinkedIn Pinterest Email


    Forskare vid College of Washington (UW) har utvecklat ett banbrytande hörlursystem kallat Spatial Speech Translation, som kan översätta flera talare samtidigt, samtidigt som det bevarar riktningen och egenskaperna hos deras röster. Detta system använder sig av vanliga brusreducerande hörlurar med inbyggda mikrofoner för att skapa en mer naturlig och användbar översättningsupplevelse i bullriga miljöer.

    Systemet använder två huvudsakliga AI-modeller

    1. En modell som skannar rummet i 360 grader för att identifiera och spåra talare.
    2. En modell som översätter talet samtidigt som den bevarar röstkaraktären.

    Teknologin baseras på två huvudsakliga AI-modeller. Den första modellen identifierar talarna och deras riktning genom att dela upp det omgivande ljudlandskapet i mindre segment. Den andra modellen översätter talet från språk som spanska, franska och tyska till engelska samt bevarar de unika kännetecknen och känslomässiga tonerna i talarens röst.

    Demo video av Spatial Speech Translation

    Systemet fungerar på vanliga enheter med Apple M2-chip och undviker molnanvändning för integritet. Testning i olika miljöer visade att användare föredrog en fördröjning på 3-4 sekunder för bättre noggrannhet.

    Systemet kan revolutionera kommunikationssituationer, särskilt i miljöer med mycket bakgrundsljud, som museer, skolor eller på flygplatser, genom att möjliggöra för användare att lyssna på specifika talare utan att distraheras av omgivande ljud. Det kan också potentiellt förbättra tillgången till information för personer med hörselnedsättning.

    Mer info:

    AI headphones translate multiple speakers at once

    Spatial-Speech-Translation Github



    Source link

    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
    Previous ArticleMeta planerar att förse sina Ray-Ban AI-glasögon med ansiktsigenkänning
    Next Article Enigma Labs Multiverse en avancerad AI-modell för multiplayer-världar
    ProfitlyAI
    • Website

    Related Posts

    Latest AI Innovations

    AI-musik splittrar Sverige: hitlåt portas från topplistan

    January 22, 2026
    Latest AI Innovations

    Nvidia blåsväder efter kontakt med piratbiblioteket Anna’s Archive

    January 22, 2026
    Latest AI Innovations

    AI Voice Agents for Shopify: 24/7 Phone Support That Turns Questions Into Conversions

    January 21, 2026
    Add A Comment
    Leave A Reply Cancel Reply

    Top Posts

    Trump’s AI-generated papal portrait sparks controversy and debate

    May 3, 2025

    Fears of AI’s Impact Create New Political Alliances and Tensions

    November 19, 2025

    What does the future hold for generative AI? | MIT News

    September 19, 2025

    Reinforcement Learning Made Simple: Build a Q-Learning Agent in Python

    May 27, 2025

    EDA in Public (Part 3): RFM Analysis for Customer Segmentation in Pandas

    January 1, 2026
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    Most Popular

    On the Challenge of Converting TensorFlow Models to PyTorch

    December 5, 2025

    Gemini introducerar funktionen schemalagda åtgärder i Gemini-appen

    June 7, 2025

    The Good-Enough Truth | Towards Data Science

    April 17, 2025
    Our Picks

    Achieving 5x Agentic Coding Performance with Few-Shot Prompting

    January 23, 2026

    Why the Sophistication of Your Prompt Correlates Almost Perfectly with the Sophistication of the Response, as Research by Anthropic Found

    January 23, 2026

    From Transactions to Trends: Predict When a Customer Is About to Stop Buying

    January 23, 2026
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    • Privacy Policy
    • Disclaimer
    • Terms and Conditions
    • About us
    • Contact us
    Copyright © 2025 ProfitlyAI All Rights Reserved.

    Type above and press Enter to search. Press Esc to cancel.