Close Menu
    Trending
    • ShapeLLM-Omni designad för att förstå och generera 3D-innehåll
    • Gemini introducerar funktionen schemalagda åtgärder i Gemini-appen
    • AIFF 2025 Runway’s tredje årliga AI Film Festival
    • AI-agenter kan nu hjälpa läkare fatta bättre beslut inom cancervård
    • Not Everything Needs Automation: 5 Practical AI Agents That Deliver Enterprise Value
    • Prescriptive Modeling Unpacked: A Complete Guide to Intervention With Bayesian Modeling.
    • 5 Crucial Tweaks That Will Make Your Charts Accessible to People with Visual Impairments
    • Why AI Projects Fail | Towards Data Science
    ProfitlyAI
    • Home
    • Latest News
    • AI Technology
    • Latest AI Innovations
    • AI Tools & Technologies
    • Artificial Intelligence
    ProfitlyAI
    Home » ShapeLLM-Omni designad för att förstå och generera 3D-innehåll
    Latest AI Innovations

    ShapeLLM-Omni designad för att förstå och generera 3D-innehåll

    ProfitlyAIBy ProfitlyAIJune 8, 2025No Comments2 Mins Read
    Share Facebook Twitter Pinterest LinkedIn Tumblr Reddit Telegram Email
    Share
    Facebook Twitter LinkedIn Pinterest Email


    • ShapeLLM-Omni är en ny 3D-native stor språkmodell som kan förstå och generera 3D-tillgångar och textual content i valfri sekvens.
    • Modellen bygger på Qwen2.5-vl:s multimodala kapaciteter och utökar dess förmågor until 3D-domänen.
    • ShapeLLM-Omni stöder multipla funktioner inklusive text-till-3D, bild-till-3D, 3D-bildtexter och 3D-redigering genom textinstruktioner.

    ShapeLLM-Omni är en helt ny typ av multimodal AI-modell som inte bara förstår och genererar textual content och bilder, utan även 3D-objekt. Det här är ett stort steg framåt för AI-världen, där tidigare modeller som GPT-4o varit begränsade until tvådimensionella medier. ShapeLLM-Omni är byggd för att förstå, generera och redigera 3D-resurser – och kan kombinera dessa med textual content och bilder i valfri ordning.

    Hur fungerar modellen?

    Kärnan i ShapeLLM-Omni är en avancerad 3D Vector-Quantized Variational Autoencoder (VQVAE). Den här komponenten omvandlar 3D-objekt (t.ex. mesh-modeller) until en diskret sekvens av tokens, vilket gör det möjligt för modellen att bearbeta 3D-data på samma sätt som textual content eller bild.

    Modellen använder en voxelbaserad illustration (64³ voxelgrid) som komprimeras until en mindre latent illustration (16³ grid) och därefter until 1024 diskreta tokens per objekt. Dessa tokens används sedan av språkmodellen för att generera, förstå och redigera 3D-innehåll.

    För att träna modellen har forskarna byggt ett gigantiskt dataset kallat 3D-Alpaca, med över 700 000 högkvalitativa 3D-resurser och miljontals exempel på text-till-3D, bild-till-3D, 3D-till-text och 3D-redigering.

    Mer data:

    1. ShapeLLM-Omni: A Native Multimodal LLM for 3D Generation and Understanding
    2. Projektets GitHub-sida
    3. Officiell forskningswebbplats



    Source link

    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
    Previous ArticleGemini introducerar funktionen schemalagda åtgärder i Gemini-appen
    ProfitlyAI
    • Website

    Related Posts

    Latest AI Innovations

    Gemini introducerar funktionen schemalagda åtgärder i Gemini-appen

    June 7, 2025
    Latest AI Innovations

    AIFF 2025 Runway’s tredje årliga AI Film Festival

    June 7, 2025
    Latest AI Innovations

    AI-agenter kan nu hjälpa läkare fatta bättre beslut inom cancervård

    June 7, 2025
    Add A Comment
    Leave A Reply Cancel Reply

    Top Posts

    The Best AI Books & Courses for Getting a Job

    May 27, 2025

    WhatsApp users angry over “optional” Meta AI that can’t be turned off

    April 25, 2025

    How To Relocate Abroad As An AI Specialist (Visa-Sponsorship Countries) » Ofemwire

    April 4, 2025

    Pharmacy Placement in Urban Spain

    May 8, 2025

    Understanding Ethical AI: The Importance of Fairness and How to Avoid Common Biases in AI Systems

    April 9, 2025
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    Most Popular

    Agentic RAG Applications: Company Knowledge Slack Agents

    May 30, 2025

    Government Funding Graph RAG | Towards Data Science

    April 25, 2025

    Character AI AvatarFX kan nu göra foton och karaktärer levande i videoform

    April 26, 2025
    Our Picks

    ShapeLLM-Omni designad för att förstå och generera 3D-innehåll

    June 8, 2025

    Gemini introducerar funktionen schemalagda åtgärder i Gemini-appen

    June 7, 2025

    AIFF 2025 Runway’s tredje årliga AI Film Festival

    June 7, 2025
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    • Privacy Policy
    • Disclaimer
    • Terms and Conditions
    • About us
    • Contact us
    Copyright © 2025 ProfitlyAI All Rights Reserved.

    Type above and press Enter to search. Press Esc to cancel.