Close Menu
    Trending
    • Hybrid Neuro-Symbolic Fraud Detection: Guiding Neural Networks with Domain Rules
    • What Most B2B Contact Data Comparisons Get Wrong
    • Building a Like-for-Like solution for Stores in Power BI
    • How Pokémon Go is helping robots deliver pizza on time
    • What Are Agent Skills Beyond Claude?
    • When Data Lies: Finding Optimal Strategies for Penalty Kicks with Game Theory
    • Three OpenClaw Mistakes to Avoid and How to Fix Them
    • I Stole a Wall Street Trick to Solve a Google Trends Data Problem
    ProfitlyAI
    • Home
    • Latest News
    • AI Technology
    • Latest AI Innovations
    • AI Tools & Technologies
    • Artificial Intelligence
    ProfitlyAI
    Home » ShapeLLM-Omni designad för att förstå och generera 3D-innehåll
    Latest AI Innovations

    ShapeLLM-Omni designad för att förstå och generera 3D-innehåll

    ProfitlyAIBy ProfitlyAIJune 8, 2025No Comments2 Mins Read
    Share Facebook Twitter Pinterest LinkedIn Tumblr Reddit Telegram Email
    Share
    Facebook Twitter LinkedIn Pinterest Email


    • ShapeLLM-Omni är en ny 3D-native stor språkmodell som kan förstå och generera 3D-tillgångar och textual content i valfri sekvens.
    • Modellen bygger på Qwen2.5-vl:s multimodala kapaciteter och utökar dess förmågor until 3D-domänen.
    • ShapeLLM-Omni stöder multipla funktioner inklusive text-till-3D, bild-till-3D, 3D-bildtexter och 3D-redigering genom textinstruktioner.

    ShapeLLM-Omni är en helt ny typ av multimodal AI-modell som inte bara förstår och genererar textual content och bilder, utan även 3D-objekt. Det här är ett stort steg framåt för AI-världen, där tidigare modeller som GPT-4o varit begränsade until tvådimensionella medier. ShapeLLM-Omni är byggd för att förstå, generera och redigera 3D-resurser – och kan kombinera dessa med textual content och bilder i valfri ordning.

    Hur fungerar modellen?

    Kärnan i ShapeLLM-Omni är en avancerad 3D Vector-Quantized Variational Autoencoder (VQVAE). Den här komponenten omvandlar 3D-objekt (t.ex. mesh-modeller) until en diskret sekvens av tokens, vilket gör det möjligt för modellen att bearbeta 3D-data på samma sätt som textual content eller bild.

    Modellen använder en voxelbaserad illustration (64³ voxelgrid) som komprimeras until en mindre latent illustration (16³ grid) och därefter until 1024 diskreta tokens per objekt. Dessa tokens används sedan av språkmodellen för att generera, förstå och redigera 3D-innehåll.

    För att träna modellen har forskarna byggt ett gigantiskt dataset kallat 3D-Alpaca, med över 700 000 högkvalitativa 3D-resurser och miljontals exempel på text-till-3D, bild-till-3D, 3D-till-text och 3D-redigering.

    Mer data:

    1. ShapeLLM-Omni: A Native Multimodal LLM for 3D Generation and Understanding
    2. Projektets GitHub-sida
    3. Officiell forskningswebbplats



    Source link

    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
    Previous ArticleGemini introducerar funktionen schemalagda åtgärder i Gemini-appen
    Next Article Test: ChatGPT vs Googles Imagen 4 vs FLUX 1.1 – Vilken AI-bildgenerator är bäst?
    ProfitlyAI
    • Website

    Related Posts

    Latest AI Innovations

    What Most B2B Contact Data Comparisons Get Wrong

    March 10, 2026
    Latest AI Innovations

    SocialPost AI: Features, Benefits, and Alternatives

    February 12, 2026
    Latest AI Innovations

    Seedance 2.0: Features, Benefits, and Alternatives

    February 11, 2026
    Add A Comment
    Leave A Reply Cancel Reply

    Top Posts

    When Models Stop Listening: How Feature Collapse Quietly Erodes Machine Learning Systems

    August 1, 2025

    You Only Need 3 Things to Turn AI Experiments into AI Advantage

    September 15, 2025

    How a Research Lab Made Entirely of LLM Agents Developed Molecules That Can Block a Virus

    August 5, 2025

    Production-ready agentic AI: key challenges and solutions 

    January 14, 2026

    Implementing the Hangman Game in Python

    August 28, 2025
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    Most Popular

    Chinese universities want students to use more AI, not less

    July 28, 2025

    Nya föräldrakontroller i ChatGPT ger föräldrar insyn i AI-användning

    September 7, 2025

    How artificial intelligence can help achieve a clean energy future | MIT News

    November 24, 2025
    Our Picks

    Hybrid Neuro-Symbolic Fraud Detection: Guiding Neural Networks with Domain Rules

    March 10, 2026

    What Most B2B Contact Data Comparisons Get Wrong

    March 10, 2026

    Building a Like-for-Like solution for Stores in Power BI

    March 10, 2026
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    • Privacy Policy
    • Disclaimer
    • Terms and Conditions
    • About us
    • Contact us
    Copyright © 2025 ProfitlyAI All Rights Reserved.

    Type above and press Enter to search. Press Esc to cancel.