Close Menu
    Trending
    • How Pokémon Go is helping robots deliver pizza on time
    • What Are Agent Skills Beyond Claude?
    • When Data Lies: Finding Optimal Strategies for Penalty Kicks with Game Theory
    • Three OpenClaw Mistakes to Avoid and How to Fix Them
    • I Stole a Wall Street Trick to Solve a Google Trends Data Problem
    • How AI is turning the Iran conflict into theater
    • Why Your AI Search Evaluation Is Probably Wrong (And How to Fix It)
    • Machine Learning at Scale: Managing More Than One Model in Production
    ProfitlyAI
    • Home
    • Latest News
    • AI Technology
    • Latest AI Innovations
    • AI Tools & Technologies
    • Artificial Intelligence
    ProfitlyAI
    Home » ShapeLLM-Omni designad för att förstå och generera 3D-innehåll
    Latest AI Innovations

    ShapeLLM-Omni designad för att förstå och generera 3D-innehåll

    ProfitlyAIBy ProfitlyAIJune 8, 2025No Comments2 Mins Read
    Share Facebook Twitter Pinterest LinkedIn Tumblr Reddit Telegram Email
    Share
    Facebook Twitter LinkedIn Pinterest Email


    • ShapeLLM-Omni är en ny 3D-native stor språkmodell som kan förstå och generera 3D-tillgångar och textual content i valfri sekvens.
    • Modellen bygger på Qwen2.5-vl:s multimodala kapaciteter och utökar dess förmågor until 3D-domänen.
    • ShapeLLM-Omni stöder multipla funktioner inklusive text-till-3D, bild-till-3D, 3D-bildtexter och 3D-redigering genom textinstruktioner.

    ShapeLLM-Omni är en helt ny typ av multimodal AI-modell som inte bara förstår och genererar textual content och bilder, utan även 3D-objekt. Det här är ett stort steg framåt för AI-världen, där tidigare modeller som GPT-4o varit begränsade until tvådimensionella medier. ShapeLLM-Omni är byggd för att förstå, generera och redigera 3D-resurser – och kan kombinera dessa med textual content och bilder i valfri ordning.

    Hur fungerar modellen?

    Kärnan i ShapeLLM-Omni är en avancerad 3D Vector-Quantized Variational Autoencoder (VQVAE). Den här komponenten omvandlar 3D-objekt (t.ex. mesh-modeller) until en diskret sekvens av tokens, vilket gör det möjligt för modellen att bearbeta 3D-data på samma sätt som textual content eller bild.

    Modellen använder en voxelbaserad illustration (64³ voxelgrid) som komprimeras until en mindre latent illustration (16³ grid) och därefter until 1024 diskreta tokens per objekt. Dessa tokens används sedan av språkmodellen för att generera, förstå och redigera 3D-innehåll.

    För att träna modellen har forskarna byggt ett gigantiskt dataset kallat 3D-Alpaca, med över 700 000 högkvalitativa 3D-resurser och miljontals exempel på text-till-3D, bild-till-3D, 3D-till-text och 3D-redigering.

    Mer data:

    1. ShapeLLM-Omni: A Native Multimodal LLM for 3D Generation and Understanding
    2. Projektets GitHub-sida
    3. Officiell forskningswebbplats



    Source link

    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
    Previous ArticleGemini introducerar funktionen schemalagda åtgärder i Gemini-appen
    Next Article Test: ChatGPT vs Googles Imagen 4 vs FLUX 1.1 – Vilken AI-bildgenerator är bäst?
    ProfitlyAI
    • Website

    Related Posts

    Latest AI Innovations

    SocialPost AI: Features, Benefits, and Alternatives

    February 12, 2026
    Latest AI Innovations

    Seedance 2.0: Features, Benefits, and Alternatives

    February 11, 2026
    Latest AI Innovations

    AI Angels: Features, Benefits, Pricing and Alternatives

    February 7, 2026
    Add A Comment
    Leave A Reply Cancel Reply

    Top Posts

    Don’t let hype about AI agents get ahead of reality

    July 3, 2025

    Modern DataFrames in Python: A Hands-On Tutorial with Polars and DuckDB

    November 21, 2025

    Helping AI agents search to get the best results out of large language models | MIT News

    February 5, 2026

    The MCP Security Survival Guide: Best Practices, Pitfalls, and Real-World Lessons

    August 7, 2025

    Understanding Reasoning in Large Language Models

    November 13, 2025
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    Most Popular

    User Authorisation in Streamlit With OIDC and Google

    June 12, 2025

    AI tool generates high-quality images faster than state-of-the-art approaches | MIT News

    April 4, 2025

    Not Everything Needs Automation: 5 Practical AI Agents That Deliver Enterprise Value

    June 6, 2025
    Our Picks

    How Pokémon Go is helping robots deliver pizza on time

    March 10, 2026

    What Are Agent Skills Beyond Claude?

    March 10, 2026

    When Data Lies: Finding Optimal Strategies for Penalty Kicks with Game Theory

    March 10, 2026
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    • Privacy Policy
    • Disclaimer
    • Terms and Conditions
    • About us
    • Contact us
    Copyright © 2025 ProfitlyAI All Rights Reserved.

    Type above and press Enter to search. Press Esc to cancel.