Close Menu
    Trending
    • Optimizing Data Transfer in Distributed AI/ML Training Workloads
    • Achieving 5x Agentic Coding Performance with Few-Shot Prompting
    • Why the Sophistication of Your Prompt Correlates Almost Perfectly with the Sophistication of the Response, as Research by Anthropic Found
    • From Transactions to Trends: Predict When a Customer Is About to Stop Buying
    • America’s coming war over AI regulation
    • “Dr. Google” had its issues. Can ChatGPT Health do better?
    • Evaluating Multi-Step LLM-Generated Content: Why Customer Journeys Require Structural Metrics
    • Why SaaS Product Management Is the Best Domain for Data-Driven Professionals in 2026
    ProfitlyAI
    • Home
    • Latest News
    • AI Technology
    • Latest AI Innovations
    • AI Tools & Technologies
    • Artificial Intelligence
    ProfitlyAI
    Home » ShapeLLM-Omni designad för att förstå och generera 3D-innehåll
    Latest AI Innovations

    ShapeLLM-Omni designad för att förstå och generera 3D-innehåll

    ProfitlyAIBy ProfitlyAIJune 8, 2025No Comments2 Mins Read
    Share Facebook Twitter Pinterest LinkedIn Tumblr Reddit Telegram Email
    Share
    Facebook Twitter LinkedIn Pinterest Email


    • ShapeLLM-Omni är en ny 3D-native stor språkmodell som kan förstå och generera 3D-tillgångar och textual content i valfri sekvens.
    • Modellen bygger på Qwen2.5-vl:s multimodala kapaciteter och utökar dess förmågor until 3D-domänen.
    • ShapeLLM-Omni stöder multipla funktioner inklusive text-till-3D, bild-till-3D, 3D-bildtexter och 3D-redigering genom textinstruktioner.

    ShapeLLM-Omni är en helt ny typ av multimodal AI-modell som inte bara förstår och genererar textual content och bilder, utan även 3D-objekt. Det här är ett stort steg framåt för AI-världen, där tidigare modeller som GPT-4o varit begränsade until tvådimensionella medier. ShapeLLM-Omni är byggd för att förstå, generera och redigera 3D-resurser – och kan kombinera dessa med textual content och bilder i valfri ordning.

    Hur fungerar modellen?

    Kärnan i ShapeLLM-Omni är en avancerad 3D Vector-Quantized Variational Autoencoder (VQVAE). Den här komponenten omvandlar 3D-objekt (t.ex. mesh-modeller) until en diskret sekvens av tokens, vilket gör det möjligt för modellen att bearbeta 3D-data på samma sätt som textual content eller bild.

    Modellen använder en voxelbaserad illustration (64³ voxelgrid) som komprimeras until en mindre latent illustration (16³ grid) och därefter until 1024 diskreta tokens per objekt. Dessa tokens används sedan av språkmodellen för att generera, förstå och redigera 3D-innehåll.

    För att träna modellen har forskarna byggt ett gigantiskt dataset kallat 3D-Alpaca, med över 700 000 högkvalitativa 3D-resurser och miljontals exempel på text-till-3D, bild-till-3D, 3D-till-text och 3D-redigering.

    Mer data:

    1. ShapeLLM-Omni: A Native Multimodal LLM for 3D Generation and Understanding
    2. Projektets GitHub-sida
    3. Officiell forskningswebbplats



    Source link

    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
    Previous ArticleGemini introducerar funktionen schemalagda åtgärder i Gemini-appen
    Next Article Test: ChatGPT vs Googles Imagen 4 vs FLUX 1.1 – Vilken AI-bildgenerator är bäst?
    ProfitlyAI
    • Website

    Related Posts

    Latest AI Innovations

    AI-musik splittrar Sverige: hitlåt portas från topplistan

    January 22, 2026
    Latest AI Innovations

    Nvidia blåsväder efter kontakt med piratbiblioteket Anna’s Archive

    January 22, 2026
    Latest AI Innovations

    AI Voice Agents for Shopify: 24/7 Phone Support That Turns Questions Into Conversions

    January 21, 2026
    Add A Comment
    Leave A Reply Cancel Reply

    Top Posts

    New Benchmark Shows AI Agents Perform Poorly When Automating Real Jobs

    November 5, 2025

    Netflix Adds ChatGPT-Powered AI to Stop You From Scrolling Forever

    May 8, 2025

    Agentic AI: Real-World Impact, Enterprise-Ready Solutions

    April 5, 2025

    TruthScan vs. Grammarly: Which AI Detector Works Best?

    December 3, 2025

    Accuracy, Cost, and Performance with NVIDIA Nemotron Models

    August 11, 2025
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    Most Popular

    OpenAI planerar att kombinera flera modeller till GPT-5

    May 20, 2025

    Does More Data Always Yield Better Performance?

    November 10, 2025

    Validation technique could help scientists make more accurate forecasts | MIT News

    April 6, 2025
    Our Picks

    Optimizing Data Transfer in Distributed AI/ML Training Workloads

    January 23, 2026

    Achieving 5x Agentic Coding Performance with Few-Shot Prompting

    January 23, 2026

    Why the Sophistication of Your Prompt Correlates Almost Perfectly with the Sophistication of the Response, as Research by Anthropic Found

    January 23, 2026
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    • Privacy Policy
    • Disclaimer
    • Terms and Conditions
    • About us
    • Contact us
    Copyright © 2025 ProfitlyAI All Rights Reserved.

    Type above and press Enter to search. Press Esc to cancel.