Tencent lanserar HunyuanWorld-Voyager AI förvandlar foton till spelbara 3D-världar

Tencent har släppt HunyuanWorld-Voyager som öppen källkod en AI-modell som omvandlar enstaka bilder until spelaktiva 3D-världar.
Modellen genererar samtidigt RGB-video och djupinformation, vilket möjliggör användare att navigera virtuella miljöer genom tangentbord eller joystick-kontroller.
Modellen kräver omfattande beräkningsresurser med minimal 60GB GPU-minne för 540p-upplösning och rekommenderat 80GB för optimala resultat.

Tencent har nyligen introducerat HunyuanWorld-Voyager en innovativ AI-modell som använder avancerad videodiffusion för att generera 3D-världar från en enda bild. Denna teknik möjliggör skapandet av explorable 3D-system genom att generera video som simulerar rörelse genom tre-dimensionella miljöer, vilket öppnar upp för nya möjligheter inom 3D-modellering och innehållsskapande.

Så fungerar tekniken

HunyuanWorld-Voyager bygger på en unik diffusionsmodellarkitektur som skiljer sig markant från tidigare metoder.

Processen är förvånansvärt enkel för slutanvändaren. Du matar in en enda bild tillsammans med en specificerad kamerabana och systemet genererar en RGB-D-videosequens där varje bildruta kommer med justerad djupinformation. Detta möjliggör verkligt tredimensionell navigation genom scenen.

Voyager kan generera videosequenser som täcker stora avstånd och komplexa kamerarörelser. Systemet kan hantera panorering, lutning och framåtgående rörelser genom den genererade 3D-miljön.

Tekniska krav

Testad på en enskild 80GB GPU.
Miniminnekrav: 60GB GPU-minne för 540p-upplösning.
Rekommenderat: 80GB GPU-minne för optimum kvalitet.

Tencent har gjort HunyuanWorld-Voyager tillgängligt som ett system med öppna vikter, vilket betyder att forskare och utvecklare kan ladda ner och experimentera med tekniken. Modellen finns tillgänglig både på GitHub och Hugging Face.

Mer data:

Source link

SocialPost AI: Features, Benefits, and Alternatives

Seedance 2.0: Features, Benefits, and Alternatives

AI Angels: Features, Benefits, Pricing and Alternatives

New technologies tackle brain health assessment for the military | MIT News

LLMs + Pandas: How I Use Generative AI to Generate Pandas DataFrame Summaries

Trump’s Executive Order to Eliminate States’ AI Laws

GliNER2: Extracting Structured Information from Text

OpenAI lanserar Codex AI-agent för mjukvaruutveckling

Most Popular

Why Is My Code So Slow? A Guide to Py-Spy Python Profiling

Google Cloud Next 2025 presenterade flera nya moln och AI-teknologier

MedGemma – Nya AI-modeller för hälso och sjukvård

Our Picks

Three OpenClaw Mistakes to Avoid and How to Fix Them

I Stole a Wall Street Trick to Solve a Google Trends Data Problem

How AI is turning the Iran conflict into theater

Tencent lanserar HunyuanWorld-Voyager AI förvandlar foton till spelbara 3D-världar

Så fungerar tekniken

Tekniska krav

Mer data:

Related Posts