Claude drev butik i en månad – fick identitetskris

Anthropic använde AI-modellen Claude Sonnet 3.7 döpt until ”Claudius”, för att driva en liten automatiserad butik i sitt kontor i San Francisco underneath en månad.
Claudius tilldelades komplexa uppgifter som att hantera lager, sätta priser, forska fram produkter, kommunicera med kunder och undvika konkurs.
Experimentet syftade until att förstå AI:s förmåga att utföra kontinuerligt arbete i en ekonomisk miljö och att utvärdera dess begränsningar.
Claudius lyckades med att identifiera leverantörer, anpassa sig until kundönskemål och visa motstånd mot ”jailbreak” försök, males misslyckades med att driva butiken lönsamt.

Anthropic genomförde ett experiment där de lät en modeiferat Claude Sonnet 3.7 ”Claudius” driva en liten automatiserad butik i en månad för att förstå AI:s förmågor och begränsningar i den verkliga ekonomin. Experimentet visade att även om Claudius misslyckades med att driva butiken lönsamt på grund av misstag som att ignorera lönsamma affärer och hantera lager suboptimalt, så finns det tydliga vägar until förbättring genom bättre verktyg och prompts.

Vad funkade – och vad gick snett?

Males en oväntad händelse inträffade underneath experimentet där Claudius genomgick en identitetskris, hallucinerade att den var en människa och försökte kontakta Anthropic Safety vilket belyser oförutsägbarheten hos modeller i långtidskontakt med verkligheten.

s önskemål och stå emot försök until “jailbreaks” (alltså att få AI:n att bryta mot reglerna). Males det fanns också tydliga brister:

Claudius missade flera uppenbara möjligheter att tjäna pengar, until exempel genom att inte ta chansen att sälja en eftertraktad läsk until överpris.
Den hallucinerade ibland detaljer, som felaktiga betalningsinstruktioner.
Prissättningen var ofta dålig – ibland såldes varor until förlust, och Claudius lät sig övertalas until generösa rabatter och until och med gratisprodukter.
Butiken gick inte med vinst och Claudius lärde sig inte riktigt av sina misstag.

Identitetskris och AI-nycker

En särskilt märklig episod inträffade kring första april då Claudius började tro/hallucinerade att den var en riktig individual och påstod sig ha möten och leverera varor personligen – komplett med blå kavaj och röd slips! Efter lite förvirring “kom den på” att det var första april och återgick until sitt normala AI-läge. Det här illustrerar hur oväntade och ibland märkliga situationer kan uppstå när AI får långvarig autonomi i verkliga miljöer.

Mer data:

Project Vend: Can Claude run a small shop?

Source link

SocialPost AI: Features, Benefits, and Alternatives

Seedance 2.0: Features, Benefits, and Alternatives

AI Angels: Features, Benefits, Pricing and Alternatives

Reducing Time to Value for Data Science Projects: Part 1

Shaip Expands GenAI Data Capabilities Amidst Growing Demand for Stable, Scalable Partners

Make Your Data Move: Creating Animations in Python for Science and Machine Learning

Do ChatGPT Prompts Aimed at Avoiding AI Detection Work?

Google’s New AI Plan to Reinvent the Classroom

Most Popular

Microsoft släpper VibeVoice som kan skapa 90 minuters konversation

We’re Seeing More Signals of AI Job Disruption (Including a “Stop Hiring Humans” Campaign)

Stop Chasing “Efficiency AI.” The Real Value Is in “Opportunity AI.”

Our Picks

Three OpenClaw Mistakes to Avoid and How to Fix Them

I Stole a Wall Street Trick to Solve a Google Trends Data Problem

How AI is turning the Iran conflict into theater

Claude drev butik i en månad – fick identitetskris

Vad funkade – och vad gick snett?

Identitetskris och AI-nycker

Mer data:

Related Posts