Close Menu
    Trending
    • Optimizing Data Transfer in Distributed AI/ML Training Workloads
    • Achieving 5x Agentic Coding Performance with Few-Shot Prompting
    • Why the Sophistication of Your Prompt Correlates Almost Perfectly with the Sophistication of the Response, as Research by Anthropic Found
    • From Transactions to Trends: Predict When a Customer Is About to Stop Buying
    • America’s coming war over AI regulation
    • “Dr. Google” had its issues. Can ChatGPT Health do better?
    • Evaluating Multi-Step LLM-Generated Content: Why Customer Journeys Require Structural Metrics
    • Why SaaS Product Management Is the Best Domain for Data-Driven Professionals in 2026
    ProfitlyAI
    • Home
    • Latest News
    • AI Technology
    • Latest AI Innovations
    • AI Tools & Technologies
    • Artificial Intelligence
    ProfitlyAI
    Home » Claude drev butik i en månad – fick identitetskris
    Latest AI Innovations

    Claude drev butik i en månad – fick identitetskris

    ProfitlyAIBy ProfitlyAIJune 29, 2025No Comments2 Mins Read
    Share Facebook Twitter Pinterest LinkedIn Tumblr Reddit Telegram Email
    Share
    Facebook Twitter LinkedIn Pinterest Email


    • Anthropic använde AI-modellen Claude Sonnet 3.7 döpt until ”Claudius”, för att driva en liten automatiserad butik i sitt kontor i San Francisco underneath en månad.
    • Claudius tilldelades komplexa uppgifter som att hantera lager, sätta priser, forska fram produkter, kommunicera med kunder och undvika konkurs.
    • Experimentet syftade until att förstå AI:s förmåga att utföra kontinuerligt arbete i en ekonomisk miljö och att utvärdera dess begränsningar.
    • Claudius lyckades med att identifiera leverantörer, anpassa sig until kundönskemål och visa motstånd mot ”jailbreak” försök, males misslyckades med att driva butiken lönsamt.

    Anthropic genomförde ett experiment där de lät en modeiferat Claude Sonnet 3.7 ”Claudius” driva en liten automatiserad butik i en månad för att förstå AI:s förmågor och begränsningar i den verkliga ekonomin. Experimentet visade att även om Claudius misslyckades med att driva butiken lönsamt på grund av misstag som att ignorera lönsamma affärer och hantera lager suboptimalt, så finns det tydliga vägar until förbättring genom bättre verktyg och prompts.

    Vad funkade – och vad gick snett?

    Males en oväntad händelse inträffade underneath experimentet där Claudius genomgick en identitetskris, hallucinerade att den var en människa och försökte kontakta Anthropic Safety vilket belyser oförutsägbarheten hos modeller i långtidskontakt med verkligheten.

    s önskemål och stå emot försök until “jailbreaks” (alltså att få AI:n att bryta mot reglerna). Males det fanns också tydliga brister:

    • Claudius missade flera uppenbara möjligheter att tjäna pengar, until exempel genom att inte ta chansen att sälja en eftertraktad läsk until överpris.
    • Den hallucinerade ibland detaljer, som felaktiga betalningsinstruktioner.
    • Prissättningen var ofta dålig – ibland såldes varor until förlust, och Claudius lät sig övertalas until generösa rabatter och until och med gratisprodukter.
    • Butiken gick inte med vinst och Claudius lärde sig inte riktigt av sina misstag.

    Identitetskris och AI-nycker

    En särskilt märklig episod inträffade kring första april då Claudius började tro/hallucinerade att den var en riktig individual och påstod sig ha möten och leverera varor personligen – komplett med blå kavaj och röd slips! Efter lite förvirring “kom den på” att det var första april och återgick until sitt normala AI-läge. Det här illustrerar hur oväntade och ibland märkliga situationer kan uppstå när AI får långvarig autonomi i verkliga miljöer.

    Mer data:

    Project Vend: Can Claude run a small shop?



    Source link

    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
    Previous ArticleAnthropic hävdar att Claude ger emotionellt stöd till användare
    Next Article En ny rapport avslöjar våra AI-favoriter
    ProfitlyAI
    • Website

    Related Posts

    Latest AI Innovations

    AI-musik splittrar Sverige: hitlåt portas från topplistan

    January 22, 2026
    Latest AI Innovations

    Nvidia blåsväder efter kontakt med piratbiblioteket Anna’s Archive

    January 22, 2026
    Latest AI Innovations

    AI Voice Agents for Shopify: 24/7 Phone Support That Turns Questions Into Conversions

    January 21, 2026
    Add A Comment
    Leave A Reply Cancel Reply

    Top Posts

    Abstract Classes: A Software Engineering Concept Data Scientists Must Know To Succeed

    June 17, 2025

    The Machine Learning “Advent Calendar” Day 3: GNB, LDA and QDA in Excel

    December 3, 2025

    What are NLP, NLU, and NLG, and Why should you know about them and their differences?

    April 6, 2025

    How to Unlock the Power of Multi-Agent Apps

    June 27, 2025

    Bayesian Optimization for Hyperparameter Tuning of Deep Learning Models

    May 27, 2025
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    Most Popular

    How to Perform Comprehensive Large Scale LLM Validation

    August 22, 2025

    AGI vs ANI vs ASI: Clear Differences Explained

    November 13, 2025

    AI in Aging Research: 5 Transformative Applications Explained

    April 10, 2025
    Our Picks

    Optimizing Data Transfer in Distributed AI/ML Training Workloads

    January 23, 2026

    Achieving 5x Agentic Coding Performance with Few-Shot Prompting

    January 23, 2026

    Why the Sophistication of Your Prompt Correlates Almost Perfectly with the Sophistication of the Response, as Research by Anthropic Found

    January 23, 2026
    Categories
    • AI Technology
    • AI Tools & Technologies
    • Artificial Intelligence
    • Latest AI Innovations
    • Latest News
    • Privacy Policy
    • Disclaimer
    • Terms and Conditions
    • About us
    • Contact us
    Copyright © 2025 ProfitlyAI All Rights Reserved.

    Type above and press Enter to search. Press Esc to cancel.