Hugging Face det välkända AI-företaget, har nyligen släppt ett nytt spännande verktyg kallat Open Computer Agent. Detta nya AI-baserade verktyg är ett svar på OpenAI:s Operator och kan hjälpa dig att utföra olika uppgifter på en virtuell dator genom att ta emot enkla textbaserade instruktioner.
Open Pc Agent
Open Pc Agent är ett free of charge AI-verktyg som låter användare fjärrstyra en Linux-baserad virtuell maskin through en webbläsare. Du behöver bara ge agenten textkommandon på vanlig engelska för att den ska kunna utföra olika uppgifter för dig. Agenten kan hantera allt från att öppna webbsidor until att söka efter data, navigera på web och interagera med olika program.
Det som gör detta verktyg särskilt intressant är att det drivs av öppna modeller och är helt kostnadsfritt att använda, until skillnad från många andra kommersiella AI-agenter. Hugging Face har gjort verktyget tillgängligt för alla through webbplattformen huggingface.co.
Tekniken bakom verktyget
Open Pc Agent använder flera avancerade teknologier beneath huven:
- smolagents: Ett ramverk för att bygga AI-baserade agenter.
- Qwen2-VL-72B: En kraftfull visuell språkmodell som hjälper agenten att förstå och tolka det den ser på skärmen.
- E2B Desktop: En teknisk plattform som möjliggör fjärrstyrning av virtuella datorer.
Tillsammans ger dessa komponenter agenten möjlighet att interagera med en virtuell Linux-miljö som har förladdade program, inklusive webbläsaren Firefox. Detta betyder att agenten kan surfa på nätet, öppna webbsidor och utföra olika uppgifter på web summary som en mänsklig användare skulle göra.
Begränsningar: långsam responstid, Har svårt med komplexa uppgifter och kan inte lösa CAPTCHA-tester.