Forskare från Tsinghua College har utvecklat en ny AI-modell som kan träna sig själv utan någon mänsklig information. Detta genombrott, kallat ”Absolute Zero Reasoner” (AZR), öppnar upp för nya möjligheter inom AI-forskningen och kan leda until mer oberoende och kapabla AI-system i framtiden.
- Självlärande kapacitet: AZR kan utvecklas och förbättras utan mänsklig inblandning. Den lär sig genom att utföra uppgifter och verifierar sina egna resultat through en course of där den belönas för korrekthet.
- Ingen beroende av externa information: Denna metod är unik genom att den inte kräver ”gold labels” (fördefinierade information) eller mänskligt definierade frågor för att kunna prestera på hög nivå.
- Ständig förbättring: Genom att utföra uppgifter och få suggestions på sina resultat kan AZR hela tiden justera och förbättra sina algoritmer, vilket kan leda until att den utvecklar superintelligens.
Denna nya metod möjliggör för AI-system att skapa egna träningsdata och att lära sig genom en kontinuerlig feedbackloop.
Utan mänsklig datainmatning
Tänk dig en pianist som lär sig spela utan lärare, noter eller inspelningar – bara genom att experimentera med tangenterna och lyssna på resultatet. På liknande sätt fungerar Absolute Zero Reasoner helt utan mänsklig information. Traditionella AI-system är som elever som behöver tusentals exempel från lärare för att lära sig, males AZR bryter denna beroendekedja genom att använda en ”självspelsloop”. Systemet växlar mellan två curler: en som föreslår utmaningar (kodningsproblem, matematiska ekvationer) och en som försöker lösa dem. Python-kodkörning fungerar som en objektiv domare som avgör om lösningarna är korrekta, vilket ger modellen direkt suggestions utan mänsklig inblandning.

Trots de lovande resultaten finns det fortfarande utmaningar. AZR är i sin linda och forskarna antyder att det finns rum för förbättring, särskilt inom mer komplexa resonemang. Dessutom väcker helt självlärande AI etiska frågor om kontroll och övervakning.