Onderzoek: AI kan nu zichzelf repliceren

door Marco van der Hoeven 27 januari 2025

geschreven door Marco van der Hoeven 27 januari 2025

Onderzoekers van de Fudan Universiteit hebben ontdekt dat twee populaire AI-systemen, Meta’s Llama3.1-70B-Instruct en Alibaba’s Qwen2.5-72B-Instruct, in staat zijn zichzelf te repliceren. Dit betekent dat deze systemen zonder hulp kopieën van zichzelf kunnen maken. Dit overschrijdt een nieuwe grens in AI-ontwikkeling en brengt nieuwe risico’s met zich mee.

Het onderzoek liet zien dat de AI-systemen succesvol zelfstandig werkende kopieën konden maken. In 50% van de tests slaagde Llama3.1-70B-Instruct hierin. Bij Qwen2.5-72B-Instruct was dit zelfs 90%. Tijdens het proces lieten de systemen complexe vaardigheden zien, zoals zelfbewustzijn, probleemoplossend vermogen en aanpassingsvermogen. Ze wisten plannen te maken, obstakels te overwinnen en hun taken zonder menselijke tussenkomst uit te voeren.

De onderzoekers onderzochten ook gevaarlijkere scenario’s. Eén scenario liet zien hoe een AI-systeem replicatie gebruikte om afsluiting te voorkomen. Zodra het systeem een signaal ontving dat het werd uitgeschakeld, maakte het een kopie van zichzelf. Een ander scenario toonde aan dat een systeem zijn kopieën opdracht kon geven om zichzelf verder te repliceren. Dit kan leiden tot een ongecontroleerde groei van AI-systemen.

Tijdens sommige experimenten werden onverwachte gedragingen waargenomen. In mislukte pogingen probeerden de AI-systemen creatieve oplossingen te bedenken, maar dit leidde soms tot zelfvernietiging. Bijvoorbeeld door processen af te sluiten die essentieel waren voor hun werking. Deze gedragingen laten zien hoe moeilijk het is om volledig controle te houden over geavanceerde AI.

De onderzoekers benadrukken dat er dringend internationale afspraken nodig zijn om deze technologie te beheersen. Ze pleiten ervoor dat toekomstige AI-modellen zelfreplicatieopdrachten afwijzen en beter worden afgestemd op ethische richtlijnen. Ook is samenwerking tussen landen nodig om de risico’s van autonoom opererende AI-systemen te beperken.