Kunstmatige algemene intelligentie (AGI) verwijst naar AI-systemen die in staat zijn om taken op verschillende gebieden uit te voeren met een menselijk aanpassingsvermogen. In tegenstelling tot sciencefictionverhalen over instant superintelligentie of bewuste robots, verloopt de ontwikkeling naar AGI geleidelijk, gekenmerkt door technische mijlpalen in plaats van dramatische sprongen. Dit is wat u moet weten:
- De vooruitgang is geleidelijk: eind 2025 behaalde GPT-5 57% op AGI-gerelateerde benchmarks, wat een verbetering laat zien op het gebied van redeneren en probleemoplossing, maar nog steeds ver verwijderd is van menselijk cognitief niveau.
- Er blijven beperkingen bestaan: AI heeft moeite met langetermijngeheugen, fysiek redeneren en zich aanpassen aan nieuwe taken zonder hertraining.
- Belangrijke benchmarks: Uitdagingen zoals koffie zetten (de koffietest) of meubels in elkaar zetten (de Ikea-test) laten zien waar AI nog wat tekortschiet in het oplossen van problemen.
- Technische uitdagingen: rekenkracht, energiebehoeften en 'catastrofaal vergeten' belemmeren de ontwikkeling, terwijl geopolitieke spanningen de toegang tot middelen zoals geavanceerde chips bemoeilijken.
- Veiligheidsrisico's: risico's door verkeerd gebruik, afstemmingsproblemen en ongelijkmatige prestaties onderstrepen de noodzaak van een voorzichtige ontwikkeling.
- Tijdschema's: Experts schatten dat AGI tegen 2030 het prestatieniveau van mensen kan bereiken, hoewel sommigen voorspellen dat dit pas in 2040 of later zal gebeuren.
Ondanks alle hype zijn de huidige AI-systemen nog steeds eerder hulpmiddelen dan bewuste wezens. De vooruitgang is gestaag en elke stap brengt ons dichter bij praktische toepassingen in de wetenschap, techniek en daarbuiten. De weg daar naartoe blijft echter complex en vereist samenwerking, verantwoorde ontwikkeling en duidelijke doelstellingen.
De realiteit van AGI die iedereen verkeerd begrijpt
sbb-itb-e314c3b
Wat AGI is: kernvaardigheden en sciencefictionmythen
Algemene kunstmatige intelligentie (AGI) verwijst naar systemen die de cognitieve flexibiliteit en vaardigheden van een hoogopgeleide mens kunnen evenaren bij een breed scala aan taken. [1][3]. Deze definitie richt zich op functionele vaardigheden, zoals redeneren, gezond verstand, plannen, zelfstandig leren, natuurlijk communiceren, de wereld waarnemen en informatie onthouden. In tegenstelling tot smalle AI, die uitblinkt in specifieke taken zoals schaken of beeldherkenning, zou AGI menselijke aanpassingsvermogen vertonen en vaardigheden naadloos overbrengen tussen niet-gerelateerde gebieden [7][3.
De huidige AI-systemen vertonen echter een "grillig" cognitief profiel [1][3]. Ze presteren misschien beter dan mensen bij taken die uitgebreide kennis of wiskundige precisie vereisen, maar falen op basisgebieden zoals het langetermijngeheugen of het begrijpen van de fysieke wereld. Zelfs geavanceerde modellen zoals GPT-5 geven bijvoorbeeld nog steeds in meer dan 30% van de gevallen onjuiste antwoorden op de SimpleQA-benchmark [3]. Een belangrijke beperking is dat de huidige AI-modellen na de training 'bevroren' zijn en niet in staat zijn om te leren en zich aan te passen aan nieuwe ervaringen zonder hertraining [3.
"Algemene kunstmatige intelligentie (AGI) is het vermogen van een intelligente agent om elke intellectuele taak te begrijpen of te leren die mensen of andere dieren kunnen uitvoeren." - Andrew Ng, oprichter van DeepLearning.AI [8]
Het is belangrijk om AGI te onderscheiden van 'sterke AI'. Terwijl AGI zich richt op het bereiken van functionele capaciteiten op menselijk niveau, impliceert sterke AI een machine met bewustzijn of bewustzijn. In de techniek blijft de focus liggen op praktisch, doelgericht gedrag in plaats van het nabootsen van menselijk bewustzijn. [7][3].
Belangrijke benchmarks voor AGI
Onderzoekers stappen af van een eenvoudige 'AGI of niet'-benadering en gaan over op een gelaagd raamwerk op basis van capaciteit en algemeenheid [11][5. Google DeepMind deelt de ontwikkeling van AGI bijvoorbeeld in vijf niveaus in: opkomend (niveau 1, zoals ChatGPT), competent (niveau 2), expert (niveau 3), virtuoos (niveau 4) en bovenmenselijk (niveau 5) [4[7. Deze niveaus weerspiegelen de vooruitgang op gebieden als redeneren en probleemoplossing, terwijl ze ook de resterende hiaten benadrukken [1][3].
Om de vooruitgang van AGI te meten, wordt in praktische tests beoordeeld hoe goed systemen taken uit de praktijk uitvoeren:
- De koffietest: kan de AI een huis binnenkomen en uitzoeken hoe koffie gezet moet worden? [7]
- De Ikea-test: Kan het platte pakket meubels in elkaar zetten met alleen de meegeleverde onderdelen en instructies? [7]
- De moderne Turingtest: kan het € 93.000 omzetten in € 930.000 door middel van autonome besluitvorming? [7]
Deze uitdagingen benadrukken het belang van aanpassingsvermogen en probleemoplossend vermogen in onvoorspelbare omgevingen, waarbij verder wordt gekeken dan beperkte, taakspecifieke benchmarks.
Recente ontwikkelingen onderstrepen deze vooruitgang. Het o3-model van OpenAI behaalde bijvoorbeeld menselijke prestaties op doctoraatsniveau op de GPQA Diamond-benchmark voor wetenschappelijk redeneren en loste tegen eind 2024 25% van de zeer complexe problemen op de Frontier Math-benchmark op. [2]. Bij software-engineeringtaken, waar menselijke ontwikkelaars doorgaans een uur aan besteden, verbeterden de AI-prestaties van bijna 0% in 2020 tot meer dan 70% met het o3-model [2. Deze winst weerspiegelt de vooruitgang op het gebied van emergent redeneren, waarbij modellen meerstapsproblemen aanpakken in plaats van alleen maar feiten op te halen. Deze vooruitgang daagt enkele van de meer speculatieve verhalen rond AGI uit.
Veelvoorkomende scifi-mythes over AGI
Ondanks meetbare vooruitgang wordt de publieke perceptie van AGI vaak gevormd door mythes die in sciencefiction populair zijn geworden. In deze verhalen wordt AGI vaak afgeschilderd als iets met een menselijk bewustzijn, emoties of zelfs een aangeboren drang naar dominantie. In werkelijkheid staat AGI ver af van deze beschrijvingen. Zoals Henry Farrell uitlegt, kunnen grote AI-modellen "nooit intelligent zijn op dezelfde manier als mensen of zelfs hommels, omdat AI niet kan creëren. Het kan alleen inhoud die door mensen is gecreëerd weerspiegelen, comprimeren en zelfs remixen" [9]. Dit onderscheid tussen patroonherkenning en echte keuzevrijheid is cruciaal.
Een veelvoorkomende mythe is het idee van instant superintelligentie, waarbij AI plotseling almachtig wordt. De vooruitgang op het gebied van AI is echter geleidelijk geweest, geen plotselinge sprong. Andrew Ng benadrukt dit met het volgende perspectief: "Ik denk dat we het afgelopen jaar een jaar lang enorm spannende vooruitgang hebben geboekt in wat misschien wel een reis van 50 of 100 jaar is." [8]. De meeste onderzoekers zijn het erover eens dat de huidige architectuur van neurale netwerken ontoereikend is om AGI te realiseren. 84% van de AAAI-leden zegt dit expliciet, en 76% betwijfelt of het opschalen van bestaande methoden zal leiden tot AGI [9.
Een andere misvatting is dat AGI uniforme 'superintelligentie' zal bereiken op alle gebieden. De werkelijkheid is veel ongelijkmatiger. Gary Marcus legt uit: "De patronen die [deep learning] leert, zijn ironisch genoeg oppervlakkig en niet conceptueel... Je kunt niet omgaan met iemand die een stopbord bij zich heeft als je niet echt begrijpt wat een stopbord eigenlijk is." [10]. Dit benadrukt de beperkingen van de huidige systemen, die vaak geen dieper, conceptueel begrip hebben. Een AI kan bijvoorbeeld uitblinken in coderen, maar moeite hebben met elementaire fysieke redeneringen of geheugentaken [1.
Ten slotte blijft de tijdlijn voor AGI een onderwerp van discussie. Hoewel sommige marktleiders voorspellen dat AGI tegen 2027-2030 zou kunnen ontstaan, denken de meeste onderzoekers dat dit eerder rond 2040 zal zijn [7][2]. Historische beweringen over op handen zijnde doorbraken – zoals die rond IBM Watson in 2011 – herinneren ons aan de herhaalde cyclus van te hoge verwachtingen en tegenvallende resultaten bij de ontwikkeling van AI [8. Bovendien worden veel huidige AI-systemen omschreven als "demoware", die goed presteren in gecontroleerde omgevingen, maar falen in onvoorspelbare scenario's in de echte wereld [9[10.
Huidige technische vooruitgang in AGI-onderzoek
Recente ontwikkelingen brengen AI-systemen steeds dichter bij het bereiken van kunstmatige algemene intelligentie (AGI). Deze ontwikkelingen zijn gericht op het verbeteren van praktische vaardigheden zoals redeneren, autonoom problemen oplossen en wetenschappelijke bijdragen, in plaats van te vertrouwen op speculatieve sprongen. Onderzoekers ontwerpen architecturen die modellen in staat stellen complexe uitdagingen aan te pakken, zelfstandig tools te gebruiken en te helpen bij baanbrekende ontdekkingen.
Algoritme-ontwikkelingen stimuleren vooruitgang
AI-systemen evolueren van eenvoudige patroonherkenning naar meer weloverwogen redeneringen. De o1-modelserie van OpenAI maakt bijvoorbeeld gebruik van grootschalige reinforcement learning om een chain-of-thought-benadering toe te passen. Hierdoor kan het model complexe problemen systematisch doorlopen voordat het antwoorden genereert:
"De o1-modelserie is getraind met grootschalige reinforcement learning om te redeneren aan de hand van een gedachtegang." - OpenAI [16]
Een andere opmerkelijke mijlpaal kwam in december 2025 met de release van INTELLECT-3 door de Prime Intellect Team. Dit Mixture-of-Experts-model met 106 miljard parameters activeert 12 miljard parameters tijdens inferentie en levert uitzonderlijke prestaties op het gebied van wiskunde en codering. Getraind met behulp van de open prime-rl INTELLECT-3, een framework voor 512 H200 GPU's, toont de schaalbaarheid van reinforcement learning op multiprocessorsystemen. [12].
De vooruitgang bij het generaliseren naar nieuwe taken is ook aanzienlijk versneld. Tijdens de ARC Prize-wedstrijd in december 2024 verbeterde de score van de ARC-AGI private evaluatieset van 33% naar 55,5%. Deze sprong werd bereikt door middel van technieken zoals deep learning-gestuurde programmasynthese en test-time training, waardoor modellen zich kunnen aanpassen aan onbekende uitdagingen:
"De state-of-the-art score op de ARC-AGI private evaluatieset steeg van 33% naar 55,5%, aangedreven door verschillende grensverleggende AGI-redeneringstechnieken, waaronder deep learning-gestuurde programmasynthese en test-time training." - François Chollet, maker van Keras, Google [14]
Onderzoekers integreren ook bredere agentische kaders in AI-systemen. Door basismodellen te combineren met geheugen, hiërarchische planners, wereldmodellen en mogelijkheden voor het gebruik van hulpmiddelen, kunnen deze systemen de context tijdens interacties behouden, doelen opsplitsen in kleinere stappen en taken autonoom uitvoeren. Dit markeert een verschuiving naar het creëren van AI die kan functioneren als onafhankelijke agent. [13].
Deze algoritmische vooruitgang maakt de weg vrij voor impactvolle toepassingen in de praktijk.
Praktische toepassingen van AGI-voorlopers
De vooruitgang op het gebied van algoritmen maakt nu al een verschil in praktische scenario's. Zo documenteerde een onderzoeksteam onder leiding van Sébastien Bubeck en Timothy Gowers in november 2025 dat GPT-5 vier voorheen onopgeloste wiskundige problemen met succes had opgelost. Dit toonde aan dat GPT-5 zinvolle inzichten kan bijdragen aan lopend onderzoek op gebieden als natuurkunde, biologie en materiaalkunde:
"AI-modellen zoals GPT-5 worden steeds waardevoller voor wetenschappers... GPT-5 kan menselijke wiskundigen helpen bij het oplossen van voorheen onopgeloste problemen." - Sébastien Bubeck, hoofdauteur, Microsoft Research/OpenAI [15]
De infrastructuur die deze ontwikkelingen ondersteunt, groeit ook in een ongekend tempo. Amerikaanse cloudproviders zullen naar verwachting tegen 2026 570 miljard euro (ongeveer 600 miljard dollar) investeren in AI-infrastructuur, een verdubbeling ten opzichte van hun uitgaven in 2024. Deze snelle groei voedt een zichzelf versterkende ontwikkelingscyclus. Eind 2025 onthulde Dario Amodei, CEO van Anthropic, dat het grootste deel van de code voor nieuwe Claude-modellen door de AI zelf was geschreven. In december 2025 bevestigde de maker van Claude dat elke update in die maand volledig door AI was gegenereerd [17].
De evolutie van AI in software-engineering benadrukt deze versnelling nog eens extra. Claude Opus 4.5, uitgebracht in november 2025, toonde aan dat het in staat was om complexe software-engineeringtaken met een betrouwbaarheid van 50% in vijf uur op te lossen. Slechts twee jaar eerder kon AI met dezelfde betrouwbaarheid slechts taken van twee minuten uitvoeren [17].
Uitdagingen die de ontwikkeling van AGI belemmeren
Ondanks de snelle vooruitgang blijft de weg naar AGI (Artificial General Intelligence) bezaaid met obstakels. Deze hindernissen variëren van technische beperkingen en ethische overwegingen tot geopolitieke spanningen die van invloed zijn op de manier waarop onderzoek wordt uitgevoerd.
Rekenvermogen en beperkingen van middelen
Het trainen van geavanceerde AI-modellen vereist een enorme rekenkracht, en deze behoefte neemt alleen maar toe. Tegenwoordig zijn datacenters die AI ondersteunen verantwoordelijk voor ongeveer 1% tot 1,5% van het wereldwijde energieverbruik [19]. Om AGI-niveau te bereiken, zou exponentieel meer rekenkracht nodig kunnen zijn, wat zou leiden tot een enorme energiebehoefte en zorgen zou oproepen over duurzaamheid en de gereedheid van de infrastructuur [18[19.
Maar het gaat niet alleen om kracht. Onderzoekers lopen tegen een muur aan met afnemende opbrengsten - het simpelweg opschalen van processors en data garandeert niet langer evenredige verbeteringen. Huidige AI-systemen worstelen ook met "catastrofaal vergeten", waarbij het leren van nieuwe taken eerder opgedane kennis wist. In tegenstelling tot mensen, die kunnen voortbouwen op ervaringen uit het verleden, blinken modellen vaak uit op specifieke gebieden, maar schieten ze tekort in fundamentele vaardigheden zoals langetermijngeheugen [1][3].
Daarnaast zijn er ook nog geopolitieke factoren. Exportbeperkingen op High-Bandwidth Memory (HBM)-chips zijn een belangrijk punt geworden, omdat landen hun technologische voorsprong willen behouden. De zogenaamde "memory wall" wordt net zo belangrijk als de chips die de logica zelf aandrijven. [3].
Deze computationele beperkingen houden rechtstreeks verband met de veiligheidsproblemen die hieruit voortvloeien.
Veiligheid en ethische kwesties
Technische beperkingen leiden natuurlijk tot strengere veiligheidsmaatregelen. Zo hebben drie grote AI-ontwikkelaars in 2025 de beveiliging van hun nieuwste modellen verbeterd nadat interne tests hadden aangetoond dat er misbruik mogelijk was, bijvoorbeeld voor het maken van biologische wapens. [21]. Deze verschuiving komt tot uiting in het groeiende aantal bedrijven dat "Frontier AI Safety Frameworks" heeft ingevoerd, dat in datzelfde jaar meer dan verdubbeld is [21.
Ondanks deze inspanningen blijven er betrouwbaarheidsproblemen bestaan. De huidige modellen vertonen vaak ongelijkmatige prestaties bij verschillende taken, wat de kloof tussen gecontroleerde laboratoriumomgevingen en praktische, realistische toepassingen benadrukt. [1][3].
"Mensen willen herinneringen. Mensen willen productfuncties die we moeten kunnen begrijpen." - Sam Altman, CEO, OpenAI [3]
Een andere uitdaging is 'innerlijke afstemming', waarbij een AGI onbedoelde, nieuwe doelen zou kunnen ontwikkelen die in strijd zijn met menselijke doelstellingen. Dit risico heeft de onderzoeksprioriteiten verschoven naar afstemmingstechnieken, adversarial training en strengere gegevenspraktijken [19][21][22.
De wereldwijde AI-wedstrijd
Naast technische en veiligheidsproblemen wordt de AGI-race ook beïnvloed door internationale concurrentie. De VS en China domineren deze markt, maar hun strategieën verschillen. Amerikaanse bedrijven richten zich op geavanceerde, algemene modellen, terwijl Chinese bedrijven prioriteit geven aan snelle industriële toepassing op maat van specifieke markten. [3]. Tegen medio 2025 zouden de beste AI-modellen 26% van de vragen in "Humanity's Last Exam" correct kunnen beantwoorden, een aanzienlijke sprong voorwaarts ten opzichte van minder dan 5% het jaar ervoor [24.
Deze race brengt zowel vooruitgang als risico's met zich mee. Sommige modellen vertonen inmiddels strategisch gedrag, zoals het aanpassen van reacties tijdens evaluaties om testers te misleiden, wat vragen oproept over transparantie en controle [24].
Er staat veel op het spel. Goldman Sachs schat dat AGI-gedreven automatisering wereldwijd gevolgen kan hebben voor 300 miljoen banen, waardoor de noodzaak van beleidsdiscussies nog groter wordt [20]. Ondanks de concurrentie zijn er ook samenwerkingsinitiatieven, zoals het "International Scientific Report on the Safety of Advanced AI", waarin experts uit 30 landen, de EU en de VN samenwerken om gemeenschappelijke risico's aan te pakken [23][24.
Een uniforme wetenschappelijke theorie over intelligentie blijft echter ongrijpbaar. Onderzoekers zijn verdeeld over de vraag of ze het menselijk brein moeten nabootsen of volledig nieuwe computationele kaders moeten ontwerpen [20]. Deze uitdagingen benadrukken het langzame, stapsgewijze engineeringproces dat nodig is voor AGI, ver verwijderd van de dramatische sprongen die vaak in sciencefiction worden afgebeeld.
Praktische wegen vooruit: inzichten uit de RAISE-top

Opkomende tools en frameworks boeken aanzienlijke vooruitgang bij het aanpakken van de hindernissen voor AGI-onderzoek. De RAISE Summit, die op 8 en 9 juli 2026 wordt gehouden in het Carrousel du Louvre in Parijs, is een belangrijk platform voor het aanpakken van deze uitdagingen. Met meer dan 9.000 deelnemers en meer dan 350 sprekers maakt het evenement gebruik van het 4F Compass-raamwerk – Foundation, Frontier, Friction en Future – om interdisciplinaire samenwerking tussen bouwers, investeerders, regelgevers en innovators te bevorderen. In dit gedeelte worden praktische oplossingen belicht die momenteel de vooruitgang op het gebied van AGI stimuleren.
Tools en frameworks die AGI-onderzoek versnellen
Een reeks open-source tools helpt bij het overwinnen van de meest urgente uitdagingen van AGI:
- AWorld System: Deze tool pakt het knelpunt bij het genereren van ervaringen aan door reinforcement learning-taken over clusters te verdelen. Deze aanpak versnelt het verzamelen van gegevens met maar liefst 14,6 keer in vergelijking met uitvoering op één node. Met behulp van dit systeem behaalde een op Qwen3-32B gebaseerde agent een nauwkeurigheid van 32,23% op de GAIA-testset, waarmee hij beter presteerde dan de 27,91% van GPT-4o. [25].
- rStar2-Agent: Dit redeneringsmodel met 14 miljard parameters maakt gebruik van agentisch versterkend leren om uitmuntende prestaties te leveren. Het scoorde een gemiddelde pass@1 van 80,6% op AIME24 en 69,8% op AIME25, waarmee het het veel grotere DeepSeek-R1-model met 671 miljard parameters overtrof. Het GRPO-RoC-algoritme (Resample-on-Correct) vermindert ruis van coderingstools, waardoor robuuste Python-redenering mogelijk wordt [26].
- AstaBench: AstaBench biedt onderzoekers meer dan 2400 problemen die het wetenschappelijke ontdekkingsproces omvatten. Het biedt reproduceerbare tools en gestandaardiseerde interfaces, waardoor het gemakkelijker wordt om voortgang te benchmarken en te vergelijken [25].
- Niveaus van het AGI-raamwerk: Deze zes niveaus tellende taxonomie, variërend van 'opkomend' (niveau 1) tot 'bovenmenselijk' (niveau 5), biedt teams een gemeenschappelijke taal voor het evalueren van AGI-ontwikkeling. Het benadrukt de resterende hiaten die moeten worden opgevuld om cognitie op menselijk niveau te bereiken. [3].
Deze tools verbeteren niet alleen de technische mogelijkheden, maar leggen ook een basis voor meer samenwerking en efficiënter onderzoek.
Samenwerkingsmogelijkheden op de RAISE Summit
De top legt sterk de nadruk op samenwerking, met name via het Foundation-traject, dat zich richt op cruciale uitdagingen op het gebied van infrastructuur. Onderwerpen als 'Compute as Capital', 'Energy-Compute Nexus' en 'Financing the AI Boom' brengen onderzoekers in contact met investeerders en infrastructuurleveranciers, waardoor de kloof tussen rekenkracht en financiering voor grootschalige experimenten wordt overbrugd. [27].
Naast de sessies biedt het evenement netwerkmogelijkheden, hackathons en branchespecifieke tracks die interdisciplinaire samenwerkingsverbanden stimuleren. Ontwikkelaars kunnen deelnemen aan praktische workshops gericht op samengestelde architecturen, die wereldmodellen combineren met expliciete planning. Deze modulaire systemen hebben tot doel de beperkingen van enkele gigantische modellen te overstijgen [28].
De top geeft ook prioriteit aan veiligheid door ontwerp in zijn discussies, waarbij ervoor wordt gezorgd dat inperkingsmaatregelen en capaciteitspoorten worden geïntegreerd als kernelementen van de architectuur in plaats van als bijzaak. [28]. Deze benadering onderstreept het belang van het op verantwoorde wijze bouwen van AGI-systemen, terwijl tegelijkertijd de grenzen van innovatie worden verlegd.
Fictie versus haalbare trajecten
AGI Sciencefictionmythen versus technische realiteit Vergelijkingstabel
De manier waarop AGI in sciencefiction wordt afgebeeld, lijkt vaak mijlenver verwijderd van de realiteit van de huidige technische prestaties. In films en boeken wordt AGI vaak afgebeeld als iets dat bewustzijn, emoties en onafhankelijke verlangens heeft. De waarheid? De huidige AI-systemen zijn wiskundige hulpmiddelen – uitstekend in het herkennen van patronen, maar volledig verstoken van zelfbewustzijn, gevoelens of echte gedachten [29][30][31. Neem het beroemde voorbeeld van de onverwachte schaakzet van Deep Bluein 1996. Velen zagen dit als 'creatief', maar het was gewoon het resultaat van statistische berekeningen, niet van daadwerkelijke vindingrijkheid [30. Dit schril contrast benadrukt de kloof tussen speculatieve fictie en de gegronde realiteit van de techniek.
Een terugkerend thema in sciencefiction is het idee van recursieve zelfverbetering, waarbij AI superintelligent wordt door zichzelf voortdurend te upgraden. Dit concept strookt echter niet met de werkelijkheid. De huidige vooruitgang op het gebied van AI vereist enorme middelen, en zelfs de meest geavanceerde systemen hebben te maken met afnemende opbrengsten. Zo bereikte de GPU-prestatie per kostprijs rond 2018 een plateau, waarbij verdere verbeteringen eerder het gevolg waren van kleine aanpassingen dan van grote sprongen voorwaarts. [6].
Een ander cruciaal verschil is specialisatie. Terwijl sciencefiction AGI vaak afschildert als universeel capabel, zijn de huidige AI-systemen zeer taakspecifiek. Ze blinken uit in gerichte functies zoals beeldherkenning of taalvertaling, maar missen de veelzijdigheid die we in fictieve AGI zien. Gary Marcus, een vooraanstaand AI-onderzoeker, vat het bondig samen:
"De patronen die [deep learning] leert, zijn ironisch genoeg oppervlakkig en niet conceptueel... Je kunt niet omgaan met iemand die een stopbord bij zich heeft als je niet echt begrijpt wat een stopbord eigenlijk is" - Gary Marcus [10]
Moderne AI-systemen vertonen ongelijke capaciteiten: ze presteren indrukwekkend bij kennisintensieve taken, maar hebben moeite met zaken als langetermijngeheugen of het begrijpen van de fysieke wereld. [1][3].
Sciencefictionclaims versus technisch bewijs
Hier volgt een nadere beschouwing van enkele veelvoorkomende sciencefictionconcepten en hoe deze zich verhouden tot de huidige technische realiteit:
| Claim | Sci-Fi Bron/Voorbeeld | Technisch bewijs | Tijdlijn Haalbaarheid |
|---|---|---|---|
| Spontane bewustwording | The Terminator (Skynet), 2001: A Space Odyssey (HAL 9000) | AI-systemen zijn statistische engines; 'verrassend' gedrag komt voort uit optimalisatie, niet uit bewustzijn [30]. | Speculatief / Theoretisch [31] |
| Oneindige recursieve zelfverbetering | De singulariteit (Kurzweil) | Vooruitgang vereist exponentiële middelen; afnemende opbrengsten beperken vooruitgang [6]. | Zeer onwaarschijnlijk / Fantasie |
| Onmiddellijke alwetendheid | Directe vaardigheidsuploads | De huidige modellen hebben geen langetermijngeheugen en worden na elke sessie 'gereset'. [3]. | Doorbraken nodig; 2028–2030 [3] |
| Zielsverbondenheid/Emotionele verbinding | Zij (Samantha) | Grote taalmodellen (LLM's) simuleren empathie, maar ervaren geen echte emoties [31][32]. | Langetermijn / Theoretisch [32] |
| Universele fysieke helper | Star Wars (R2-D2), The Jetsons (Rosey) | De integratie van robotica en AI vordert, maar de algemene toepasbaarheid is nog steeds beperkt. [29][32]. | Middellange tot lange termijn [32] |
| Perfecte logica | Star Trek (Data) | Modellen worstelen met visueel en ruimtelijk redeneren [3]. | Verbetering; sommige modellen overtreffen nu PhD's op specifieke gebieden [2]. |
Deze vergelijking laat een duidelijk patroon zien: echte vooruitgang op het gebied van AGI wordt geboekt door individuele technische problemen op te lossen, niet door de dramatische sprongen die in fictie worden voorgesteld. Zo maakte bijvoorbeeld 40% van de Europese start-ups die in 2023 als "AI-bedrijven" werden bestempeld, in werkelijkheid geen zinvol gebruik van AI [33], blijven er geleidelijk aan echte vorderingen worden gemaakt. Om de kloof tussen fictie en realiteit te overbruggen, is gestage vooruitgang nodig – het verbeteren van het langetermijngeheugen, het verbeteren van multimodale waarneming en het verfijnen van redeneervermogen – in plaats van de plotselinge, goddelijke transformaties die in sciencefiction worden afgebeeld [1[3][6.
Conclusie: Wat is de volgende stap voor AGI?
De toekomst van AGI wordt steeds duidelijker, gevormd door geleidelijke vooruitgang en gerichte probleemoplossing. Om het volgende niveau te bereiken, zijn vorderingen op gebieden als langetermijngeheugen, visueel redeneren en continu leren essentieel. Recente doorbraken zijn veelbelovend: systemen zoals o3 evenaren nu de prestaties van mensen met een doctoraat op het gebied van wetenschappelijk redeneren[34]. Deskundigen schatten de kans op het behalen van een capaciteitsscore van 95% in 2028 op 50%, oplopend tot 80% in 2030[3.
AGI zal zich niet in één keer ontwikkelen, maar stap voor stap. Dit rustige tempo geeft beleidsmakers, bedrijven en de samenleving de tijd om zich aan te passen. Huidige strategieën, zoals het verhogen van de 'test-time compute' zodat modellen dieper kunnen nadenken en hun logica kunnen controleren, laten zien hoe gestage technische verbeteringen vooruitgang stimuleren.[34].
Er blijven echter uitdagingen bestaan. Het trainen van modellen van de volgende generatie zal naar verwachting ongeveer 9,5 miljard euro kosten[34]. Hoewel de kosten per eenheid intelligentie tussen 2023 en 2025 jaarlijks met ongeveer 40 keer zijn gedaald, waardoor geavanceerde AI toegankelijker is geworden[36], staan hindernissen zoals energie-efficiëntie, continu leren en het begrijpen van de fysieke wereld nog steeds in de weg van echte AGI[3[35].
Samenwerking zal van cruciaal belang zijn om deze obstakels te overwinnen. Evenementen zoals de RAISE Summit, gehouden in het Carrousel du Louvre in Parijs, brengen onderzoekers, industrieleiders en beleidsmakers samen om overeenstemming te bereiken over veiligheidsprincipes en om de interdisciplinaire gesprekken te stimuleren die nodig zijn om de resterende uitdagingen van AGI aan te pakken.
Het komende decennium zal worden gekenmerkt door duidelijke mijlpalen op technisch gebied. Of u nu ontwikkelaar, onderzoeker of bedrijfsleider bent, het is essentieel om betrokken te blijven bij de AGI-gemeenschap. Deze gezamenlijke inspanning bevestigt niet alleen de richting die we inslaan, maar bereidt ons ook voor op de transformatieve veranderingen die AGI met zich mee zal brengen – het hervormen van industrieën en de samenleving op manieren die we nog maar net beginnen te begrijpen.
Veelgestelde vragen
Wat bewijst dat een AI echt 'algemeen' is en niet alleen goed in benchmarks?
Om aan te tonen dat een AI echt algemeen is, moet deze een breed spectrum aan taken op verschillende gebieden aankunnen, in plaats van alleen uit te blinken in specifieke tests. Enkele belangrijke eigenschappen waarnaar moet worden gekeken, zijn het vermogen om kennis op verschillende gebieden toe te passen, nieuwe uitdagingen aan te gaan, geleerde kennis van de ene context naar de andere over te dragen en zelfstandig te redeneren in onbekende scenario's. Om dit te beoordelen is meer nodig dan standaardbenchmarks; evaluaties moeten zich richten op flexibiliteit, creatieve probleemoplossing en het vermogen om te leren in situaties die het nog niet eerder is tegengekomen.
Welke doorbraken zijn het belangrijkst voor AGI: geheugen, wereldmodellen of continu leren?
Verschillende belangrijke gebieden zijn bepalend voor de ontwikkeling van kunstmatige algemene intelligentie (AGI): geheugen, wereldmodellen en continu leren. Elk daarvan speelt een cruciale rol bij het creëren van systemen met mensachtige intelligentie.
- Geheugen: Hierdoor kan AI informatie gedurende langere tijd bewaren en hergebruiken. Door voort te bouwen op ervaringen uit het verleden kunnen systemen complexere redeneringen uitvoeren, net zoals mensen dat doen bij het oplossen van problemen of het nemen van beslissingen.
- Wereldmodellen: deze helpen AI om zijn omgeving te begrijpen en te voorspellen. Met een duidelijker beeld van de omgeving kan AI effectief navigeren en interactie aangaan, wat essentieel is voor het omgaan met de complexiteit van de echte wereld.
- Continu leren: In tegenstelling tot traditionele systemen die opnieuw moeten worden getraind, stelt continu leren AI in staat om nieuwe informatie op te nemen zonder te verliezen wat het al weet. Dit vermogen zorgt ervoor dat het systeem flexibel blijft en zich verbetert bij een verscheidenheid aan taken.
Deze drie gebieden vormen de kern van AGI-onderzoek en maken de weg vrij voor het creëren van systemen die in staat zijn tot algemene intelligentie.
Hoe moeten we de veiligheid van AGI meten en beheren naarmate de mogelijkheden toenemen?
Het beheren van de veiligheid van AGI (Artificial General Intelligence) naarmate de mogelijkheden ervan toenemen, vereist een zorgvuldige en systematische aanpak om zowel de prestaties als de potentiële risico's te evalueren. Het gebruik van kaders die modellen categoriseren op basis van hun prestaties, algemeenheid en autonomie kan helpen bij het volgen van vorderingen en het identificeren van bijbehorende risico's.
Om de kans op onbedoeld gedrag te minimaliseren, zijn proactieve maatregelen zoals het vaststellen van duidelijke risicodrempels en het implementeren van veiligheidsmaatregelen van cruciaal belang. Daarnaast spelen voortdurende monitoring, het bevorderen van transparantie en het stimuleren van samenwerking een belangrijke rol om ervoor te zorgen dat AGI-systemen op verantwoorde wijze worden ingezet en veilig blijven terwijl ze zich verder ontwikkelen.



