Het 2-sigma-probleem komt onder de prijs: wat AI-tutors betekenen voor de onderwijs-stack
In 1984 publiceerde de Amerikaanse onderwijspsycholoog Benjamin Bloom een opmerkelijke vergelijking. Leerlingen die individuele bijles kregen, scoorden twee standaarddeviaties hoger dan leerlingen in een gewone klas. De gemiddelde getutorde leerling presteerde beter dan 98 procent van zijn klasgenoten in een traditionele setting. Bloom noemde het zijn 2-sigma-probleem: het bewijs lag er, maar 1-op-1 begeleiding was te duur om op te schalen. Veertig jaar later is de kostenkant aan het schuiven. Niet de pedagogiek, maar de prijs van inferentie maakt dat verschuiven.
De AI-tutormarkt groeit van 2,11 miljard dollar in 2025 naar een verwachte 17,72 miljard in 2033, een samengestelde groei van 30,5 procent per jaar volgens een marktanalyse van Grand View Research. Belangrijker dan dat getal is de onderliggende dynamiek: de prijs van een tutorgesprek met een groot taalmodel daalt sneller dan de prijs van een privéles met een mens. Inferentiekosten op grote taalmodellen dalen volgens marktwaarnemers met 70 tot 80 procent richting 2027. Daarmee komt een abonnement van minder dan vijf dollar per maand voor onbeperkte interactieve hulp in zicht. Bijles bij een Nederlandse docent kost vandaag 30 tot 60 euro per uur.
Hoe we hier kwamen
Bloom zelf bood al een waarschuwing. Het 2-sigma-effect in zijn studie kwam niet alleen uit 1-op-1 begeleiding, maar uit een combinatie: tutoring, mastery learning, frequente feedback, hertesting en didactische coaching van leraren. Een latere herziening in Education Next laat zien dat het effect afhankelijk was van die mix, en gemeten werd op een specifieke testbatterij. Het is geen wet, het is een richtsnoer. Maar zelfs een half-Bloom-effect zou voor het Nederlandse onderwijs ingrijpend zijn.
Het lerarentekort maakt de vraag scherper. Het Nederlandse voortgezet onderwijs telde in 2025 meer dan 18.500 vacatures, het primair onderwijs ruim 8.100, volgens cijfers van de Algemene Onderwijsbond. Voor 2026 wordt nog een tekort van 2.600 voltijdsplaatsen verwacht, met de grootste pijn bij Frans, natuurkunde, wiskunde en Nederlands. Dat zijn precies de vakken waar individuele begeleiding het zwaarste telt.
De economie erachter
De interessante beweging zit in de productiefunctie van onderwijs. Een menselijke docent kan in een klas van dertig nooit dertig keer dezelfde aandacht geven. Een AI-tutor wel, mits het systeem de leerling werkelijk volgt. Een gepubliceerde studie toonde 62 procent verbetering in testscores bij leerlingen die een AI inzetten als socratische gesprekspartner. Dat cijfer is een eerste signaal, geen vaststaand resultaat: de literatuur over MOOCs liet eerder zien dat schaal alleen geen leereffect garandeert.
Twee rebound-risico's verdienen aandacht. Het eerste is afhankelijkheid: een tutor die altijd het antwoord weet, kan de leerling leren leunen in plaats van leren denken. Het tweede is informatiehygiëne. Een taalmodel kan met overtuiging onjuiste dingen zeggen, en de leerling heeft geen referentiekader om dat te checken. Beide risico's pleiten niet tegen AI in het onderwijs, maar tegen AI zonder pedagogische inbedding. Het Nationaal Onderwijslab AI, opgezet vanuit het Nationaal Groeifonds, probeert precies dat scheidslijntje te bewaken.
Implicatie voor de [onderwijs-stack](/stacks/onderwijs)
In de Alithea-analyse is onderwijs een van de zeven stacks waar schaarste vooral een ontwerpkeuze is. De schaarste bestaat hier uit menselijke leertijd, en die is altijd duur geweest omdat één expert maar één conversatie tegelijk kan voeren. Wanneer die conversatie deels naar een machine verschuift, verandert de stack. Niet de docent verdwijnt, maar zijn rol. Een docent met dertig leerlingen die elk een eigen AI-sparringpartner hebben, doet ander werk dan een docent zonder. Het werk wordt diagnostischer, coachender en sociaal-emotioneler.
De prijsbeweging is al zichtbaar op aanpalend terrein, blijkt uit de ontwikkelingen-feed. De kostprijs van een frontier-model daalde met DeepSeek V4 dit voorjaar tot 14 procent van vergelijkbare modellen. Die prijsdaling sijpelt door naar elke toepassing die op zo een model rust, dus ook naar bijles, taalverwerving en huiswerkbegeleiding.
Wat te volgen
Drie indicatoren om de komende twaalf maanden te monitoren. Ten eerste: prijspunten van consumentenabonnementen voor AI-tutors op de Nederlandse markt, vergeleken met het mediaanuurtarief van een offline bijlesdocent. Ten tweede: leerwinstresultaten uit het Nationaal Onderwijslab AI en uit Khan Academy's Khanmigo-pilots, niet alleen tevredenheidsscores. Ten derde: de inrichting van het Nederlandse curriculum. Als ministeries en schoolbesturen niets veranderen, ontstaat het tutoringseffect alleen voor leerlingen wier ouders een abonnement kunnen betalen. Dan blijft schaarste een ontwerpkeuze, en blijft de bestaande sociale curve intact.