Amsterdam University Press 2003

advertisement
OVER DE GESCHIEDENIS,
FILOSOFIE & SOCIOLOGIE
VAN DE WETENSCHAP
S DINKGREVE
INHOUDSOPGAVE

Inleiding

Overzicht:
Wetenschapsfilosofie
6

Descartes:
De Analytische Meetkunde
33

Newton:
De Zwaartekracht
40

Maxwell:
Het Ether-model
46

Hertz:
Scientific Images
50

Duhem:
Het Karakter van de Wetenschap
76

Einstein:
Het Foton en het EPR-experiment
80

Epiloog
88

Referenties
92
2
Alle citaten zijn voorzien van een letter en een cijfer. De letter is een verwijzing naar de literatuurlijst
achterin en het cijfer geeft de bladzijde weer van het betreffende boek, waarin dit citaat te vinden is.
INLEIDING
Dit is de ingekorte versie van 400 pagina’s tellend werk, dat ik gedurende een jaar tijd heb
geschreven. Hoewel de totale versie evenveel aandacht gaf aan filosofische, geschiedkundige,
sociologische en natuur-wiskundige onderwerpen, is in deze verkorting vooral de nadruk gelegd op
de natuurkundige aspecten, hoewel ik zal proberen de rode draad van het origineel te behouden.
Wat is deze rode draad? Het doel was het schrijven van een werk, dat genoeg geschiedenis, filosofie
en sociologie van de wetenschap zou bevatten, dat een natuurkundige lezer voldoende op de hoogte
is van de belangrijkste resultaten uit deze vakgebieden. Maar omdat de gemiddelde natuurkundige
het nut niet ziet van deze filosofische kennis, zal ik het als mijn belangrijkste taak zien om te betogen
dat de filosofie wel degelijk zijn sporen heeft nagelaten in de wetenschap en zelfs belangrijke dingen
onderzocht heeft, die belangrijk kunnen zijn voor de dagelijkse praktijk van de wetenschapper.
Wetenschappers weten precies hoe ze met wetenschap om moeten gaan, maar wat is deze
wetenschap nu precies en waarom werkt het zo goed? Dit zijn vragen die een wetenschapsfilosoof
zich stelt. Wat is logica? Waarom werkt de wiskunde zo goed? Wat zijn de karakteristieken van een
goed gedachte-experiment? Wanneer is iets experimenteel bewezen? Deze wetenschapsfilosofische
vragen en meer zullen we in dit werk bestuderen.
Een andere belangrijke vraag is: in hoeverre beschrijft de wetenschap realiteit? Verklarende en
voorspellende waarden van de wetenschap en de toenemende controle over de natuur zijn enkele
redenen, die zo nu en dan gegeven worden om de monopoliepositie van de wetenschap op het
vinden van realiteit te verklaren. Maar we zullen zien dat dit soort redenen niet voldoende zijn om de
2
zekerheid van de wetenschappelijke kennis te waarborgen. Zelfs niet in onze beste theorieën, zelfs
niet in de fundamentele wiskunde.
Er is mij meerdere malen door wetenschappers verteld dat de filosofie niet echt iets opgeleverd
heeft, dat interessant is voor de natuurkundige, terwijl dit andersom wel sterk het geval is geweest.
Toch is dit niet waar. De logica, een van de belangrijkste subgebieden van de filosofie, heeft in de
20ste eeuw bijvoorbeeld een enorme verandering doorgemaakt. Een aantal eeuwen terug had Kant
nog gedacht dat de logica af was, maar in de 20ste bleken hier een aantal revolutionaire
veranderingen aan te komen. Zo vond Russell, in een werk waarin hij juist het tegenovergestelde
probeerde aan te tonen, dat het niet mogelijk is wiskunde terug te brengen tot de logica, omdat de
wiskunde een aantal onlogische paradoxen kent, die niet tot de logica gereduceerd kunnen worden[a,
40-41]
. Dit was het einde van een eeuwenoud vooroordeel. Tarski liet in zijn versie van de theorie van
Gödel zien, dat in de gewone rekenkunde er logische juiste theorema’s bestaan, die niet uit deze
axioma’s afgeleid kunnen worden, hoe men de axioma’s ook kiest[b, H2]. Brouwer vond dat het
principe van de uitgesloten derde, een belangrijk onderdeel van de logica sinds Aristoteles, niet een
tautologische, maar een empirische wet was[c, 3]. William Craig vond dat voor elke axiomatische
theorie met zowel observationele als theoretische termen, er ook een axiomatische theorie bestaat
met alleen observationele termen[d, 50].
Buiten deze logische onderwerpen, zijn er ook belangrijke resultaten, die gevonden zijn tijdens een
zoektocht naar de karakteristieken van de wetenschap. Deze resultaten zijn vaak negatief, maar
daarom niet van minder belang. Quine en Pickering wezen bijvoorbeeld op de mogelijkheid om een
theorie aan te passen, zonder dat er iets veranderd aan de observationele gegevens. Er zijn dus
meerdere equivalente theorien mogelijk. Quine liet zien dat dit altijd in principe mogelijk was[e, VI].
Pickering liet zien dat dit ook vaak gebeurd in de dagelijkse natuurkunde[f]. Kennis van deze
wispelturigheid van de theorie kan natuurlijk erg handig zijn, omdat in de theorie vaak ontologische
aspecten worden gepostuleert, die invloed hebben op ons wereldbeeld en dus niet noodzakelijk
bestaan. Vanwege deze wispelturigheid is het belangrijk om niet alleen van een theorie te weten te
komen of deze strookt met de feiten, maar ook om de geschiedenis van de theorie en de
bewijsstructuur ervan te analyseren. Uit de geschiedenis leert men welke keuzes men heeft moeten
maken om uiteindelijk op de theorie uit tekomen. Vaak is het geval dat er op een bepaald tijdstip de
mogelijk bestond voor de theorie om een geheel andere weg in te slaan. Als we serieuze studenten
zijn, moeten we ook de alternatieven eerlijk beschouwen en pas naderhand een keuze maken. Als
deze stap wordt overgeslagen, dan verliest een theorie aan bewijskracht.
Ook de bewijsstructuur is het bestuderen waard. Wanneer een theorie met veel verschillende
methoden is bevestigd, heeft dit natuurlijk veel meer waarde, dan wanneer men maar een of twee
bevestigende experimenten kent.
Als men eerst een theorie opbouwt en gebaseerd op dit werk een experiment voorstelt, dat
succesvol blijkt, dan heeft dit natuurlijk veel meer waarde, dan wanneer men een theorie zo
omschroeft tot hij met bekende feiten in overeenstemming is. Dit geldt vooral nu we weten van
Pickering en Quine. In het eerste geval laat u veel meer over aan de natuur, terwijl de tweede
methode veel kunstmatiger is. Ook is een bewijs sterker als het een experiment voorstelt dat een
heel onverwachts resultaat heeft.
3
Feyerabend had betoogt dat er geen manier bestond om rationaliteit of wetenschap te definieren[g,
H2]
. Altijd als we een definitie kiezen, dan blijken er goede voorbeelden van wetenschap buiten te
vallen en slechte voorbeelden binnen te vallen. Hieruit leren we dat de strikte scheiding tussen
wetenschap en niet-wetenschap, die binnen veel wetenschapsfaculteiten heerst, vaak te scherp is
aangezet, hetgeen ervoor kan zorgen dat sommige legitieme onderzoeksgebieden buitenspel gezet
worden.
Een ander nuttig voorbeeld komt uit het logisch-positivisme en is voor mij al vaak nuttig gebleken. De
logisch positivisten vroegen zich af of een resultaat van bijvoorbeeld een berekening iets zegt over de
natuur of misschien slechts een ‘taalkundige constructie’ is, die eerder een eigenschap is van de
manier waarop wij onze wiskunde of logica gebruiken[h, H7]. Als we bijvoorbeeld schrijven dat een
golffunctie samenvalt tot een deltafunctie, moeten we niet geloven dat dit echt is wat de natuur
doet. Er is niemand die ooit heeft gemeten dat het deeltje hier echt tot een punt samenvalt. Dit deel
van de theorie is gekozen omdat er gemakkelijk mee te rekenen is, maar een iets andere vorm is net
zo goed mogelijk. Het wordt interessanter als we het voorbeeld van Einstein nemen van een
lichtstraal, dat een lichtstraal uitzendt, waarbij men toch vanuit elk inertiaalframe meet dat de
tweede lichtstraal met de lichtsnelheid beweegt. Niemand heeft ooit zoiets dergelijks gemeten, zelfs
niet in benadering. Misschien is dit niet een feit van de natuur, maar eerder onze eigen wiskundige
constructie, we weten immers dat wetten vaak stuklopen op extrema.
Soms blijkt wat we opvatten als een feit over de wereld simpelweg een definitie te zijn (wederom
een taalkundige constructie). Soms, en dit heb ik al een aantal keer meegemaakt, lijkt het of het
samenvallen van twee uitkomsten uit twee verschillende gedachte-experimenten, een bewijs vormt
voor de juistheid een theorie. Nadere beschouwing kan dan toch uitwijzen dat beide experimenten
uiteindelijk afkomstig waren uit een bron, waarin dit samenvallen als definitie werd aangenomen.
Een laatste voorbeeld komt uit het werk van Duhem[i, 202]. Duhem vertelde dat het vaak zo is dat
gedachte-experimenten zo zijn opgesteld dat ze het eindantwoord al latent bevatten als een
aanname. Zoals men later kan lezen heb ik deze stelling getest op de bekende valtijdproef van
Galileo, die door velen wordt gezien als het typische voorbeeld van een geslaagd gedachteexperiment. Toch kreeg Duhem ook in dit geval gelijk.
In dit werk zullen we een groot aantal casestudies bekijken, die allemaal een geschiedkundig of
filosofisch karakter gemeen hebben. Zo behandelen we analytische meetkunde van Descartes, die
voor het eerst de algebra en de geometrie expliciet verenigde. We zullen lezen dat een directe
vertaling van de geometrie naar de algebra grootse gevolgen heeft gehad voor de reikwijdte van
wetenschap. Descartes liet met simpele algebra alle problemen van de Grieken achter zich en kon
hiermee veel complexere situaties beschrijven. In het hoofdstuk over Newton zullen we de inhoud
van de Principia bespreken, maar ook ingaan op de discussie over de absolute ruimte. In het stuk
over Maxwell zullen we ons focussen op zijn ether model. Sommige wetenschappers geloofden dat
het noodzakelijk was om een mechanisch model van de ether te construeren om deze echt te
kunnen begrijpen. Het lukte Maxwell om zo’n model te construeren, maar uiteindelijk verwierp hij dit
werkende model toch. We zullen lezen waarom. In het hoofdstuk over Hertz zullen we een theorie
bestuderen met een filosofisch karakter. Hertz deed een onderzoek naar de aannames van de
mechanica en zag dat het mogelijk was om een mechanica te creëren door slechts gebruik te maken
van ruimte, tijd en massa. We zullen ook kort kijken naar de opvattingen van de belangrijke
4
wetenschapsfilosoof Pierre Duhem, waarover we het hiervoor al even hebben gehad. Zowel Einstein
en Bohr filosofeerden vaak over hun wetenschappelijke vindingen. We gaan het hebben over hun
discussie over fotonen en andere quantum-fenomenen. Maar we zullen beginnen met een
uitgebreide inleiding in de wetenschapsfilosofie zelf.
5
EEN OVERZICHT: WETENSCHAPSFILOSOFIE
Hier volgt een overzicht van de belangrijkste thema’s uit de wetenschapsfilosofie.
DEMARCATIE
Hoewel de fysica in de 17de eeuw afstand begon te nemen van de filosofie (en dit in de 19de eeuw
bevestigde door de naam ‘natural philosopher ‘ te veranderde in ‘scientist’), bestaan er vandaag de
dag nog grote controversies over de natuur en de karakteristieken van de wetenschap. Wetenschap
wordt veelal gezien als een ‘speciale’ manier om kennis te verwerven, maar is het mogelijk te
definiëren wat dit verschil maakt?
Een belangrijk probleem in de filosofie van de wetenschap (Philosophy of Science) is dan ook het
probleem van de demarcatie: het zoeken naar een methode waarop men op een logische wijze een
wetenschap van een pseudowetenschap kan onderscheidden. Een pseudowetenschap is een
wetenschap, die niet deze ‘speciale’ status heeft [a, H2].
Het probleem van de demarcatie werd op originele wijze aangepakt door Karl Popper (1902 – 1994).
Popper stelde dat het de openheid tegenover kritiek was, die cruciaal was voor een echte
wetenschap. Het ging Popper er niet zozeer om dat een wetenschap consistent is, want ook
pseudowetenschappen zijn vaak consistent. De theorie van Freud bijvoorbeeld of de astrologie
waren immers in staat om alle mogelijke fenomenen in termen van hun theorie te verklaren.
Astrologen zagen continu fenomenen die in overeenstemming waren met hun theorie! Zelfs
fenomenen, die in eerste instantie in strijd waren met de theorie, konden uitgelegd worden in het
voordeel van de pseudowetenschap, mits de pseudowetenschappers slim genoeg waren. Popper
dacht dat het een kenmerk van een pseudowetenschap was, dat ze niet te falsifiëren waren en bijna
door alles bevestigd werden. Een goede theorie was niet perse goed in overeenstemming te brengen
met de data, maar eerder informatief, verrassend en op een bepaalde manier onverwacht. De
relativiteitstheorie van Einstein werd voor Popper hét voorbeeld van zo’n soort theorie. De theorie
maakte verrassende onverwachte voorspellingen, die makkelijk gefalsifieerd konden worden. Voor
veel mensen was de fit tussen de theorie van Einstein en de observaties belangrijk, maar voor Popper
niet. De theorie van Einstein was op een aantal momenten aan een experimentele tests onderhevig,
waarbij het mogelijk gefalsifieerd kon worden. Het doorstond deze testen en werd daardoor
geloofwaardiger.
Voor Popper was dus de mogelijkheid tot falsifiëren belangrijk, maar hoewel een goede theorie
falsifieerbaar is, is het omgekeerde niet altijd waar. Een zin als ‘morgen landen er aliens in mijn tuin’
is ook falsifieerbaar, maar niet meteen wetenschappelijk.
Maar er kwam kritiek op de methode van Popper. Een zin als ‘zwarte gaten bestaan’ is niet
falsifieerbaar, maar niet perse onwetenschappelijk. Ook kunnen sommige problemen met kans niet
gefalsifieerd worden. Als ik 80 keer gooi met een dobbelsteen en telkens 6 gooi, wil dit immers nog
niet zeggen dat mijn dobbelsteen oneerlijk is.
Ook is het niet duidelijk of wetenschappers een theorie moeten laten vallen, als deze gefalsifieerd
wordt. Stel dat een test van de theorie van Einstein negatief voor Einstein uitpakte, was het dan
verstandig om de theorie te verwerpen? Waarschijnlijk was het dan beter om een aanpassing te
maken aan de theorie. Veel critici wilden ook niet verwerpen, dat een groot verklarend vermogen
6
een gunstig teken voor een theorie is. Een valse voorspelling in de wetenschap leidt over het
algemeen niet meteen tot het verwerpen van een theorie. Veel complexe wetenschappen tolereren
zelfs een aantal valse voorspellingen, omdat dit opweegt tegen de grote voordelen van de theorie. In
de praktijk bestaat veel wetenschappelijk werk juist uit het repareren van deze foute voorspellingen
van de theorie.
Een ander criterium voor de demarcatie zou een historische kunnen zijn. Bijvoorbeeld:
‘pseudowetenschappen maken niet veel vooruitgang’. Maar ook dit werkt niet omdat een theorie als
astrologie ook sterk veranderde over de tijd. Ook evolueert een correcte theorie niet meer. Een
andere moeilijkheid is dat een theorie, die in zijn tijd werd beschouwd als een wetenschap, later in
een pseudowetenschap kan veranderen, zonder dat er iets aan de theorie zelf veranderd. Dit lijkt
zeer onredelijk. Ook is een theorie zonder serieuze alternatieven niet te vergelijken met betrekking
tot zijn progressie.
Als we een theorie beoordelen op de aanwezigheid van mechanische verklaringen, dan stuiten we
ook op problemen. De astrologie geeft geen verklaring voor de hypothese van de beïnvloeding van
het leven op aarde door de sterren, maar de zwaartekrachttheorie van Newton vertelt ook niet hoe
de zwaartekracht werkt!
Ook kan het verschil niet liggen aan manier van redeneren. Sommige pseudowetenschappen
gebruiken ook wiskunde, statistische analyse, causale verklaringen en de gebruikelijke componenten
voor een degelijk wetenschappelijk experiment. We moeten ons ook realiseren dat de wetenschap
ook vaak onnauwkeurige en onzekere redenatiemethoden gebruikt, als er geen betere voor de hand
liggen.
We merken dat telkens wanneer we een criterium verzinnen, sommige pseudowetenschappen
binnen het criterium vallen en sommige wetenschappen erbuiten! We mogen hier natuurlijk niet uit
concluderen dat het geheel onmogelijk is om een adequate demarcatie theorie te vinden, maar tot
nu toe en na vele pogingen, lijkt men gefaald te hebben.
WAT LEREN WE VAN EINSTEIN
De theorie van Einstein wierp vragen op over hoe wij concepten moeten definiëren. Bridgman verzon
een methode genaamd ‘operationalism’, waarbij een concept alleen beschreven mag worden in
termen van de operatie, die uitgevoerd werd bij het meten of het detecteren ervan. [a, H4] Lengte
bijvoorbeeld mocht niet meer geïdentificeerd worden met het opmeten van een stuk, maar slechts
met de procedure van het gebruik van een liniaal. Het betekent dat onder conditie X, we een
meetwaarde Y hebben afgelezen op de liniaal. Dit is alles dat we met lengte bedoelen. Wanneer we
aan een liniaal de eigenschappen zouden toeschrijven van het opmeten van ruimte, dan zouden we
fouten maken. Volgens Einstein geven bewegende linialen bijvoorbeeld een andere meetwaarde dan
stilstaande linialen.
Strikt genomen zouden we met deze theorie ook de ‘alchohol-thermometer temperatuur’ moeten
onderscheiden van de ‘kwik-thermometer temperatuur’, omdat een verschil in procedure een
verschil in betekenis inhoud. Het wordt helemaal gekkenwerk als we de ‘alchohol-thermometer
temperatuur, vastgehouden door een laborant met een groen jasje’ gaan onderscheiden van
‘alchohol-thermometer temperatuur vastgehouden door een laborant met een rood jasje’[a, H4]. Om
7
dit te voorkomen stelt Bridgman dat niet alle operaties problematisch zijn. Maar dit lost zijn
probleem niet op! Voor de aanvang van de relativiteitstheorie was men immers niet goed wijs als
men het opmeten van lengte problematisch zouden noemen. De bedoeling van de theorie van
Bridgman was om schijnbaar problematische identificaties te vermijden, maar als we juist deze
operaties onproblematisch gaan noemen, dan schieten we met zijn methode weinig op.
HET LOGISCH POSITIVISME
Het ‘logisch positivisme’ is een invloedrijke stroming in de wetenschapsfilosofie, die ontstaan is in de
1920’s. De ‘logisch positivisten’ geloofden dat wiskundige logica een goede tool was voor het
ontwikkelen van een nieuwe vorm van empirisme. Deze nieuwe vorm had als doel de wetenschap te
scheiden van de metafysica, zodat de metafysica verbannen kon worden uit de wetenschap. Net als
Mach maakte de ‘logisch positivisten’ gebruik van relaties en niet van de dingen op zichzelf.
De belangrijkste taak van de logisch positivisten was het specificeren van de relatie tussen de
wetenschappelijke theorie en de observatie. Samengevat geloofden ze dat:
Elk ‘cognitief betekenisvol statement’ is analytisch of een claim over een ‘mogelijke observatie’ [a, H6]
Laten we deze zin in stappen verklaren. Een ‘cognitief betekenisvol statement’ is een statement, dat
waar of onwaar is. Een analytisch statement is een taalkundige relatie tussen ideeën en kent geen
feitelijke inhoud (een synthetisch statement daarentegen heeft wel een feitelijke inhoud).
Analytische statements zijn a priori kenbaar en noodzakelijk waar. Er is dus geen observatie nodig om
de waarheid van deze statements te onderschrijven. Volgens de logisch positivisten waren logische
en mathematische statements voorbeelden hiervan. Een bekend voorbeeld uit de filosofie is: ‘een
vrijgezel is niet getrouwd’ of ‘elk gevolg heeft een oorzaak’. Ook dit laatste voorbeeld is geen
metafysisch inzicht, het is gewoon de manier waarop we deze woorden gebruiken. Het zijn definities,
die geen extra’s kennis toevoegen. Een logisch positivist gelooft dat er geen zekerheid bestaat in de
ervaring, maar wel in dit soort taalkundig-logische waarheden. Als deze inhoudsloze waarheden de
enige waarheden zijn, dan wil dit zeggen dat er geen synthetische a priori statements bestaan
volgens de logisch positivisten. Nietzsche dacht dat ook deze logica mogelijk een vooroordeel was,
hetgeen mijn eerste kritiek is op de logisch positivisten.
Een traditionele ‘metafysische statement’ is te onderscheiden van een analytisch statement, doordat
dit wel een feitelijke inhoud heeft. Ook zijn beide statements a priori. Een statement als ‘elk event
heeft een oorzaak’ is een voorbeeld hiervan. Men kan dit niet falsifiëren. Het verschilt met ‘oorzaakgevolg’, is dat een oorzaak per definitie een gevolg heeft. De logisch positivisten accepteren daarom
geen metafysische statements.
Nu nog over de ‘mogelijke observatie’. Wanneer een statement met inhoud goedgekeurd wordt door
de logisch positivisten, betekent dit dat de inhoud ervan mogelijk te testen is met behulp van een
experiment. Een statement is betekenisvol als er een juiste manier is om de waar- of onwaarheid van
het statement te testen. Maar hier zit ook het probleem. Hoe kunnen wij bijvoorbeeld aantonen, dat
het statement ‘al het koper geleidt elektriciteit’ waar of onwaar is. Ook al vindt men duizenden
stukjes geleidend koper, hieruit kan men niet concluderen dat het volgende stukje ook geleidt. Dit is
weer het probleem van de inductie. Ook het toepassen van de falsifieerbaarheid werkt niet altijd. ‘Al
het koper geleidt elektriciteit’ kan gefalsifieerd worden door één stuk niet-geleidend koper te vinden,
8
maar hoe kan men bijvoorbeeld falsifiëren dat ‘elk metaal in ieder geval door een zuur opgelost kan
worden’. Ook is het ingewikkeld om statements te gebruiken over niet-observeerbare objecten. Hoe
kan men bijvoorbeeld zeker weten dat een streep in een detector een elektron is?
Het is dus nodig om de criteria iets te verzwakken. Ayer bedacht dat een statement misschien al
betekenisvol moet worden verklaard, als we het statement kunnen gebruiken om nieuwe observatie
statements af te leiden, die we zonder dit statement niet hadden kunnen afleiden. Maar ook dit is
zeer problematisch, omdat het een statement als ‘alles verloopt volgens het plan van God’ niet
uitsluit. Het sluit andere goede voorbeelden juist wel uit. De overgang van de fysica van Newton naar
de mechanica van de energie bracht geen nieuwe observatie statements, maar kan toch niet
betekenisloos worden genoemd.
Verder over de logisch positivisten. De speciale status van de wetenschap zit hem volgens de logisch
positivisten in de manier waarop statements met elkaar samenhangen. De logisch positivisten waren
ervan bewust dat wetenschappers hun theorieën natuurlijk niet op deze manier benaderden, maar
dat hinderde niet. De zoektocht van de logisch positivisten was immers geheel theoretisch. Ze
noemde het de ‘rational reconstruction’ van een wetenschap. Ze wilden slechts laten zien dat het
mogelijk was om een wetenschappelijke theorie uit te drukken in een relatie van statements,
hetgeen de theoretische vraag van de speciale status van wetenschap wellicht kon beantwoorden.
Al snel bleek dat alleen de observatie en logica statements niet genoeg waren voor een
wetenschappelijke theorie. Er waren ook theoretische termen nodig. Als we de statement ‘al het
koper geleidt elektriciteit’ beschouwen, dan moeten we ook weten wat koper is en wat elektriciteit
is. Omdat deze termen niet behoren tot de observatietermen, ontstaat er een afstand tussen de
theorie en de observatie. De logisch positivisten wilden zo dicht mogelijk bij observatie blijven, maar
in een wetenschap moet men de observatie ook deels verlaten voor de theoretische input. Het
gevaar was, dat de theoretische termen de metafysica weer binnen de wetenschap brachten.
Tijd voor een voorbeeld: een term als ‘breekbaar’ is niet direct uit observatie data af te lezen. We
moeten dus iets voorbij de data gaan om het te kunnen gebruiken. De logisch positivisten handelden
als volgt op zo’n probleem. Ze definieerde het als: ‘alles dat geslagen word (met een standaard slag)
is breekbaar in de gevallen waarin het breekt’. Op deze manier kunnen ze een theoretisch statement
heel dicht bij de observatie statement brengen. We moeten nog weer verder van de observatie
afzitten, als we bijvoorbeeld ‘breekbaarheid’ weer gaan verklaren aan de hand van molecuul
structuren. We moeten dus een manier vinden waarin we op een logische manier deze termen
kunnen linken, gefundeerd in de observatie statements. De ‘betekenis’ (meaning) komt binnen via de
observatie statements en wordt via de logische relaties tussen de theoretische statements
‘verspreid’.
Aan een statement over onobserveerbare realiteit wordt, door de logisch positivisten, niet al te veel
waarde gehecht, vanwege de mogelijke insluip van de metafysica. Het ging de logisch positivisten
vooral om het beschrijven van de observatie en niet zozeer om de volledige realiteit van de wereld te
kennen. Het doel van statements was niet om iets te zeggen over dingen die we niet kunnen
observeren, maar om statements te maken over de patronen in onze observatie.
Om het samen te vatten: Een theorie bestaat uit een serie statements, die gefundeerd zijn in
observatie statements, die met theoretische en logische statements aan elkaar worden gelinkt.
9
Theoretische statements kunnen weer de basis zijn voor een hogere laag theoretische statements,
maar men moet oppassen niet tot de metafysica verleid te worden. Uitspraken krijgen dus betekenis
toegekend in dit systeem, als ze kunnen worden teruggekoppeld tot verifieerbare statements. Een
uitspraak krijgt dus betekenis als er een methode tot verifiëren bestaat. Deze analyse van een theorie
heet een ‘rationele reconstructie’.
De wetenschapsfilosoof Hacking vertelt ons dat een groot verschil tussen de logisch positivisten en
Popper te vinden is in het volgende. De logisch positivisme zijn op zoek naar verificatie en dat is een
proces dat van beneden naar boven werkt. Er worden experimenten gemaakt en daarna wordt
gekeken hoe deze een meer algemeen statement kunnen bevestigen of verifiëren. Popper’s
falsificatie werkt van boven naar beneden. Eerst bedenkt men een theorie, men zoekt naar een
voorspelling die deze theorie doet en dan test men of deze voorspelling overeenkomt met de
werkelijkheid. Er zijn echter ook overeenkomsten, zoals het scherpe onderscheid tussen de
observatie en de theorie dat door beide wordt gemaakt en het verschil tussen de ‘context of
justification’ en de ‘context of discovery’. Ook zijn beide benaderingen ‘tijdloos’, ze zijn onafhankelijk
van de geschiedenis.
HOLISME
Er is nog een probleem met een statement als ‘al het koper geleidt elektriciteit’. Wanneer wij de
geleiding van een stuk koper meten, moeten wij o.a. eerst weten of het object in kwestie echt van
koper is gemaakt en dat onze voltmeter werkelijk stroom kan meten. Dit zijn hypothesen, die we
naast de te bewijzen hypothese aan moeten nemen; ze worden ‘auxiliary hypothese’ genoemd. Heel
strikt genomen is de onafhankelijkheid van de groene of de rode kleur van het jasje van de laborant,
ook een ‘auxiliary hypothese’, maar zo ver willen we natuurlijk niet gaan. Wanneer onze theorie een
foute voorspelling maakt (en er dus in ieder geval één statement niet klopt), kan de logica over het
algemeen niet gebruikt worden om de fout te achterhalen, omdat er een oneindig scala aan ‘auxiliary
hypothese’ verantwoordelijk kan zijn. Popper stelde dat noch de logica, noch de observatie ons in
staat kan stellen om een theorie te falsifiëren. Wanneer een theorie niet werkt kan je de schuld altijd
schuiven op een ‘auxiliary hypothese’ en Popper vond dit goed, mits deze ‘auxiliary hypothese’ zelf
ook onafhankelijk te testen waren. Maar het probleem is dat ook de ‘auxiliary hypothese’ niet
onafhankelijk te testen zijn, omdat ook deze weer afhankelijk zijn van andere ‘auxiliary hypothese’.
Een bekend voorbeeld:
Copernicus kon verklaren dat er geen parallax werd gemeten in de sterren, door een niet-te-testen
‘auxiliary hypothese’ aan te nemen. Hij stelde dat de sterren zo ver weg stonden, dat deze parallax
niet gemeten kon worden.
Of een gekker voorbeeld:
Toen A dacht dat hij kon vliegen begon hij een experiment om dit aan te tonen. Hij sprong van een
dak en viel direct op de grond. Persoon B herinnerde hem dat hij dus niet kon vliegen, maar A liet de
hoge luchtvochtigheid de klap van zijn theorie opvangen. ‘Door de vochtigheid is het moeilijker om
met mijn armen te wapperen, het is dus nog steeds mogelijk dat ik kan vliegen’.
Popper geloofde dat we een dergelijk excuus alleen mochten gebruiken, als we correlatie tussen
luchtwrijving en het wapperen ook werkelijk konden aantonen. Omdat veel mensen het eerste
10
voorbeeld wel tot de wetenschap willen rekenen (misschien vooral omdat het uiteindelijk bleek te
kloppen), stuiten we hier op een minpunt van de methode van Popper, omdat hij deze niet-te-testen
auxiliary hypothesis’ niet accepteerde.
In 1951 schreef Quine (1908 - 2000) een belangrijk filosofisch artikel waarin hij stelde dat statements
geen betekenis hebben in isolatie en dat alleen een groep statements (een theorie) betekenis kan
hebben. Hij noemde dit ‘holism’ vanwege de noodzaak van een groep statements in plaats van
slechts één.
Hij kwam tot de conclusie (anders dan de logisch positivisten), dat er geen fundamenteel verschil was
tussen analytische en synthetische statements. Eerder leek het verschil tussen ‘alle vrijgezellen zijn
niet getrouwd’ (analytisch) en ‘de gemiddelde Amerikaanse vrijgezel weegt 80 kilo’ (synthetisch)
onbetwist, maar Quine dacht dat het verschil tussen een analytische en synthetische statements
geen filosofisch of wetenschappelijk werk deed. Alle statements zijn voor Quine onzeker en nooit a
priori kenbaar. [a, H8]
Een voorbeeld: koper heeft een uniek atoom nummer dus zou gedefinieerd kunnen worden aan de
hand van dit atoomnummer: ‘koper is die materie met atoom nr. X’. Dit is dus een analytisch
statement. Maar voordat men afwist van het atoomnummer van koper, had men een andere
definitie om het te beschrijven (wellicht met behulp van de dichtheid of bepaalde chemische
eigenschappen). Toen men op een dag het atoom nr. van koper vond, vond men: ‘Koper blijkt atoom
nr. X te hebben’. Hoewel dit statement amper verschilt van de vorige, is dit wel een synthetisch
statement. De scheidlijn tussen de twee statements lijkt daarom te vervagen.
Nog een ander voorbeeld. Stel dat we beginnen met twee analytische statements: ‘een object is
koper als het smelt bij X graden’ en ‘een object is koper als het een dichtheid Y heeft’. De twee
statements samen zijn al genoeg om een synthetisch statement te maken: ‘Je vindt niks met
dichtheid Y dat niet smelt bij X graden’. Dit statement heeft empirische consequenties, terwijl we
dachten simpelweg over een inhoudsloos en taalkundig-logisch probleem te praten.
In de tijd van Aristoteles was water per definitie een element, maar toen men vond dat water uit
meerdere soorten atomen bestond veranderde dit.
En nu extreem een voorbeeld. Als je vrijgezel definieert als ‘niet voorkomend in een bepaalde lijst in
het gemeentehuis’ (wat een prima definitie kan zijn) zal het je als een nieuw feit kunnen voorkomen,
dat deze mensen ook nog eens gemeen hebben dat ze niet getrouwd zijn!
In de 19de eeuw had Nietzsche al gewaarschuwd dat veel van onze a priori logica eigenlijk
vooroordelen konden zijn. In het werk van Quine zien we dit dus nog specifieker terug.
Ook Quine dacht (net als Duhem) dat een theorie altijd ‘underdetermined by data’ is. Observatie kan
iemand nooit logischerwijs dwingen tot het maken van bepaalde veranderingen in een theorie. Elk
statement kan standhouden, welke observatie er ook voor handen is. Men kan bijvoorbeeld de
Euclidische ruimte en tijd redden in de relativiteitstheorie, door aan te nemen dat er extra
ondetecteerbare krachten werken, die linialen doen krimpen en klokken langzamer doen lopen.
Quine gebruikte een metafoor om dit te illustreren. Hij noemde het zijn ‘web of belief’. Op vaste
punten, aan de rand van dit web, bevond zich de data en in het web, dat deze datapunten verbond,
11
bevond zich de theorie. Hoewel de datapunten vast staan, bestaan er vele manieren om een web aan
te leggen tussen deze datapunten. Er kunnen dus veel theorieën bedacht worden, die allemaal
dezelfde data kunnen verklaren. Het is dus mogelijk om elk statement te redden van de ondergang
als je maar bereid bent om genoeg andere statements aan te passen. In de praktijk, zegt Quine, zijn
de veranderingen in het web vaak gebaseerd op de simpelheid van het web en op conservatisme (het
behouden van zoveel mogelijk van het oude web). Het is daarom moeilijk om de theorie rechtstreeks
aan de ‘realiteit’ te koppelen. Wederom zien we, zoals in Duhem en Maxwell, dat de wetenschap de
filosofie niet kan afzweren. Metafysica en wetenschap zijn nooit keurig te scheiden, zelfs niet in
simpele theorieën!
We hebben al gezien dat John Herschel het onderscheid maakte tussen de ‘discovery’ en de
‘justification’ van een theorie. Een goede wetenschappelijke methode, zo werd gedacht, moet er
voor zorgen dat we nieuwe informatie vinden en dat we deze informatie kunnen rechtvaardigen.
Ook Popper en de logisch positivisten geloofden dat er een belangrijk verschil tussen de ‘context of
discovery’ en de ‘context of justification’ bestond. Ze dachten dat het niet mogelijk was om de
ontdekking van een theorie in een methode te vangen. Het bedenken van goede hypotheses had te
maken met geluk, genialiteit en hard werken, maar niet door het toepassen van een methode. Maar
als de ontdekking eenmaal is gedaan, kan men een logische methode vinden om de nieuwe
hypothese te testen, welke oorsprong de theorie ook had. Dit is het ‘justification’ gedeelte. Later
zullen we zien, dat niet iedereen dit onderscheid tussen ‘discovery’ en ‘justification’ zo stellig
maakte.
INDUCTIE
Een belangrijke vraag gaat over de ‘logic of confirmation’. Waar moet de relatie tussen een
theoretisch en een observatie-statement aan voldoen, wil de laatste bewijslast zijn voor de eerste?
De vraag is dus wanneer een statement ‘evidential support’ geeft en wanneer niet. Het belang voor
een onderzoek naar deze vraag ligt voor de hand. De wetenschap gaat namelijk voor een groot
gedeelte over het afwegen van verschillende bewijslast. Wanneer is een theorie bewezen? Wat is
daar voor nodig?
Hiervoor moeten we weer terug naar de inductie:
In de breedste zin van het woord, valt elke gevolgtrekking die niet deductief is onder de inductie. In
een minder brede zin zijn inducties ‘meer-van-hetzelfde’- gevolgtrekkingen.[a, H10] Omdat ik al 100
stukken geleidend koper heb gezien, geleidt het volgende stuk koper dus ook elektriciteit.
Copernicus dacht niet: ‘alle geobserveerde planeten draaien om de zon, dus alle planeten draaien
om de zon’ (meer-van-hetzelfde). Hij had immers nog nooit een planeet om de zon zien draaien. Hij
bedacht een ‘betere’ manier om astronomische gegevens te verklaren. Dit soort redeneringen
passen dus alleen in de brede definitie van inductie. Normaal gesproken bedoeld men met inductie
echter de ‘meer-van-hetzelfde’- gevolgtrekkingen en dit zullen wij in wat volgt ook bedoelen.
Hume dacht dat inductie niet te rechtvaardigen was. Hij vertelde dat hoe vaak hij de zon ook zag
opkomen, hij geen bewijs had, dat de zon ook morgen zal opkomen. Hume dacht dat de onzekerheid
in inductie ons er niet van moest weerhouden om inductie te gebruiken. Hij wilde gewoon dat we
ons realiseren, dat de uitkomsten ervan onzeker zijn. Popper dacht dat heel de inductie niet nodig
12
was in de wetenschap, omdat hij niet naar confirmatie zocht, maar juist naar falsificatie. Popper
dacht dat men met alleen observatie en deductie kon falsifiëren. Wanneer men een zwarte zwaan
vindt, wordt het statement ‘alle zwanen zijn wit’ gefalsifieerd. Quine zou zeggen dat dit niet mogelijk
is, omdat je de theorie altijd kan aanpassen zodat dit statement geldig blijft, maar Popper dacht dat
sommige aanpassingen aan een theorie niet wetenschappelijk waren en zo de falsificatie mogelijk
maakte. Het meeste dat we volgens Popper kunnen zeggen over een theorie, is dat het een aantal
pogingen tot falsificatie heeft doorstaan. Om dit proces te onderscheiden van confirmatie, gaf
Popper het de naam ‘corroboration’.
Corroboratie is niet in staat om het succes van een theorie te garanderen, maar geeft wel een
voorkeur aan de theorie, die vaak een poging tot falsifiëren heeft doorstaan. Een wetenschappelijke
theorie probeert de waarheid te beschrijven, maar we kunnen nooit zeker weten of we deze
waarheid bereikt hebben of niet.
PROPERTIES
De ‘wet van de grote nummers’ is een wiskundige theorie, waarin gesteld wordt dat hoe groter het
aantal metingen is, des te zekerder we kunnen zijn van de waarheid van ons statement. Als we maar
een groot genoeg sample hebben, dan werkt de inductie. Maar hoe weten we dat ons sample
random is? Misschien geleidt koper alleen in de omgeving van de aarde of in aardse
omstandigheden? Of misschien geleidt koper pas sinds een paar eeuwen?
Maar het gebruik van inductie is heel nuttig voor zowel het dagelijks leven als de wetenschap, dus
het moet in ieder geval iets goed doen. Stel dat we ons sample van koper zo groot maken dat we al
het koper in elke omstandigheid in ons sample hebben zitten. Uit dit sample kunnen we deductief
het antwoord op de stelling ‘al het koper geleidt elektriciteit’ vinden. Het is dus waar is dat men met
een groot genoeg sample, de inductie uiteindelijk naar het juiste antwoord kan laten convergeren.
Met een relatief ‘klein’ sample zijn we echter toegewezen op de zogenaamde ‘background beliefs’,
maar als het sample maar groot genoeg is, zullen deze geleidelijk verdwijnen. Als we bijvoorbeeld uit
een gigantische bak vol knikkers met drie kleuren, een rode knikker pakken, dan zou de inductie ons
vertellen dat alle knikkers rood zijn. Maar dit zou een domme beslissing zijn. We zouden dan beter
eerst kunnen aannemen dat een derde van de knikkers rood is, dit is een ‘background belief’. Pas als
we een genoeg aantal knikkers hebben gepakt, kunnen we van de inductie gebruik maken. Met een
grotere set, wordt de inductie steeds betrouwbaarder. Het probleem is natuurlijk: hoe weten we
wanneer een dataset groot genoeg is en dus de werkelijkheid representeert? Misschien liggen de
rode knikkers in de bak wel allemaal onderop en is dat de reden dat we minder rode knikkers vinden.
Toch is ook de beslissing, om aan te nemen dat 33% van de knikkers rood is, gevaarlijk. Wanneer wij
bijvoorbeeld ook zouden selecteren op donker- en lichtgroene knikkers, dan zou de inductie
verwachten dat slechts 25% rood was, terwijl er wellicht niets is veranderd aan de knikkerbak. We
hebben nu niet de knikkerbak, maar alleen de beschrijving veranderd. Toch komen we zo uit op een
ander percentage!
We moeten er ook rekening mee houden dat in sommige situaties niet inductie, maar
counterinductie wordt verwacht. Stel dat een blik is gevuld met 100 rode en 20 gele knikkers. Er
worden 40 knikkers random uitgepakt en allemaal zijn ze rood. In plaats van dat we in deze situatie
13
zouden denken dat de volgende knikker weer rood is (als bij inductie), wordt de kans juist groter dat
het niet rood is! Hoe meer rode knikkers er uit het blik verwijderd zijn, hoe meer er een gele knikker
verwacht wordt.
GOODMAN
Nelson Goodman (1906 - 1998) bedacht de ‘new riddle of induction’. Volgens Goodman is het
probleem niet, dat het te moeilijk is om in een dataset een patroon te vinden, maar juist te
gemakkelijk. Professor Kasser beschreef een bekend voorbeeld van Goodman als volgt:
Call an object “grue” if it is first observed before January 1 3000 and is green or if it is first observed
after that time and is blue. [If] All emeralds ever observed have been grue; [by induction], then, we
should expect emeralds first observed after January 1 3000 to be blue. [a, H11]
Het gebruik van de term ‘grue’ is voor ons natuurlijk vreemd, maar dat is juist de bedoeling.
Goodman heeft hier een gek concept bedacht, dat wel een logisch legitieme term is! Het is dus te
gemakkelijk om logisch consistente concepten te vinden. Hoe weten wij eigenlijk zeker, dat ook wij
geen logisch consistente, maar verkeerde termen gebruiken, om de dingen te beschrijven? Kasser
vertelt:
It seems weird to us, but green would seem weird to us if we were “grue speakers.” [a, H11]
Een term als ‘brocosaxodil’ (voor alles dat of broccoli of een saxofoon of een krokodil is) is duidelijk
een belachelijke property. We kunnen beargumenteren dat deze objecten niet genoeg
overeenkomsten hebben om gegroepeerd te worden, maar wie zijn wij om te bepalen wat ‘natures
preferred language’ is? Eerst maakte de natuurkunde onderscheid tussen ruimte en tijd, maar nu
blijkt er alleen zoiets te bestaan als ruimte-tijd. Het is dus niet duidelijk wanneer een distinctie in de
taal zit en wanneer in de externe wereld. Een term als ‘roofdier’ is ook een ruime collectie van heel
verschillende dieren. Bestaat dit onderscheid echt in de natuur of is dit slechts een handige manier
van spreken? Een zelfde probleem deed zich voor in de pre-Darwinistische biologie. Men vroeg zich
af: hoe moeten we deze dieren categoriseren? Is er een natuurlijke manier om de dieren te
categoriseren of zijn er slechts kunstmatige manieren?
Neem als voorbeeld het ‘curve fitting problem’[a, H11]. Dit is het probleem dat er in principe een
oneindige hoeveelheid manieren zijn om een curve door een eindige hoeveelheid data te fitten.
‘Grue’ zou een voorbeeld kunnen zijn van zo’n alternatieve curve. Ook deze curve snijdt alle data
punten! De vraag komt dan op: waarom zou de natuur voor de simpele curve gaan en niet voor de
meer ingewikkelde? Dit voorbeeld laat zien dat er grote problemen zijn met inductie. Net als in Quine
is onze taalkeuze ononderscheidbaar van de feiten. De taalkeuze heeft in dit voorbeeld immers
invloed op de inductie!
Hume dacht dat we geen echte connecties in de natuur konden vinden. Goodman liet zien dat deze
connecties in zo’n overvloed vindbaar waren, dat velen zelfs waardeloos zijn! Bij Goodman moeten
we juist uitvinden welke connecties of patronen belangrijk zijn en welke niet.
Omdat het zo gemakkelijk is om verschillende properties te bedenken, moeten we misschien een
methode bedenken om ‘echte properties’ te onderscheid van ‘niet echte properties’. Zijn er
14
properties, die echt in de natuur voorkomen en properties die dit niet doen? Deze vraag is nog
onopgelost in de filosofie.
BEWIJSLAST
De logisch positivisten zochten een logische relatie tussen observatie statements en een hypothese,
zodat de observatie als bewijslast kon dienen voor de hypothese. Een simpele poging om dit
probleem aan te pakken, wordt beschreven door het ‘instantial model’. Dit model veronderstelt dat
als men een A vind met eigenschap B, dat dit een bewijslast is voor ‘alle A’s zijn B’.
Carl Hempel stelde de ‘paradox of the ravens’[a, H12] op om aan te tonen dat dit model niet werkt. De
stelling ‘Alle raven zijn zwart’ is logisch equivalent aan ‘alle niet-zwarte dingen zijn niet-raven’. Dit
betekent dat alle niet-zwarte dingen, die geen raaf zijn, ook bewijs zijn voor ‘alle raven zijn zwart’.
Een groene pinguïn geldt dus als bewijslast voor ‘alle raven zijn zwart’! Het wordt pas echt vreemd
als we ons realiseren, dat dit betekent dat een groene pinguïn ook bewijs levert voor ‘alle raven zijn
geel’ of voor ‘elke mier is een olifant’.
Hempel beschouwde het als een vooroordeel, dat ‘alle raven zijn zwart’ alleen maar over raven moet
gaan. Als men immers alle niet-zwarte objecten zou bekijken en geen raven zou aantreffen, dan zou
men weten dat alle raven zwart zijn!
Ook is het idee geopperd, dat als een observatie als bewijs wil dienen, er de mogelijkheid tot
falsifiëren moet zijn. Als wij eerst een zwart object bekijken en pas daarna kijken of het om een raaf
gaat, dan is dit geen bewijs. Het wordt in deze volgorde immers onmogelijk gemaakt om raven van
een andere kleur te vinden (en dus om te falsifiëren). Dit betekent wel, dat als men een geel object
vindt en het geen raaf blijkt te zijn, dit wel als bewijslast geldt voor ‘alle raven zijn zwart’. Er bestond
immers de mogelijkheid, dat het gele object een raaf was. Als men in tegenstelling een potlood vindt
dat geel blijkt zijn, dan is dit weer geen bewijs. De volgorde waarin iets ontdekt wordt, heeft dus in
het geval van de falsificatie, invloed op de bewijslast. Dit was de reden waarom Hempel dit idee van
falsificatie niet kon accepteren.
Een ander probleem van het ‘instantial model’[a, H12] is dat het alleen over confirmaties van de vorm
‘alle A’s zijn B’ gaat. Het zegt dus niets over een hypothese als ‘er bestaat op zijn minst één vliegend
zoogdier’. Een meer populair alternatief op dit model is het ‘hypothetico-deductive’ model. Het zegt
dat een hypothese geconfirmeerd is, als de consequenties of gevolgen ervan waar blijken te lijk. Zo
kunnen we zeggen dat het golfkarakter van licht geconfirmeerd werd door ´het vinden van een lichte
stip in het midden van de schaduw van een ronde schijf´, ook al kunnen we niet direct zien dat licht
een golf is.
Maar ook deze hypothese heeft zijn nadelen. Stel dat mijn hypothese is: ‘roken is slecht’. Zonder de
logica te breken kan men de hypothese ook opschrijven als ‘Of roken is slecht, of het is een mooie
dag vandaag of allebei tegelijk’. Stel dat het een mooie dag is, dan is dit een aanwijzing voor de
tweede hypothese, omdat deze hypothese als consequentie een mooie dag verwachtte. Als het
tweede statement wordt bevestigd, dan wordt ook direct het eerste statement bevestigd. Dit maakt
een zonnige dag een aanwijzing voor ‘roken is slecht’.
Wederom zien we dat wanneer we wat meer ruimte maken om goede voorbeelden toe te kunnen
voegen, we tegelijkertijd ook een hele hoop gekke voorbeelden binnenhalen.
15
‘Inference to the best explanation’[a, H12] is een derde mogelijkheid. Het stelt niet alleen dat de
gevolgen waargenomen moeten zijn, maar ook moet de hypothese de data verklaren. De beste
verklaring van de data confirmeert de hypothese. Wanneer een natuurkundige in een detector een
lijn vindt en dit als bewijs voor de aanwezigheid van een elektron beschouwt, gebruikt hij de
‘inference to the best explanation’. Ook Copernicus deed dit in zijn theorie van het zonnestelsel. Het
omvatte niet alleen de data, maar verklaarde het ook. De moeilijkheid is dat we niet weten welke
theorie het best verklaart. Het begrip ‘beter’ is onduidelijk, want soms wordt een ‘mooie’ of
‘symmetrische’ theorie beter gevonden dan een waarschijnlijkere theorie en soms niet. Ook hoeft
een theorie, die beter verklaart, nog niet de juiste theorie te zijn. Hoewel de bewegingsleer van
Aristoteles meer verklaarde dan de theorie van Galileo, betekende dit niet, dat de theorie van
Aristoteles beter was.
KUHN
De grootste klap voor het logisch positivisme kwam vanuit de geschiedenis van de wetenschap,
voornamelijk van ene Thomas Kuhn (1922 – 1996). Kuhn dacht dat Popper en de logisch positivisten
een theorie hadden opgesteld, die weinig te maken had met hoe wetenschap er in de praktijk aan
toe gaat. Volgens Kuhn was het ontdekken van het speciaal van de wetenschap niet een zaak van het
vinden van een onderliggende methode. Kuhn koos ervoor om de mechanismes te onderzoeken,
waarmee men in de praktijk theorieën aannam en veranderde. Maar omdat Kuhn keek naar de
praktijk, bestond het gevaar dat hij zowel goede als slechte wetenschap behandelde, terwijl Popper
alleen belangstelling had voor ‘goede wetenschap’. Popper accepteerde dat veel van de conclusies
van Kuhn overeenkwamen met hoe wetenschap in de praktijk werkt, maar dat dit voorbeelden
waren van slechte wetenschap.
Kuhn geloofde dat wetenschappers hun geschiedenis systematisch misrepresenteren. Ze beschrijven
hun ontdekkingen in een progressieve logische lijn van wetenschappelijke triomfen. Kuhn
beschouwde dit zelfs als een vorm van ‘brain washing’. De tekstboeken volgden volgens Kuhn een
Popperiaans plaatje van de wetenschap, met helden, triomfen en onverwachte voorspellingen (bold
conjectures).
Wat de meeste wetenschappers echter het meest van de tijd doen, noemde Kuhn ‘normal science’
en dit was relatief dogmatisch en zeker niet zo dramatisch als de Popperiaanse voorbeelden. Kuhn
geloofde dat de normale wetenschap gedomineerd werd door een paradigma (een consensus, een
wereldbeeld). De bedoeling was om voorbeelden uit de tekstboeken te leren en soortgelijke
redeneringen te gebruiken op nieuwe gevallen. Deze voorbeelden waren in ‘normal science’ van
groter belang dan een wetenschappelijke methode. Ian Hacking schrijft het volgende over de ‘normal
science’ [c, 7]:
16
Het paradigma geeft een consensus over hoe en aan wat er gewerkt moet worden. Normale
wetenschap bestaat niet uit het testen van het paradigma zelf of het te proberen te falsifiëren, maar
uit het oplossen van ‘puzzles’, die door het paradigma gedefinieerd zijn. Deze puzzels dienen
opgelost te worden met de methoden, die door het paradigma zijn vastgesteld. Het meeste werk van
de ‘normal science’ is heel gedetailleerd en een poging om het paradigma te fitten aan de observatie.
Normale wetenschap houdt dus stand tegenover falsifiërende data en het is juist de hoofdtaak van
de wetenschappers in de normale periode om deze data in overeenstemming te brengen met de
theorie!
Een ‘crisis’ ontstaat wanneer een paradigma zijn grip op de wetenschappers kwijt raakt. Dit gebeurd
door het optreden van ‘anomalies’, puzzels die zich blijven verzetten tegen een oplossing.
‘Anomalies’ worden geregeld ontdekt in periodes van normale wetenschap, omdat men juist in deze
periodes heel nauwkeurig en gedetailleerd werkt. In de periode van crisis kan het paradigma getest
worden en wellicht naar de prullenbak worden verwezen. Men gaat zich nu afvragen hoe
wetenschap gedaan moet worden en in plaats van de gebruikelijke ‘puzzle solving’, gaat men nu
filosoferen. Als een nieuw paradigma de plaats van de eerste inneemt dan heeft er een
wetenschappelijke revolutie plaatsgevonden. Hierna treedt ‘normal science’ weer in. Volgens Kuhn
had Popper de periode van crisis verward met normale wetenschap. Hacking vertelt [c, 8]:
Volgens Kuhn zijn zowel normale wetenschap als revoluties goede wetenschap. In een revolutie
wordt vaak een nieuw onderzoeksveld geopend. Normale wetenschap is nodig om de theorieën uit
te diepen en zorgt ook voor veel van het wetenschappelijke succes.
Rationaliteit en Waarheid spelen amper een rol in Kuhn’s beschrijving van de wetenschap. Als een
nieuw paradigma ontstaat, heeft het een aantal successen gekend, maar is het in vergelijking met het
oude paradigma nog onderontwikkeld. Het is zelf vaak niet in staat om alle problemen op te lossen,
die in het eerste paradigma wel opgelost konden worden.
Het zijn vaak de jongere wetenschappers, die minder gebonden zijn aan het oude dogma, die de
overstap maken naar een nieuw paradigma. In tijden van crisis spelen generatie verschillen, maar
ook persoonlijkheden en persoonlijke voorkeuren een rol. Deze aspecten hebben minder invloed in
normale wetenschap. Planck verwoordde dit als volgt: ‘a new scientific truth does not triumph by
convincing its opponents and making them see the light, but rather because its opponents eventually
die’ of ‘science changes, funeral by funeral’ [d].
Het is niet mogelijk om op een logische wijze tussen paradigma’s te kiezen. Kuhn noemt deze
onmogelijkheid ‘incommensurabiliteit’. Wat in het ene paradigma als een bewijs of een feit doorgaat,
17
kan wellicht afgewezen worden in een ander paradigma. Kuhn geloofde dat elke nieuwe theorie in
een zekere zin een nieuwe taal is. Ook is het onmogelijk om een theorieneutrale taal te vinden
waarin we beide theorieën kunnen uitdrukken en vergelijken. De wetenschapsfilosoof Hacking
schrijft[c, 68]: ‘We cannot say that successor T* does the same job better than T, because they do
different jobs’. Elk paradigma kent andere regels en standaarden en evalueert zijn theorieën op een
andere manier. Dit maakt de vergelijking tussen paradigma’s niet mogelijk. Dit maakt effectieve
communicatie tussen paradigma’s problematisch. Verschillende paradigma’s kennen zelfs een
verschillend wereldbeeld. Kuhn schreef: ‘theories can shape what we see’[a, H26]. Een paradigma
definieert als het ware de realiteit.
Traditioneel gezien zijn het de sociale factoren in de wetenschap, die bepalen welke vragen er op het
toneel van de wetenschap verschijnen. De antwoorden hierop, staan echter los van deze sociale
factoren. Dit onderscheid wordt in de theorie van Kuhn niet meer gemaakt. Het opkomen van een
paradigma is immers een sociaal fenomeen en het paradigma vertelt ons behalve welke vragen we
moeten stellen, ook op welke manieren deze opgelost moeten worden.
Omdat het paradigma beslist wat een goede redenering is en de methodes voorstelt waarmee
problemen moeten worden opgelost, is ‘discovery’ ook niet meer te geheel te scheiden van
‘justification’.
Net als Quine gebruikt Kuhn een holistische versie van betekenis (meaning), waarin hij stelt dat de
betekenis van een term (bijvoorbeeld massa) afhangt van het paradigma waar vanuit men deze term
beschouwt. Newton en Einstein hadden bijvoorbeeld een heel ander begrip van wat massa
betekende. Ook observatie is voor Kuhn ‘theory-laden’. Wat mensen in observatie zien hangt af van
hun vooroordelen en verwachtingen.
Voor Kuhn had de overstap van het ene naar het andere paradigma iets weg van een bekering of een
‘gestalt-switch’ (een afbeelding die je op meerdere manieren kan bekijken). Een volgeling van
Copernicus ziet het opkomen van de zon als een bewijs voor de bewegende aarde, terwijl een
volgeling van Aristoteles de opkomende zon ziet als een bewijs voor een stilstaande aarde. Net als
een gestalt switch zijn er meerdere manieren om naar de wereld te kijken. Een ander voorbeeld is
dat de oude chinezen het verschijnen van nieuwe sterren hadden opgetekend, terwijl men er in het
westen blind voor leek te zijn. Kuhn geloofde dat dit kwam, doordat men in het westen had gedacht
dat de hemel onveranderlijk was. In beide voorbeelden heeft een paradigma invloed op onze
‘observatie’.
Er is volgens Kuhn geen logische progressieve voortgang in de wetenschap volgens Kuhn. Als
voorbeeld gebruikt hij dat theorie van Einstein op een aantal belangrijke aspecten meer
overeenkomt met Descartes dan met Newton! Hoewel Descartes geen occulte krachten wilde
gebruiken maar een mechanisme wilde vinden, was dit niet wat Newton deed. Newton liet de
verklaringen juist achterwegen. Na Einstein zijn we weer mechanieken aan het verzinnen om de
zwaartekracht te verklaren, net als Descartes had geprobeerd.
Toch schreef Kuhn ook vaak alsof wetenschap toch in de tijd verbetert, hetgeen niet gemakkelijk met
zijn incommensurabiliteit te verenigen is. In ieder geval geloofde hij dat wetenschap niet ging over
het ‘dichter tot de waarheid komen’, omdat waarheid een begrip is dat alleen betekenis heeft binnen
een paradigma, maar onduidelijk wordt als het erbuiten wordt gebruikt.
18
We kunnen ons afvragen: is het effect van incommensurabiliteit echt zo extreem als Kuhn geloofd?
Kon Newton niet effectief communiceren met Einstein over massa? Begrijpt een volgeling van
Aristoteles niet heel goed wat er bedoeld wordt met ‘de aarde beweegt om de zon’? Zijn normale
wetenschap en revolutie zo goed van elkaar te onderscheiden? Er zijn immers ook revoluties in de
wetenschap geweest, zonder de aanwezigheid van een crisis en sommige revoluties lieten veel of
alles van de oude theorie in tact! De theorie van het DNA was duidelijk een paradigma shift, maar
zorgde niet voor een crises of een groot verzet . Dit geldt ook voor Hubble’s meting van het
uitdijende heelal.
De grootste kritiek op Kuhn is geuit over zijn geloof in de afhankelijkheid van theorie en observatie.
In het voorbeeld van de opkomende zon ‘lijkt’ het nog steeds alsof de zon aan de hemel beweegt,
stellen de critici. De observatie is strikt genomen hetzelfde voor Aristoteles en Copernicus, ook al kan
de theorie verschillen. Interpretatie kan verschillen, maar niet onze zintuiglijke waarneming. In deze
sterke zin kan observatie dus niet afhankelijk zijn van de theorie, stellen de critici.
LAKATOS & FEYERABEND
De keuze van een paradigma hangt volgens Kuhn af van de achtergrond, de psychologie en de
vooroordelen van de wetenschappers en is dus vooral een sociaal fenomeen. De filosoof Imre
Lakatos noemde Kuhn’s beschrijving daarom ‘mob psychology’[a, H14] (over het handelen van groepen
mensen).
De eerste grote theorie na Kuhn, over hoe wetenschap in zijn werk gaat, kwam van deze Lakatos.
Lakatos was het met Kuhn eens dat een filosofie van de wetenschap gespiegeld moet worden aan de
geschiedenis van de wetenschap, maar was het met Popper eens dat een rationele methode toch
mogelijk was. Hacking schrijft over Lakatos[c, 14]: ‘He thought of himself as revising Popper in the face
of Kuhn’. Hij wilde een nieuwe rationele theorie vinden, die ook rekening hield met de geschiedenis
van de wetenschap. Popper had gezegd dat alle theorieën die inconsistent zijn met betrekking tot de
observatie verworpen moeten worden. Lakatos dacht dat dit absurd was, zo schreef hij ‘all theories
are born refuted’[c, 114]. Lakatos’ kritiek op Kuhn was dat hij de wetenschapsfilosofie geheel wilde
reduceren tot wetenschapssociologie: ‘He thought that it left no place for the sacrosanct scientific
values of truth, objectivity, rationality and reason’[c, 112].
Zijn theorie heet de ‘methodology of scientific research programs’[a, H16]. Een research program lijkt
heel erg op wat Kuhn een paradigma noemde. Het had een harde kern van principes, die niet
bekritiseerd mochten worden en daarom heen een ‘protective belt’ met theorie die wel veranderd
mocht worden en diende om de kern van falsificatie te behoeden. Er doken constant anomalieën op,
maar deze kunnen door de beschermende ring worden opgevangen. Lakatos dacht ook dat het
mogelijk was, dat verschillende concurrerende research programma’s tegelijk konden bestaan en
groeien.
Lakatos onderscheidde een ‘progressive research program’ van een ‘stagnant or degenerating
research program’. In een ‘progressive research program’ werd de ‘protective belt’ zo aangepast dat
er nieuwe voorspellingen werden gegenereerd. De ‘stagnant or degenerating research program’
reageert slechts passief op de anomalieën en produceert geen nieuwe voorspellingen. Hij geloofde
niet dat de stagnerende programma’s perse opgegeven moesten worden, want de mogelijkheid blijft
bestaan dat deze programma’s uiteindelijk weer progressief worden. Op basis van dit verschil kozen
19
wetenschappers rationeel voor de theorie van Einstein boven die van Newton, omdat die van
Einstein progressiever was.
Paul Feyerabend daarentegen, denkt dat de enige mogelijke wetenschappelijke methode ‘anything
goes’[a, H16] is. Feyerabend merkte op dat elke methode, die je bedenken kan, altijd wel goede
wetenschap buitensluit en slechte wetenschap binnensluit. Feyerabend gebruikt vooral de aanpak
van Galileo om zijn theorie te bekrachtigen. Zowel theorie als observatie stond Galileo tegen!
Feyerabend beweerde dat Galileo propaganda en oneerlijke retoriek gebruikte om zijn wereldbeeld
te verkondigen. De kerk was volgens Feyerabend veel rationeler dan Galileo zelf, maar dempte de
verbeelding en de spirit. Hij geloofde dat de wetenschap van vandaag zich gedraagt als de kerk in de
tijd van Galileo. Feyerabend verdedigde zelfs een kijk op de wetenschap, die de wetenschap elke
speciale status ontnam! Hacking wat het standpunt van Feyerabend goed samen[c, 14]:
Feyerabend geloofde ook in een zwakke versie van de incommensurabiliteit, hoewel voor
Feyerabend de incommensurabiliteit een vrij zeldzaam fenomeen is. Hoewel hij toegeeft dat
communicatie verstoord kan worden door het verschil in paradigma’s, kan met behulp van het
schetsen van de context van een paradigma, een grote mate van begrip ontstaan. Het communicatie
probleem, dat Kuhn wel aanhaalt, is dus voor Feyerabend geen probleem. Ook erkent hij dat twee
paradigma’s, die incommensurabel zijn, heel veel overeenkomsten kunnen blijven hebben. De
theorie van Newton en Einstein gebruikten allebei massa, ruimte, tijd, beweging en zwaartekracht.
Deze begrippen zijn, in de twee verschillende paradigma’s, wel fundamenteel inconsistent. De
relaties die men vindt zijn daarom niet van essentiële aard. Ik denk dat dit begrip van
incommensurabiliteit heel dicht ligt bij het standpunt van de gemiddelde wetenschapper: Newton en
Einstein zijn in hun fundamenten inconsistent, maar hebben desalniettemin nog een hoop
overeenkomsten. Feyerabend, die vaak extreme standpunten had, is in dit geval dus zeer gematigd.
VERKLARING
De wetenschap als ‘verklarend’ is een moeilijk begrip voor de empirici. Hoewel veel mensen denken
dat een wetenschap moet verklaren, hielden de empirici zich liever bij ‘wat er gebeurt’ en niet ‘hoe
het gebeurt’. De ‘hoe’ vraag laat ons immers verder afdrijven van de observatie en kan tot
metafysica leiden.
Carl Hempel, die we eerder ook al zijn tegen gekomen, is de bedenker van de ‘covering-law model of
explanation’ en probeert dit probleem aan te pakken. Hempel begon door te stellen dat we iets
geheel begrijpen, als we door hebben waarom het verklaarde event ‘moest’ gebeuren. Hempel
probeerde een verklaring te beschouwen als een logische relatie tussen statements, waardoor hij de
20
kritiek van Hume (dat een verklaring niet direct uit de data te vissen is) kon omzeilen. Er zijn voor
Hempel twee dingen, die een verklaring nodig hebben: events en wetten. Om een wet te verklaren,
kan men deze afleiden uit andere wetten, bijvoorbeeld op de manier waarop de wetten van Kepler af
te leiden zijn uit die van Newton.
Als we een event willen verklaren moeten we het afleiden uit de wetten en initiële condities. Zo
kunnen chemische en natuurkundige wetten, met een aantal initiële condities (bijvoorbeeld een
lucifer, zuurstof en een schurend oppervlak) verklaren waarom een lucifer gaat branden. Zolang de
wetten testbaar zijn is de verklaring wetenschappelijk, volgens Hempel.
We kunnen wel zeggen dat magnetisme verklaart waarom ijzer zich anders gedraagt dan hout, maar
we mogen niet zeggen dat een ‘levenskracht’ verklaart waarom levende dingen zich anders gedragen
dan de niet-levende dingen. Het verschil zit hem erin, dat de eerste onobserveerbare entiteit
gebaseerd is op onafhankelijk testbare wetten over observeerbare entiteiten en de ander niet. Ook
kan de ‘levenskracht’ geen voorspellingen maken en alleen ‘after the fact’ verklaren. De
onafhankelijk testbare wetten brengen daarom de verklaring van een event heel dicht bij de
voorspelling. Een goede verklaring brengt dus zeer waarschijnlijk een voorspelling.
Ook maakt Hempel ruimte voor een partiële verklaring. In de biologie is het bijvoorbeeld mogelijk om
het ontstaan van een soort te voorspellen in bepaalde omstandigheden. Maar een verklaring als deze
is niet precies. Er kan bijvoorbeeld niet voorspelt worden dat er in een bepaalde situatie een wezel
zal ontstaan, maar wel dat er bijvoorbeeld een klein roofdier zal ontstaan.
Het model blijkt wel verklaringen toe te staan aan de hand van hun effecten of symptomen. Het is OK
om het dalen van een barometer te verklaren, doordat er een storm aan komt, maar het gaat te ver
om te stellen dat de storm eraan komt omdat de barometer daalt. Wij zien graag de storm als de
oorzaak van de dalende barometer en niet andersom! Als we kunstmatig de barometer laten dalen,
zorgen we er immers niet voor dat er een storm ontstaat! In het model van Hempel is het mogelijk
om dit soort correlaties (tussen de storm en de barometer) beide kanten op te verklaren. Een ander
voorbeeld is dat wij geloven, dat we de positie van een planeet in de toekomst kunnen voorspellen,
met behulp van de tegenwoordige positie. We zullen niet zo gauw de tegenwoordige positie
voorspellen aan de hand van de toekomstige positie!
Ook laat de theorie irrelevante verklaringen toe. Beschouw bijvoorbeeld het volgende statement:
Mr. X werd niet zwanger na het gebruik van een anticonceptiepil. In plaats van zich te richten op het
feit dat Mr. X om te beginnen helemaal niet zwanger kan worden, richt het model van Hempel zich
toch op de activiteit van de pillen. Dit is geheel overbodig, omdat zwangerschap sowieso niet
mogelijk was! We willen in dit geval niet weten hoe de pil in het lichaam reageert! [a, H19]
CAUSALITEIT
De theorie werkt blijkbaar telkens beide kanten op, als er duidelijk spraken is van oorzaak en gevolg.
Het ‘causal model of explanation’ probeert dit op te lossen. Causaliteit kan voor de asymmetrie
zorgen, die nodig is in de theorie van Hempel. Maar empirici als Hume en Hempel hebben niet zo’n
vertrouwen in het gebruik van causaliteit. Dit is dus niet een weg die Hempel zelf is ingeslagen. Deze
theorie kan ook zorgen dat de overbodige verklaringen worden gefilterd, omdat deze ‘verklaringen’
ons wegleiden van de echte oorzaken.
21
Er bestaat echter een probleem. Als we het causal model eenmaal hebben geaccepteerd, hebben we
heel het covering-law model niet meer nodig. Een event kan nu simpel weg verklaard worden door
vast te stellen wat het veroorzaakt heeft.
Het is ook problematisch dat het strikt mogelijk is om correcte oorzaken aan te wijzen, die
onpraktisch zijn. Omdat alles is ontstaan uit de Big Bang, is het legitiem om als oorzaak voor een
verkiezingsuitslag, de Big Bang aan te wijzen. Dit gaat natuurlijk weer veel te ver.
Ook kan het causal model geen natuurwetten behandelen, omdat het problematisch is om te stellen
dat de wetten van Newton, de wetten van Kepler ‘veroorzaken’. Ook kan het verklaringen van
identificatie niet verklaren. Bij een statement als ‘de gemiddelde kinetische energie is de
temperatuur van een systeem’, hebben we geen oorzaak of gevolg.
Als wij over causaliteit nadenken als een soort fysische connectie, zoals veel mensen doen, heeft dit
een aantal counterintuïtieve gevolgen. Het kan de afwezigheid van iets, niet als een oorzaak
aanwijzen. Zo kan het ‘verdrinken’ niet als een doodsoorzaak aanwijzen, omdat het wordt verklaard
door de afwezigheid van zuurstof. Er is nog een ander probleem: De dood van Socrates maakte zijn
vrouw een weduwe, waar is hier de ‘fysische connectie’?
Een ander mogelijkheid om de causaliteit te definiëren wordt gegeven door de ‘Regularity theories of
causation’[a, H19]. Deze stellen dat een oorzaak een noodzakelijk onderdeel moet zijn van een set
oorzaken, die tezamen genoeg zijn om het effect te veroorzaken. In het voorbeeld van de lucifer is de
aanwezigheid van zuurstof een oorzaak, maar ook het wrijven van de lucifer langs een oppervlak.
Maar ook hier hebben we het probleem dat dalende barometers stormen kunnen veroorzaken. Ook
geldt dat als twee schutters tegelijkertijd een persoon neerschieten, beide schoten gelden als een
noodzakelijke conditie, die genoeg is om het effect te veroorzaken. Dit lijkt redelijk. Een ander
voorbeeld is echter problematisch: als Mr. X een dodelijk vergif inneemt en voor zijn dood door een
bus wordt overreden worden zowel de bus als het gif als doodsoorzaak gerekend.
Een andere mogelijkheid is de ‘Counterfactual approach’ van causaliteit, die causaliteit verklaart aan
de hand van wat er gebeurd zou zijn, als dingen anders waren lopen. Bijvoorbeeld: omdat de lucifer
niet aangegaan zou zijn, als er geen zuurstof was, is de zuurstof een oorzaak. In het geval van de
twee schutters komen we hier tot de conclusie dat geen van beide de dood heeft veroorzaakt, omdat
als we een van de twee schutters weghalen, het slachtoffer nog steeds gedood wordt. In het
voorbeeld van het vergif en de bus is het weer het geval dat het model geen enkele doodsoorzaak
aanwijst. Empirici spreken niet graag over dingen, die gebeurd zouden zijn, als de dingen anders
waren verlopen.
VERKLARING (VERVOLG)
We hebben ook de ‘unificationist models of explanation’. In dit model wordt aangenomen dat we
beter begrijpen als we het aantal onafhankelijk verklarende statements, waaruit we onze theorie
kunnen afleiden, kunnen verlagen. Net als de covering-law model wordt er geprobeerd de logica het
meeste werk te laten doen, maar ook deze methode kent soortgelijke problemen van oorzaak en
gevolg.
Bas van Fraassen (geboren 1941) denkt dat het helemaal niet mogelijk is om een correcte
beschrijving te geven van ‘wetenschappelijke verklaringen’. Hij denkt dat een verklaring slechts een
22
antwoord op een ‘waarom’ vraag is en dat een juist antwoord afhangt van de context. Een correcte
quantum mechanische verklaring over waarom een homp klei niet stuitert, is bijvoorbeeld geen
goede verklaring als men spreekt tegen een klein kind. Professor Kasser geeft een ander voorbeeld:
The bank robber Willy Sutton’s priest meant to ask him, “Why do you rob banks rather than have a
job?” but Sutton took “Why do you rob banks?” to mean “Why do you rob banks rather than other
places?” He replied: “Because that’s where the money is.” Sutton did not give a good explanation
because he did not give a good answer to his interlocutor’s question. [a, H20]
Van Fraassen gelooft zelfs dat verklaren geen onderdeel van de wetenschap is. We gebruiken wel
wetenschap als we verklaren, maar we gebruiken ook wetenschap als we technologie maken. Dit wil
nog niet zeggen dat technologie of verklaren bij wetenschap hoort. Van Fraassen denkt dit, omdat
verklaren altijd metafysisch is. De ontologische claims (over wat echt bestaat en wat niet) voor
theoretisch wetenschappelijke objecten dragen niets bij aan het beschrijvende of het voorspellende
succes van een theorie en zijn dus leeg (vacuous).
De kritiek op deze theorie was dat een ‘goede context’ een vaag begrip is. Ook was het opgeven van
verklaringen natuurlijk niet voor iedereen aantrekkelijk.
NATUURWETTEN
Er bestaan ook een groot aantal theorien over wat natuurwetten zijn. De ‘Regularity accounts of laws
of nature’ beschouwt deze wetten als statements over ‘what always happens’. Ze worden hier
geïdentificeerd als patronen in de data en niet met ‘iets’ buiten deze data dat deze patronen
veroorzaakt. Het is wel moeilijk voor dit model om onderscheid te maken tussen de ‘echte’ wetten
en ‘accidental generalizations’. Een statement als ‘al hier bier in mijn koelkast komt uit Amerika’,
voldoet aan de eisen van het model, maar is geen natuurwet. We kunnen niet zeggen dat dit soort
statements niet gelden, omdat ze maar op een plek en tijdelijk geldig zijn, omdat we de mogelijkheid
open willen houden dat sommige natuurwetten maar op één plaats werken (bijvoorbeeld in een
zeldzaam zwart gat) of op een bepaalde tijd (bijvoorbeeld in het begin van het universum). Een ander
probleem zijn de zogenaamde ‘Vacuous laws’. Dit zijn wetten over dingen, die niet gebeuren, zoals
‘alle deeltjes die sneller bewegen dan het licht zijn groen’. Een voor de hand liggende oplossing is het
verbieden van deze wetten, maar Newton’s eerste wet (over hoe lichamen bewegen als er geen
krachten op werken) gaat dan ook niet op. Nergens in het universum bevinden zich immers objecten
waar geen krachten op werken!
‘Epistemic regularity models’ onderscheiden natuurwetten met behulp van de manier waarop we ze
behandelen. Natuurwetten (als ‘koper geleidt elektriciteit’) krijgen door ons een speciale
behandeling, in tegenstelling tot bijv. de Amerikaanse bier in de koelkast. We kunnen verklaren dat
een object elektriciteit geleidt omdat het koper is, maar niet dat bier Amerikaans is, omdat het uit
mijn koelkast komt. De ‘echte’ natuurwetten zijn ook niet zo snel te verwerpen met nieuwe
informatie, zoals dit geldt voor de ‘accidental generalizations’. Ook zijn we van het bestaan van
natuurwetten vrij snel overtuigd. Na het derde blok koper geloven wij vaak al dat koper elektriciteit
geleidt, maar van het Amerikaanse bier in mijn koelkast raken we niet snel overtuigd, ook al komen
er 60 Amerikaanse biertjes uit mijn koelkast. Het is duidelijk dat dit een hele praktische manier is om
natuurwetten te beschrijven! We zijn volgens deze theorie als mensen blijkbaar in staat om
natuurwetten van ‘accidental generalizations’ te onderscheiden. De moeilijkheid is dat deze theorie
23
niets vertelt over onontdekte wetten. Ook lijkt het menselijke aspect van deze theorie op een milde
vorm van Cartesianisme, waarbij onze manier van denken voorschrijft hoe de werkelijkheid eruit ziet.
De ‘systems theory’ stelt dat natuurwetten, diepe structurele patronen zijn in events. We
identificeren dit patroon door de beste axioma’s te vinden, waaruit de patronen te deduceren zijn.
Met ‘beste’ wordt in dit geval bedoeld: de meest informatieve en simpele axioma’s. Om dit te doen
moeten we de volgende afweging maken: Een meest simpele theorie zou zijn: ‘alles gebeurd volgens
de wil van Elvis’, maar dit is niet erg informatief. Als we elk event echter beschouwen als een apart
statement, dan is dit heel informatief, maar zeker niet simpel. Deze twee begrippen werken dus
tegen elkaar in en de afweging, die we moeten maken, is daarom vrij subjectief.
In dit model worden de niet-voor-komende wetten wel toegelaten, hoewel ze wel moeten bijdragen
aan de simpelheid en de informatie. Ook is het mogelijk om een wet te hebben, die alleen geldt in
een bepaalde periode of plaats, maar wederom sluit de simpelheid en de informatie de gekke
voorbeelden uit. Ook onontdekte wetten worden in dit systeem opgenomen. Om deze redenen is dit
de meest geslaagde empirische theorie over de natuurwetten.
De Necessitarians voelen zich niet gebonden door de empirische claims. Ze kunnen daarom ook
aannemen dat natuurwetten krachten (powers) of neigingen (tendencies) zijn, die zelf niet direct te
observeren zijn, maar wel de observeerbare fenomenen kunnen verklaren. Ze denken niet dat een
wet een relatie is tussen verschillende objecten, maar dat het een relatie is tussen eigenschappen
(properties). De eigenschap koper zorgt dat een materiaal elektriciteit geleidt. De wetten van de
Necessitarians zijn niet slechts beschrijvingen van patronen, maar opererende krachten, die in de
natuur werken. Ze stellen niet dat we geen niet-geleidend koper ‘zullen’ vinden, maar dat de wet een
dergelijk event verbiedt! Ze stellen niet dat een dergelijk event niet voor komt, maar dat het absoluut
niet kan gebeuren: ‘It is not just that won't find any non-conducting copper, you cannot find it’. De
wetten van de Necessitarians beschrijven een fysische noodzakelijkheid.
De theorie is ook bestand tegen ‘vacuous laws’. In ons voorbeeld (‘alle deeltjes, die sneller gaan dan
het licht, zijn groen’) bestaat er geen noodzakelijke relatie tussen de eigenschap ‘snelheid’ en de
eigenschap ‘groen’, waardoor het niet als een wet wordt erkend. Wetten, zoals de eerste wet van
Newton, die strikt genomen nergens in het universum plaats vinden, kunnen wel toegestaan worden,
omdat er een noodzakelijke relatie bestaat tussen de eigenschap ‘niet versnellen’ en de eigenschap
‘geen krachten ondervinden’. De ‘eigenschappen’ zijn duidelijk metafysische concepten. De wet van
Newton gaat voorbij de data, omdat de wet in de data niet eens voor komt! Bier in de koelkast is
echter niet noodzakelijk Amerikaans, want ik kan er ook een Duits biertje in zetten.
Hoewel een Necessitarian gelooft dat wetten een noodzakelijkheid zijn en niet overtreden kunnen
worden dacht Ayer juist dat niets in het heelal in staat is om verboden of verplichtingen op te leggen.
Niets in het universum zegt tegen een elektron ‘nee, nee, niet sneller gaan dan het licht’. De wetten
beschrijven niet wat moet of wat verboden wordt, maar simpelweg wat ‘gebeurd’ of wat objecten
‘doen’. Of zoals professor Kasser het zegt: you don’t see things ‘having’ to happen, you just see them
happen’.
Moet het behoud van energie opgevolgd worden of is dit gewoon wat deeltjes doen? De
quantummechanica stelt dat deeltjes voor korte periodes het behoud van energie kunnen schenden.
Dit lijkt er op te wijzen dat deeltjes tot anders in staat zijn. En ander voorbeeld is het principe van
24
Fermat, dat stelt dat licht altijd de snelste route door een materiaal kiest. Is dit een opgelegde wet
van de kosmos of is het simpelweg een quantummechanisch effect, waarbij alle andere bewegingen
wiskundig tegen elkaar wegvallen en dus niet mogelijk zijn. Maar wellicht verbiedt het universum wel
om sneller te bewegen dan het licht, omdat we ons altijd binnen het kader van de ruimte en de tijd
bevinden.
Ook kunnen deze ideeën gebruikt worden voor de ‘verklaring’. Hoewel een patroon in de data
(hetgeen de empirici gebruikten) geen verklaring is, zijn opererende wetten dat wel. De
Necessitarians geloven zelfs dat er wetten kunnen bestaan, die opereren zonder dat de
corresponderende eigenschappen aanwezig zijn. Stel dat we al het koper uit het universum zouden
verwijderen, dan geldt toch: ‘al het koper geleidt elektriciteit’, alsof het dus echt een noodzaak van
het universum zelf is.
De empirici vragen zich natuurlijk af: Hoe kan je weten of iets een ‘noodzakelijke relatie’ is? Als twee
werelden bijvoorbeeld verschillende natuurwetten zouden hebben, maar dezelfde feiten, dan
zouden we niet in staat zijn deze wetten te kennen. Een goed voorbeeld is het verschil tussen twee
universa, waarin alle wetten met observabele consequenties hetzelfde zijn, maar de andere wetten
niet.
Nancy Cartwright denkt als volgt over natuurwetten: of de wetten zijn fout, maar kunnen worden
gebruikt in wetenschappelijke verklaringen of ze zijn juist maar nutteloos voor het verklaren. Ze
merkt op dat onze meest fundamentele wetten niet beschrijven hoe objecten in werkelijkheid
bewegen, maar altijd een benadering zijn. Als een wet goed is, stelt Cartwright, dan is de wet alleen
te gebruiken in heel erg beperkte situaties, maar dit verpest de verklarende waarde van de wet.
Cartwright denkt daarom dat de wetten niet beschrijven wat er in werkelijkheid gebeurd, maar
slechts ‘powers’ of ‘tendencies’ zijn, die kunnen verklaren wat er gebeurd. Dit is dus grofweg het
standpunt van de Necessitarians.
Veel natuurkundigen denken dat de wetten ‘in principe’ wel precies werken en dat slechts onze
benaderingen ervoor zorgen dat de wetten niet exact beschrijven. Omdat we nu eenmaal niet de
zwaartekracht van elke atoom in het hele universum willen opmeten om te weten te komen hoe een
steen valt, maken we benaderingen.
REDUCTIE
We spreken van de reductie van een theorie als de theorie een direct gevolg blijkt de zijn van een
‘fundamentelere’ theorie. We kunnen reductie toepassen op dingen (zoals water dat tot H2O
gereduceerd kan worden) of op natuurwetten (zoals de wetten van Kepler die tot de wetten van
Newton gereduceerd kunnen worden). In het geval van reductie wordt de oude theorie niet
verworpen als onwaar, maar juist ondergebracht in een grotere theorie. Dit zorgt vaak voor een
verhoging van de verklarende kracht van de theorie. De feiten en de wetten van de eerste theorie
blijken nu verklaart te kunnen worden met diepere feiten en wetten! Een voorbeeld is de overstap
van thermodynamica naar statistische mechanica. De vindingen van de thermodynamica bleven
bestaan, maar begrippen als ‘temperatuur’ konden nu worden beschreven in termen van de
beweging van moleculen. De klassieke positivistische versie van de reductie beschouwt het als een
deductieve relatie, waarbij uit de nieuwe theorie de oude is af te leiden.
25
We kunnen twee soorten reductie onderscheiden: homogene en heterogene. De eerste gaat over
reductie, waarbij de termen van de gereduceerde theorie blijven bestaan in de nieuwe theorie. Een
klassiek voorbeeld is de ‘snelheid’ in de theorie van Kepler en Galileo en de snelheid in Newton. In al
deze theorieën had ‘snelheid’ dezelfde betekenis. Heterogene reductie treedt op wanneer de termen
veranderen. Warmte en temperatuur zijn fundamentele grootheden in de thermodynamica, maar
werden vervangen door de beweging van moleculen in de statistische mechanica. Het gebruik van
‘bridge principles’ kan hierbij uitkomst bieden. Een ‘bridge principle’ kan de nieuwe termen in de
oude termen uitdrukken. In dit geval: ‘temperatuur is de gemiddelde moleculaire kinetische energie’.
De ‘bridge principles’ zijn niet simpelweg definities. Temperatuur ‘betekent’ niet hetzelfde als
‘gemiddelde moleculaire kinetische energie’. De bridge principles zijn empirische hypothesen, die
objecten of processen van de oude en de nieuwe theorie identificeren. Uit de nieuwe theorie en de
bridge principles tezamen kan de oude theorie weer gededuceerd worden.
Het lijkt erop dat het een karakteristiek van de reductie is dat het over het algemeen verder afstand
neemt van de observabele wereld. Het voorbeeld van temperatuur naar de beweging van moleculen
illustreert dit, maar ook van moleculen naar atomen en uiteindelijk naar quarks is een goed
voorbeeld.
Noodzakelijk voor dit soort reductie is dat de oude en de nieuwe theorie logisch consistent zijn, maar
zelfs in de minst problematische reducties, maakt de nieuwe theorie ook een correctie aan de oude
theorie. Omdat Galileo in zijn theorie een constante valversnelling gebruikte, is dit niet logisch
consistent met Newton die een variabele valversnelling gebruikte. Dus is de theorie van Galileo dan
wel te reduceren tot die van Newton?
De klassieke reactie hierop is dat Galileo’s theorie een benadering is van de theorie van Newton en
dat uit de theorie van Newton, de wet van Galileo bij benadering volgt. Maar dan nog hebben we in
principe niet gereduceerd. Als we dit wel als een reductie rekenen, dan moeten we ons afvragen in
wat voor zin de reductie nog verschilt van het vervangen van de oude theorie door de nieuwe.
Ook is het zo dat Newton niet simpelweg een benadering geeft van Galileo. In veel gevallen maakt
het een heel groot verschil of je aanneemt dat de valsnelheid constant is of variabel! Dit geldt ook
voor de ‘reductie’ van Newton naar Einstein. Uit de wetten van Einstein, zo zegt men, volgen bij
benadering de wetten van Newton, maar wanneer de snelheden van objecten groot worden, wordt
de wet van Einstein heel anders dan die van Newton.
Kuhn en Feyerabend geloven dat de incommensurabiliteit tussen de twee theorieën het onmogelijk
maakt om identificaties te maken tussen twee eigenschappen van twee theorieën. Het hele idee van
massa, tijd en ruimte veranderd in Einstein. Dit alleen al maakt een één-op-één reductie onmogelijk.
Misschien moeten we niet zo streng zijn als Kuhn, maar dan moeten we weer uitkijken, dat onze
theorie niet toestaat dat demonische possessie opeens gereduceerd kan worden tot geestesziekten
of Aristoteles tot Newton of de alchemie tot de chemie.
In de natuurkunde wordt met een benadering van de oude theorie door een nieuwe theorie bedoeld,
dat de oude theorie (plus bepaalde initiële condities) de nieuwe theorie reproduceert. Deze condities
leggen de nieuwe theorie omstandigheden op, waarbij de oude theorie een benadering is. De wetten
van Einstein kunnen bijvoorbeeld bij benadering worden herleid tot de wetten van Newton, mits de
26
snelheid van de objecten in kwestie, klein blijven ten opzichte van de lichtsnelheid. Newton en een
initiële conditie (dat de zwaartekracht niet te veel mag veranderen over de afstand waarover een
object valt) geeft bijvoorbeeld een keurige benadering van Galileo.
Een extreme vorm van reductie is het ‘unity-of-science program’, waarin noodzakelijk wordt geacht
dat alle wetenschappelijke theorieën uiteindelijk te reduceren zijn tot fundamentele natuurkunde.
De natuur zorgt voor verassende dingen, zoals het menselijk brein of de vele verschillende
eigenschappen van atomen en moleculen, maar uiteindelijk is alles terug te leiden tot fundamentele
natuurkunde.
Dit maakt de zogenaamde ‘functional properties’ problematisch. Een thermometer is bijvoorbeeld
een object met een functionele eigenschap. Een object als een thermometer hoeft niet perse
materiële overeenkomsten te hebben met andere thermometers. Een thermometer is in termen van
materiaal op verschillende manieren te realiseren. Er lijken geen ‘noodzakelijke voorwaarden’ te
bestaan, waaraan de materiële eigenschappen van een thermometer moeten voldoen. Het is ook
een lastig probleem om bridge principles te gebruiken om gepraat over een thermometer uit te
drukken in gepraat over materie.
Een mogelijke reactie hierop is om niet één materiële eigenschap voor een thermometer te
gebruiken, maar een hele lijst. Dus: kwik in een buisje wordt een thermometer, een bepaalde
weerstand wordt een thermometer etc. In dit geval reduceert een lijst van materie-eigenschappen
zich tot thermometers. Hetzelfde gaat op voor een begrip als geld, dat mogelijk uit te geven is in
metalen, papieren en digitale vorm. Bridge properties, waarbij een hele lijst gegeven moet worden,
zijn ook niet echt verklarend. Ze verklaren hoe elke individuele thermometer werkt, maar verklaren
niets over de karakteristieken van een thermometer in het algemeen. Ook kan je nooit weten of de
lijst met Bridge properties compleet is.
We moeten dus niet zomaar aannemen dat een reductie alleen maar goeds brengt en dat we er
nergens op achteruit gaan. We riskeren ook het verlies van een deel van de verklarende krachten van
de oude theorie. Een bekend voorbeeld hiervan komt van Alan Garfinkel:
Stel dat een bioloog een populatie konijnen bestudeert, die omgekeerd evenredig verandert ten
opzichte van een vossenpopulatie. De verhoogde kans op de dood van een konijn kon hij verklaren
door naar de hoge populatie vossen te wijzen. Een ‘fundamentelere’ theorie zou verklaren: een
bepaald konijn gaat dood, omdat het een bepaalde vos op een bepaalde plaats en tijd tegen het lijf is
gelopen. Maar dit zijn verschillende feiten! En soms is het precies het minder specifieke feit dat we
willen verklaren. De eerste verklaring kan verklaren waarom een konijn waarschijnlijk ook dood was
gegaan, als hij een heel andere route had genomen! Je wil soms niet weten welk konijn door welke
vos is gedood, maar juist een minder gedetailleerd antwoord, bijvoorbeeld de kans dat ‘een’ konijn
door ‘een’ vos wordt opgegeten.
Garfinkel gelooft dat verklaringen hun eigen ‘level’ opzoeken en dat er niks incompleet is aan de
verklaring op het ‘level’ van de bioloog.
Weer komt de volgende vraag boven: wat kunnen we als een ‘real property’ beschouwen? De
thermometer maakt vanuit het materiële oogpunt een ongeorganiseerde, ongeünificeerde indruk,
bijna gelijk aan de 'brocosaxodillen’! Misschien dat dit soort begrippen alleen een ‘realiteit’ hebben
27
op de ‘level’ van de gereduceerde theorie. Ze hebben iets gemeen op het instrumentale level, maar
niet op het materiële level.
BETEKENIS
We moeten betekenis onderscheiden van de referentie. ‘Einstein’ en ‘de ontdekker van de
relativiteitstheorie’ refereren naar elkaar, maar hebben zeker niet dezelfde betekenis. Een ander
voorbeeld is dat een ‘wezen met een hart’ refereert naar ‘een wezen met een nier’, maar toch
bedoelen we met beide dingen iets anders. Kuhn dacht dat als genoeg statements in een theorie
veranderen, dat dan ook de referentie verandert. Wederom het voorbeeld van de massa in Newton
en Einstein: het begrip massa refereert naar iets heel anders in de verschillende theorieën. Einstein
maakte niet een betere theorie over de massa van Newton, maar hij maakte een theorie over zijn
eigen versie van het begrip massa.
Voor Kuhn is de referentie niet problematisch. Phlogiston bijvoorbeeld refereert naar een oorzaak
van verbranding en zuurstof ook. De meeste filosofen echter denken dat het natuurlijker is om te
stellen dat phlogiston nooit heeft bestaan en dat het dus onmogelijk ergens naar heeft kunnen
refereren. Maar ook hier zijn moeilijkheden. Omdat Franklin de elektriciteit verkeerd beschreef, zou
hij nooit over elektriciteit gepraat kunnen hebben, omdat er niets in de wereld bestaat dat
overeenkwam met zijn beschrijving!
Wat we willen is een theorie, die deze voorbeelden wel toestaat. De theorie moet ons laten
verwijzen naar iets ‘echts’, ook al geven wij een verkeerde beschrijving voor deze realiteit. Als we
naar bepaalde dingen refereren, dan maken we volgens deze theorie gebruik van een stereotype van
dit ding. Dit stereotype kan onjuist zijn en veranderen in de tijd, maar het object waar we naar
verwijzen kan hetzelfde blijven[c, 81]:
Dit kan worden gedaan door de referentie niet te laten afhangen van de beschrijving, maar van de
‘historical chain’ van een begrip. Als we het bijvoorbeeld hebben over ‘Buchanan, de 14de president
van Amerika’ (terwijl hij de 15de is), refereren we nog steeds naar dezelfde persoon. De naam van
Buchanan is niet afhankelijk van de beschrijving van zijn functie. Het gebruik van zijn naam wordt
gelinkt aan de eerdere keren dat zijn naam gebruikt is, uiteindelijk tot aan het moment dat hij van
zijn ouders zijn naam ontving. Hacking maakt duidelijk[c, 80]:
28
De ‘essentiële’ connectie tussen de naam van Buchanan en de persoon is zo sterk, dat het de
vergissing over zijn presidentschap overleeft. Dit geldt ook voor biologische begrippen zoals de
walvis. Iemand die naar een walvis wijst en zegt ‘kijk eens wat een grote vis (terwijl het geen vis is)’
refereert nog steeds naar een walvis. Dit maakt de incommensurabiliteit een stuk minder dreigend.
Met deze methode kunnen mensen uit andere paradigma’s, nog steeds naar dezelfde fenomenen
verwijzen!
Ook kan men met deze theorie betekenisvol praten over de ongeobserveerde realiteit. Als we praten
over de atoomstructuur van water gaat het nog steeds over hetzelfde water, waar ook Aristoteles
naar refereerde. In dit voorbeeld refereren beide theorieën naar een bestaand fenomeen. Het model
wordt alleen problematisch als een fenomeen, dat eerst werd gedacht te bestaan, uiteindelijk niet
bestaat. Stel dat wij naar een detector kijken en een lijn laten refereren naar een elektron. Na
verloop van tijd blijkt de lijn echter een defect van de detector te zijn. Waar hebben wij in dit geval
naar verwezen? Ook maakt de theorie het gepraat over onobserveerbare realiteit soms te
gemakkelijk. We willen bijvoorbeeld vermijden dat wanneer iemand phlogiston gebruikt, hij naar
zuurstof refereert. We willen dat beide theorieën naar verbranding verwijzen, maar niet ook nog
eens naar elkaar!
In 1923 vond men dat het aantal zuren groter was dan gedacht. Deze extra zuren konden worden
ingedeeld in twee natuurlijke groepen. Alle standaard zuren hoorden zowel bij de ene als bij de
andere groep, maar de nieuwe zuren behoorde tot de een of tot de ander. Als Lavoisier sprak over
zuren, welke van deze twee groepen bedoelde hij dan. Het antwoord is geen van beide. Men kan
zeggen dat Lavoisier sprak over alles dat voor 1920 gezien werd als een zuur, maar dit lijkt niet echt
een ‘natural kind’! We zouden ook de intersectie van de twee definities kunnen nemen, maar ook dit
is zeker geen ‘natural kind’. Een ander tegenvoorbeeld is het begrip ‘caloric’.
[c, 86]
Omdat ‘caloric’ niet bestaat is de extensie van dit begrip een lege verzameling. Toch waren er
destijds vele verschillende theorieën over ‘caloric’ en het lijkt erop dat deze theorieën over hetzelfde
29
fenomeen spraken. Maar dit ding bestond helemaal niet! Phlogiston bleek ook niet te bestaan en
refereert dus ook naar ‘dezelfde’ lege verzameling, maar we kunnen hier toch niet uit concluderen
dat beide theorieën naar dezelfde entiteit verwezen?
[c, 87]
Een ander probleem treedt op in de volgende situatie, die nu en dan in de wetenschap voor komt:
[c, 87]
REALISME
De meeste filosofen hebben het zoeken naar een wetenschap, die niet naar een onobserveerbare
realiteit refereert, opgegeven.
‘Scientific realism’ is een stroming, die gelooft dat wetenschap zowel observeerbare als
onobserveerbare realiteit correct kan beschrijven. De ‘harde realisten’ geloven dat sommige
‘properties’ van onze theorieën echt in de externe wereld bestaan en andere niet. Goud bijvoorbeeld
is een ‘real property’ van de natuur, terwijl jade dat niet is (jade is de gemeenschappelijke naam voor
twee edelstenen: jadeïet en nefriet). De ene property komt echt ‘out there’ in de natuur voor en de
ander niet.
‘Softe realisten’ geloven daarentegen dat de keuze van bepaalde ‘properties’ die we gebruiken,
afhangt van onze interesses. De manier waarop wij categoriseren, is een manier die voor ons als
mensen nuttig is. De manier waarop wij onderscheid maken, is niet perse de manier waarop ‘het
universum’ onderscheid maakt (dit heet ook wel nominalisme). We beschrijven met onze theorieën
wel de werkelijkheid, maar gebruiken daarbij termen, die overeenkomen met onze interesses. Net
als in het concept jade, beschrijft dit iets over de wereld, maar wil dat niet zeggen dat de
buitenwereld deze groepering van jade ook als essentieel kenmerkt.
Een grote tegenstander van ‘scientific realism’ is natuurlijk de ‘underdetermination of theory by
data’[a, H26]. Hoe kan men beweren dat een theorie echt iets vertelt over de werkelijkheid als er ook
een andere theorie mogelijk is, die dezelfde data verklaart? Een andere is de ‘pessimistic induction’.
Omdat we eerder goede theorieën hebben gehad, die uiteindelijk fout bleken te zijn, kunnen onze
huidige theorieën ook fout zijn. De geschiedenis wijst uit dat de beste standaarden van wetenschap
foute theorieën hebben toegelaten. Succes is dus geen garantie. Maar wat zegt succes dan wel? Hoe
kan een theorie met succes voorspellen, als het niet tenminste een beetje ‘waar’ is?
VAN FRAASSEN
De ‘constructive empiricism’ van Van Fraassen geeft toe dat we in onze theorieën het bestaan van
bijvoorbeeld elektronen moeten aannemen voor onze theorie, maar dat dit nog niet hoeft te
betekenen dat wij als mensen dit ook moeten aannemen. Wij zijn niet in de positie om kennis te
30
verwerven over onobserveerbare realiteit. Op zijn best kunnen we geloven dat onze theorieën
empirisch adequaat zijn, dat wil zeggen, correct zijn in alles wat ze te zeggen hebben over
observeerbare realiteit. Van Fraassen staat het toe om inductie te gebruiken van observabele naar
andere observabele fenomenen en te verklaren in termen van observabele entiteiten.
Een realist kan hier tegenoverstellen, dat we wel technieken kunnen toepassen op de onobservabele
realiteit, als deze geldig zijn voor de observabele realiteit. Maar dit is problematisch. Omdat de
klassieke mechanica werkt voor de macroscopische wereld, betekent dit nog niet dat we het ook
kunnen gebruiken voor het beschrijven van een elektron. Ook denkt een realist dat een instrument
als een microscoop gewoon de reikwijdte van onze zintuigen verlengt, maar Van Fraassen stelt dat
zulke instrumenten met theorie en gepraat over onobservabele realiteit doordrongen zijn.
Ook kan een tegenstander zich afvragen waarom Van Fraassen niet naar onobserveerbere, maar wel
naar observeerbare termen verwijst in een verklaring. Een verklaring met observeerbare termen gaat
immers ook voorbij de data.
NATURALISME
Naturalisme is een stroming die het geheel heeft opgegeven om de wetenschap te rechtvaardigen
met behulp van filosofie. Het geeft ook het idee van ‘a priori’ kennis op. In plaats van met een
filosofisch oog, kijkt het op een wetenschappelijke manier naar de wetenschap. Quine verdedigde
eerst een sterke vorm van het naturalisme. Als we willen weten hoe de wetenschap redeneert en
hoe we kennis verwerven, dan moeten we geen filosofie doen, maar dan moeten we neurologie
doen. Als we willen weten hoe wij redeneren, dan moeten we uitvinden hoe de hersenen werken, als
ze wetenschappelijk redeneren. Niet alle naturalisten waren echter zo reductionistisch als Quine was.
SOCIALE FACTOREN
Volgens onder andere de logisch positivisten zijn sociale fenomenen in de wetenschap verstorende
fenomenen, die de objectiviteit in de weg staan. Voor veel sociologen zijn sociologische fenomenen
veel dieper in het wetenschappelijke werk verborgen dan een wetenschapper zou toegeven.
Sociologen denken dat het vaak gebeurd dat ‘logica’ en ‘bewijzen’ een masker zijn voor
‘onwetenschappelijke’ bias en interesses. Kuhn dacht, zoals we hebben gezien, dat de sociale
aspecten niet perse slecht waren, maar juist ook goed konden zijn voor de ontwikkeling van de
wetenschap.
‘Naturalized epistemology’ gelooft ook dat de sociologische aspecten een positief effect hebben op
de ontwikkeling van de wetenschap, maar denken ook dat dit niet betekent dat de wetenschap zijn
speciale status kwijtraakt. Het systeem waarin wetenschappers geprezen worden voor goede
onderzoeksresultaten, is een goed voorbeeld hiervan. Omdat wetenschappers op elkanders ideeën
teren lokt dit ook het testen en herhalen van experimenten van anderen uit.
In de 1970’s ontstond er de zogenaamde ‘strong program’ in de sociologie van de wetenschap. Een
belangrijk principe van deze stroming was het symmetrie principe, dat stelde dat een onredelijk of
onwaar geloof in deze stroming dezelfde behandeling krijgt als een redelijk en waar geloof. Deze
stroming probeert de wetenschap niet uit te leggen aan de hand van wat waar is en wat niet, maar
door middel van locale sociale omstandigheden, praktijken en normen. Net als Quine geloven de
sociologen dat ‘bewijzen’ min of meer krachteloos zijn en de keuzes worden gedetermineerd door
31
sociale omstandigheden. Hoewel de wetenschappers misschien zelf denken dat ze rationeel bezig
zijn, werpen de sociologen tegen dat wel meer groepen dit van zichzelf denken. Net als een
antropoloog, die een stam onderzoekt, neemt de socioloog niet aan dat de wetenschap enige
waarheid bezit, maar proberen ze de handelingen van de stam sociologisch te begrijpen.
CONCLUSIE
Waarschijnlijk kan de wetenschap niet bestaan zonder dat er metafysica meespeelt. Omdat we deze
metafysische concepten niet kunnen testen moeten we er dus heel voorzichtig, flexibel en
zelfbewust mee omgaan. Hoewel wetenschappers vaak denken niet aan filosofie te doen, is dit
slechts schijn. ‘Scientists tend to commit philosophy when they explain what they do’, zegt professor
Kasser [a, H36].
De zoektocht naar een oplossing voor het demarcatie probleem lijkt niet veelbelovend. Het lijkt erop
alsof de echt diepe problemen in de filosofie een oplossing schuwen. De speciale status van de
wetenschap kunnen we niet vangen in een enkele methode. Ook is het de filosofie niet gelukt om
ook maar een beetje objectieve kennis te vinden, ondanks een intensief zoeken van langer dan 2000
jaar. We hebben gezien dat er zelfs filosofen waren, zoals Feyerabend in de 20ste eeuw en Nietzsche
in de 19de, die niet eens meer geloofde in de mogelijkheid tot het vinden van zekere kennis. Toch
gingen anderen stug door in hun zoektocht, zoals Einstein bijvoorbeeld. Maar dit ‘negatieve’
resultaat van de filosofie is ook een resultaat. We zijn er in ieder geval achter dat de meest voor de
handliggende oplossingen niet blijken te werken en dat de wetenschappelijke theorieën, wetten en
verklaringen complexer zijn dan we tot dusver hebben gedacht. Dit is in strijd met de overheersende
gedachte in de wetenschap zelfs, dat deze concepten onproblematisch zijn. De lijkt me daarom een
zeer interessant resultaat!
32
DESCARTES: DE ANALYTISCHE MEETKUNDE
In 1591 schreef de wetenschapper Viète zijn ‘Introduction to the Analytic Art’[a, 143], waarin hij voor
het eerst een algemene vergelijking opstelde, zonder geneigd te zijn de variabelen tot bepaalde
getallen te reduceren. Zelfs nummers konden in de algebra worden beschouwd als puur wiskundige
entiteiten, onafhankelijk van een fysische context. Voor de Grieken was dit een probleem. De
bedoeling van de Grieken was vooral om de eigenschappen van geometrische figuren te ontdekken
en vanwege deze fysische of geometrische afhankelijkheid was bijvoorbeeld het vermenigvuldigen
van meer dan drie lijnen onmogelijk (omdat er maar drie dimensies waren). Een aantal wiskundigen
had al gemerkt dat met de algebra meer mogelijk was dan met de geometrie van de Oude Grieken.
De algebra kon hele complexe situaties nog steeds duidelijk en overzichtelijk beschrijven. Descartes
ging veel verder door de analytische meetkunde uit te vinden.
Zelfs wiskundestudenten verbaast het als ze horen dat de analytische meetkunde pas in de 17de
eeuw is komen te ontstaan. De analytische meetkunde wordt gebruikt om krommen te beschrijven
met behulp van de algebra. Deze uitvinding, die nu van alle dag is, was destijds een grote
vernieuwing. De weg naar deze ontdekking is een uniek verhaal, dat we hier heel kort schetsen,
gebruikmakend van materiaal rechtstreeks uit ‘La Geometrie’[b] van Descartes.
Van filosofisch belang is in dit stuk vooral de grotere reikwijdte van een vakgebied, door simpelweg
in een andere (symbolen-)taal te gaan schrijven. In een zekere zin is de algebra een omschrijving van
geometrische patronen in algebraïsche vergelijkingen, toch kan men met de algebra veel
ingewikkeldere constructies analyseren dan het geval is met de geometrie. Een ander punt is de late
ontdekking van de grafiek. Dit zegt mij dat een dergelijk mathematisch object helemaal niet zo voor
de hand ligt als we tegenwoordig denken (een nog sterker voorbeeld is het behoud van energie als
een optelsom van de kinetische en de potentiële energie. Dat nu klinkt als gesneden koek, maar
eigenlijk is het pas in de tweede helft van de 19de eeuw met veel moeite is geformuleerd[d. H29]. Nog
geen 50 jaar later werd het al weer gegeneraliseerd in het werk van Einstein, die vond dat ook de
massa een rol speelde in het behoud van energie. Later vond men in de quantummechanica dat ook
energie aan de onzekerheidsrelaties moet voldoen en daardoor het energiebehoud tijdelijk
geschonden kan worden).
INSTRUMENTALE WISKUNDE
Descartes maakte in 1619 een interessante keuze in zijn studie in de wiskunde. Hij focuste zich niet
alleen op geometrie of alleen algebra, maar op een meer instrumentale techniek[a, 49]. Hij probeerde
met passer en liniaal geometrische en algebraïsche problemen op te lossen. Zijn methode is enorm
interessant en de resultaten ervan zullen doorklinken in zijn volwassen wiskunde.
33
Descartes kruiste de twee lijnen XY en YZ onder een verstelbare hoek. Daarna koos hij een
willekeurige plek waar hij een lijn loodrecht op XY zette, die hij BC noemde. Vanuit het punt C maakte
hij een loodrechte lijn op de lijn YZ etc. U kunt zich wellicht voorstellen dat wanneer het punt B zich
op een vaste plek op de lijn XY bevindt en de hoek tussen de twee lijnen XY en YZ wordt veranderd,
de andere punten een nieuwe, maar unieke, positie innemen. Een belangrijk punt van deze
geometrische beschrijving is dat Descartes het beschouwde als een fysische opstelling, die met
simpele materialen te maken was.
Descartes definieerde dat de lijn BY lengte ‘1’ had en opende daarna de lijnen XY en YZ, zodat de lijn
CE een willekeurig te kiezen waarde ‘a’ aannam. Hij noemde CY ‘x’.
Daarna maakte Descartes gebruik van de verhoudingen tussen de rechte driehoeken BCY, CDY en
DEY. Omdat alle driehoeken zowel een rechte hoek en de hoek XYZ hebben, zijn al deze driehoeken
congruent. Dit betekent dat ze, hoewel van verschillende grote, exact gelijke verhoudingen hebben.
Er geldt[a, 49-50,85]:
We kunnen dan invullen:
YD moet dus gelijk zijn aan x2 en YE aan x3. Ook weten we dat EY gelijk is aan CY + CE. We vinden:
34
Hieruit kunnen we concluderen dat, wanneer we CE vrij kiezen, de lengte van het lijnstuk CY van ons
geometrisch instrument het antwoord geeft van de vergelijking x3 = x + CE! Dus Descartes heeft een
simpel geometrisch instrument gebouwd, waarmee men vrij gemakkelijk het antwoord van een
bepaald type derdegraads-vergelijking kan aflezen.
Het is apart om op te merken dat een instrumentele aanpak van algebra geen negatieve antwoorden
toelaat, omdat negatieve lengtes niet bestaan, hoewel de algebra wel negatieve antwoorden toelaat.
Ook is het belangrijk om het volgende op te merken: hoewel zijn aanpak wiskundig solide is en de
lengte van het lijnstuk CY werkelijk gelijk is aan de ‘x’, moeten we uiteindelijk toch de (in principe
onnauwkeurige) fysische liniaal gebruiken, om de grootte van het lijnstuk CY te meten. Toch moet u
het met me eens zijn dat zijn methode ingenieus, origineel en ook best handig is.
DE ANALYTISCHE GEOMETRIE
Ook maakte Descartes in zijn ‘de Geometrie’[b] van 1637 een ‘algebra van lijnstukken’. Hij liet daarin
zien dat optellen, aftrekken, vermenigvuldigen, delen, worteltrekken en kwadrateren allemaal te
representeren waren in lijnlengtes. Laten we als voorbeeld de wortel nemen[b, 316]:
Hij construeerde een halve cirkel en doorkruiste deze met een verticale lijn, zoals weergegeven in de
eerste van de volgende afbeeldingen. Hij stelde het horizontale lijnstuk links van de verticale lijn
gelijk aan de eenheidslengte. En de lijn aan de andere kant gelijk aan ‘x’. Met behulp van de stelling
van Pythagoras en de kennis over de straal van de cirkel kan dan bepaald worden (zoals in het
tweede figuur is uitgewerkt) dat het verticale lijnstuk tussen de twee snijpunten met de halve cirkel
exact gelijk is aan ‘√x’! Wederom geeft deze methode geen exacte antwoorden. Ook al is de
procedure wiskundig solide, uiteindelijk moet toch de meetlat erbij gepakt worden om de wortel van
‘x’ daadwerkelijk te meten.
LA GEOMETRIE
Het werk La Géométrie van René Descartes is een van de belangrijkste werken in de wiskunde en
hoewel geschreven in de 17de eeuw is het erg goed leesbaar voor de moderne lezer, omdat Descartes
bijna alleen notatie gebruikt, die wij ook gebruiken.
De geometrie van Descartes was niet systematisch. Hij gaf voorbeelden en maakte suggesties over
wat zijn theorie allemaal zou kunnen bewerkstelligen. Toch waren deze voorbeelden zeer krachtig en
legde hij de basis voor de analytische meetkunde en daarmee het begin van de grafiek, hetgeen
vanzelfsprekend gigantisch belangrijk is voor de wiskunde.
35
We hebben al gezien hoe Descartes de basisoperaties van de algebra kon representeren in
lijnstukken met behulp van geometrische figuren. Laten we nu naar een paar andere voorbeelden
kijken, waarbij hij instrumenten construeerde om algebraïsche vergelijkingen mee op te lossen.
Aanschouw het volgende figuur[b, 320]. De straal van een cirkel (lengte ‘0.5a’) is hier tevens een van de
rechte zijden van een rechte driehoek en de andere rechte zijde heeft een lengt ‘b’. De schuine zijde
is een optelsom van de lengtes ‘0.5a’ en ‘y’.
Wanneer wij ‘y’ willen uitdrukken in ‘a’ en ‘b’, doen we dat met de stelling van Pythagoras:
Dit is precies de vergelijking die wij de ABC-formule noemen voor de volgende vergelijking:
Met dus simpelweg een driehoek en een cirkel, waarbij we de parameters ‘a’ en ‘b’ vrij kunnen
kiezen, kunnen we direct de oplossing van deze vergelijking aflezen! Dit is wat Descartes bedoelde
wanneer hij de directheid en simpelheid van de analyse boven de deductie stelde! Let wel: de lengtes
‘a’ en ‘b’ zijn altijd positief in de geometrische constructies van Descartes.
En nog briljantere constructie is zijn behandeling van de vergelijking z2 - az + b2 = 0 [b, 320]. Het lastige
van deze vergelijking is dat het twee oplossingen kan bevatten. Descartes pakte het als volgt aan. Hij
gebruikte een halve cirkel en een lijn ‘b’ die loodrecht op het snijvlak van de cirkel staat, aan een van
de eindpunten van de halve cirkelboog. Aan het eind van lijn ‘b’ wordt een loodrechte lijn getrokken
die mogelijkerwijs (afhankelijk van de lengte van ‘b’) met de cirkel snijdt.
36
Door gebruik te maken van de straal van de cirkel (wederom ‘0.5a’), de stelling van Pythagoras en de
hulplijnen die in de tweede afbeelding zijn weergegeven, kan worden afgeleid dat de afstanden ‘z1’
en ‘z2’ de oplossingen zijn van de vergelijking! Men vindt de relatie:
Dit is de oplossing voor de ABC formule van de formule die Descartes probeerde op te lossen.
Merk op: als ‘b’ in verhouding tot de straal van de cirkel te groot wordt, verdwijnen de snijpunten.
Dit valt precies samen met het wegvallen van (reële) oplossingen in vergelijking. Ook zien we mooi
weergegeven dat wanneer ‘b’ even groot is als ‘0.5a’ er maar een snijpunt, corresponderend met een
oplossing van de vergelijking, is. Kent u een betere representatie van dit principe! Het is Descartes
gelukt om met een halve cirkel en slechts twee lijnen direct de (positieve, reële) oplossingen van de
vergelijking z2 - az + b2 = 0 op te meten!
Descartes geeft ook expliciete constructies voor het oplossen van vergelijkingen van de derde tot en
met zesde graad. Bij de derde- en vierdegraadsvergelijkingen maakt hij gebruik van het snijden van
een cirkel met een parabool. Hij gebruikt de ligging en afmeting van deze figuren om de coëfficiënten
van de vergelijking uit te drukken. Voor de vijfde- en zesdegraadsvergelijking snijdt Descartes een
hulpkromme, die gegenereerd is door een mechaniek van een draaiende lijn met een verschuivende
parabool[b, 408].
DE GRAFIEK
We zijn nog nergens een assenstelsel tegengekomen en zullen nu Descartes dichtste benadering tot
een assenstelsel bespreken. Ik denk dat zijn gebruik ervan veel zegt over de ontwikkeling van het
assenstelsel, maar het kan wellicht ook een licht werpen op ons moderne idee van een star
assenstelsel, dat aan het bestaan van een grafiek voorafgaat. Later meer over dit laatste punt.
We richten ons nu op de volgende afbeelding[b, 334]. Een driehoek KLN kan bewegen langs de verticale
lijn AK. Een lijn GL zit gefixeerd in G, maar beweegt met L mee. De lijn KN kon doorgetrokken worden
naar het snijpunt C met de lijn GL, zoals in het volgende figuur is samengevat.
37
In het rechter figuur staat de versie die Descartes gebruikte in ‘La Geometrie’. In zijn afbeelding is te
zien dat wanneer de driehoek KLN naar boven en beneden beweegt het punt C een curve beschrijft.
Descartes gebruikt dus wederom een ‘instrumentale’ methode, dit keer om een curve te tekenen.
Het verschil met de eerdere voorbeelden is dat Descartes hier geïnteresseerd was in een wiskundige
beschrijving van een curve, terwijl de eerdere voorbeelden lijken op wat ik ‘oplossingsmachines’ voor
algebraïsche vergelijkingen heb genoemd. De machines waren geen directe representatie van de
vergelijking in kwestie, maar slechts een representatie van de oplossingen.
Omdat we GA, KL en NL straks veelvuldig nodig hebben, korte hij dit af tot resp. a, b en c (zie
bovenstaande figuur). Daarna trok Descartes een extra horizontale hulplijn CB. Deze CB noemde hij
‘y’ en de afstand BA noemde hij ‘x’. Met behulp van deze hulplijnen kon hij de positie van het punt C
beschrijven in termen van ‘x’ en ‘y’. Dit lijkt heel sterk op de assenstelsels die wij gebruiken! Wellicht
is dit de eerste grafiek! Maar Descartes gaat verder met behulp van zijn ‘ouderwetse’ geometrische
relaties:
Omdat BL = KB – b en AL = BL + x vinden we:
Omdat geldt:
38
Kunnen we invullen:
Oftewel
Oftewel
Dit is het eindresultaat! Descartes merkte op dat zijn (instrumentale) constructie van deze curve een
tweedegraads vergelijking is. Hij heeft daarmee zijn curve kunnen categoriseren. Descartes doet
geen moeite om de grote van de driehoek vast te stellen of de positie van het punt G en verkrijgt
daarom een algemeen antwoord, met ongespecificeerde parameters.
Om nog even terug te komen op het assenstelsel, wij beschouwen de aanwezigheid van een
assenstelsel bijna als een vereiste voor het bestaan van een grafiek. Het stelsel wordt vaak direct
vereenzelvigd met ‘ruimte’. Dit is niet het geval bij Descartes, zoals we hebben gezien. Descartes
maakte eerst zijn ‘grafiek’. Daarna besloot hij pas om twee hulplijnen in te schakelen, die hij
willekeurig, maar tactisch, plaatste om zo de grafiek te beschrijven in termen van ‘x’ en ‘y’. Er is geen
sprake van ‘ruimte’, maar eerder gewoon weer een locale ‘instrumentale’ constructie om de relatie
tussen de lijnen aan te tonen.
39
NEWTON: DE ZWAARTEKRACHT
SYNTHESE VAN HEMEL EN AARDE
Na Isaac Newton (1642-1727) was het niet meer nodig dat studenten in de kosmologie moesten
kiezen tussen de verschillende, maar vrijwel empirisch equivalente, hypotheses van Ptolemeaus,
Copernicus en Tycho Brahe, die allemaal is staat waren een model van het zonnestelsel te maken dat
redelijk tot goed met de feiten in overeenstemming was te brengen. Omdat zijn theorie van de
zwaartekracht zijn belangrijkste werk is, zullen we ons hier op richten.
Newton staat vooral bekend omdat vanwege zijn geweldige synthese van de theorie van Kepler en
Copernicus (over de bewegingen van de hemellichamen) en die van Galileo en Descartes (over de
beweging van objecten op aarde). Hij combineerde deze theorieën over respectievelijk hemel en
aarde tot een consistent ‘Wereld Systeem’[a, 33]. Ook bedacht hij verschillende nieuwe wiskundige
methoden om zijn theorie te construeren en herdefinieerde hij veel van de fundamentele concepten
in de natuurkunde, zoals kracht, inertia en massa.
Tevens corrigeerde hij de theorieën van zijn voorgangers. Zo had Kepler nog gedacht dat de ‘anima
motrix’ direct afnam met de afstand van de zon, terwijl Newton van mening was dat de kracht af
nam met het kwadraat van de afstand. Ook had Kepler nog gedacht dat de kracht in de
bewegingsrichting van de planeet moest staan, terwijl Newton van mening was dat de kracht naar de
zon moest wijzen. Descartes had zijn kracht gelijk gesteld aan ‘mv’, terwijl Newton realiseerde dat
‘ma’ een betere formule was. Hij associeerde ‘mv’ met de impuls.
DE PRINCIPIA
Zijn belangrijkste werk, de ‘Philosophiae Naturalis Principia Mathematica’[a] (de wiskundige
beginselen van de natuurfilosofie, of kortweg de Principia), is gemodelleerd op het werk van Euclides
in de zin dat hij begon met een zo gering mogelijke hoeveelheid definities en axioma’s (waaronder de
bekende drie wetten van Newton), waarbij uit hij vervolgens zijn theorie probeerde af te leiden, door
een voor een theorema’s te bewijzen. Een ander overeenkomst is de nadruk op de geometrie in
plaats de algebra, die dankzij het werk van Descartes en anderen (inclusief Newton zelf) al flink
ontwikkeld was. Hoewel Newton zijn algebraïsche wiskunde wel heeft gebruikt om tot veel van de
bewijzen te komen (bijvoorbeeld met zijn nieuwe calculus en de algebraïsche versie van zijn
wiskunde van ‘vanishingly small quantities’) heeft hij ervoor gekozen om zijn bewijzen te herschrijven
in de geometrische vorm. Hoewel het soms wat onnatuurlijk aandoet, lukte het Newton om de
geometrie te gebruiken voor zijn ingewikkelde mechanica. De moderne wetenschapper Roche schrijft
hierover ‘Newton’s mastery of his chosen mathematical idiom I find breath taking’[c, 50]. Hij
representeerde in zijn geometrische figuren zowel kracht, snelheid, versnelling, tijd, afstand en
dichtheid in de vorm van lijnen. Hij construeerde zijn geometrie zo dat het zijn natuurkunde degelijk
kon beschrijven. Hij gebruikte soms zelfs hetzelfde diagram voor meerdere fysische interpretaties.
In het volgende stukje uit de Principia illustreerde Newton kwalitatief hoe de zwaartekracht van de
aarde met behulp van de centripetale kracht in evenwicht kan worden gebracht en kon hiermee
verklaren dat de planeten in een banen rond de aarde konden bewegen zonder weer neer te storten
op de aarde[a, 75]:
40
Het boek bestaat uit een introductie, waarin de axioma’s en definities worden geformuleerd, en nog
drie hoofddelen. In het eerste deel gebruikt hij onder andere zijn wiskunde van de ‘vanishingly small
quantities’, die hij veelvuldig geometrisch toepast. Hij gebruikt dit bijvoorbeeld in een bewijs, waarin
hij aantoont dat wanneer een kracht vanaf een object naar een vast punt blijft wijzen (zoals bij de
zwaartekracht van de zon), een imaginaire lijn vanaf dit punt naar het object in gelijke tijden gelijke
oppervlaktes beslaat[a, 104]. Dit is een van de wetten van Kepler Het bewijs hiervoor staat op de
volgende bladzijde. Ook laat Newton later in zijn werk zien dat de andere twee wetten van Kepler
ook uit zijn aannames te reproduceren zijn.
41
Om aan te geven hoe ingewikkeld zijn werk is, kijken we vlug naar het zogenaamde ‘zesde probleem
van de elfde propositie’ van de Principia. Newton toonde hier aan dat: ‘als een deeltje dan in een
ellips ronddraait, dan is het noodzakelijk dat de centripetale kracht naar de focus van de ellips wijst’[a,
116]
. Hij gebruikte hiervoor de volgende geometrische constructie:
42
In een eerder bewijs vond Newton een geometrische representatie van de centripetale kracht en
met behulp van die relatie en deze geometrische constructie, kon hij uiteindelijk vinden dat deze
kracht rechtevenredig is aan de inverse van het kwadraat van de afstand van het deeltje tot de focus
van de ellips waar zich de andere massa bevindt. In het bewijs maakt hij onder andere gebruik van
limieten door het punt P op de ellips langzaam naar het punt R te laten bewegen.
Nu kort iets over het tweede boek. Dit gaat voornamelijk over hypothetische gevallen van de
beweging van objecten in weerstandbiedende media, zoals het bewegen van een pendulum in een
medium. Aan het einde van het boek verwierp hij de theorie van Descartes, die zoals dacht dat de
planeten rond werden gesleurd in de ether as een kurken in een draaikolk. Newton hield vol dat de
planeten in een vacuüm moesten bewegen.
Het zal pas in het derde en laatste boek zijn dat hij de algemene theorie van de zwaartekracht
voorstelt. Hij toonde daar aan dat de acceleratie van de maan gelijk was aan die van een appel, die
men onder de kracht van de zwaartekracht tot de hoogte van de maan zou optillen. De maan moest
voldoen aan de 1/r2 wet[c, 56]:
The force by which the Moon is retained in its orbit is that very same force which we commonly call
gravity, for were gravity another force differing from that, then bodies falling to the Earth with the
joint impulse of both forces would fall with double that velocity which we actually experience.
Dit was een goede aanwijzing voor de gelijkstelling van de zwaartekracht op aarde en die vreemde
kracht die de planeten bij elkaar hield. Newton beweerde in zijn derde boek dat de zwaartekracht op
alle objecten in het hele universum werkt. Hij schreef[a, 385]:
Lastly, if it universally appears, by experiments and astronomical observations, that all bodies about
the earth gravitate towards the earth, and that in proportion to the quantity of matter which they
severally contain; that the moon likewise, according to the quantity of its matter, gravitates towards
the earth; that, on the other hand, our sea gravitates towards the moon ; and all the planets
mutually one towards another ; and the comets in like manner towards the sun ; we must, in
consequence of this rule, universally allow that all bodies whatsoever are endowed with a principle
of mutual gravitation.
In het derde boek beschrijft Newton ook hoe eb en vloed werkt, hoe kometen bewegen, de precessie
van de equinoxen, het afplatten van de aarde door rotatie en verklaart hij het verschil van de
43
verschillende metingen van de valversnelling door de zwaartekracht op verschillende plaatsen op
aarde. Ook leidde hij af dat de zwaartekracht binnen een dunne sferische schil op elk punt nul is en
dat de zwaartekracht van een volle bol gelijk was aan de kracht van een punt in het midden van de
bol met dezelfde massa.
ABSOLUTE EN RELATIEVE RUIMTE
Hoewel bewegingen met een constante snelheid altijd relatief zijn (dat wil zeggen afhankelijk van de
plaats van de waarnemer), geldt dit niet voor de versnelling. Bij de versnelling treden dynamische
effecten op en het was daarom te onderscheiden van de niet-versnelde beweging. Versnelling was
dus niet relatief en Newton voelde zich daarom genoodzaakt om een absoluut stelsel te definiëren,
ten opzichte waarvan deze effecten plaatsvonden. Hij kwam als volgt tot deze conclusie:
Newton gebruikte zijn bekende ‘rotating bucket’ argument om aan te tonen dat roterende beweging
niet relatief is (in tegenstelling tot de lineaire beweging). Hij hing een emmer met water via een touw
aan het plafond. Wanneer hij de emmer een aantal slagen draaide en het dan losliet, draaide de
emmer snel terug. Het water dat eerst een vlak oppervlak had, steeg nu naar de zijkanten van de
emmer en daalde in het midden, vanwege de centripetale kracht. Het water is in rust ten opzichte
van de bak met water, maar toch ondervindt het water een kracht van de rotatie! Het
relativiteitprincipe van Galileo gaat hier dus niet op. Newton dacht dat dit betekende dat de emmer
moest roteren ten opzichte van de absolute ruimte[d]. Newton wist dat we absolute ruimte niet direct
kunnen waarnemen. Om te achterhalen of iets roteert, moeten we de krachten die er op werken
analyseren. Wanneer twee objecten, gebonden door een touw, zich ergens in de ruimte bevinden,
weten we niet direct of deze objecten stil staan of roteren. Newton dacht dat we hier achter konden
komen door de spanning in het touw te meten. Als we weten hoeveel de objecten aan elkaar trekken
kunnen we uitrekenen hoe hard ze roteren. Om er ook achter te komen in welke richting ze bewegen
kan men een van de objecten een duw geven en kijken of de spanning in het touw af- of toeneemt,
resp. of de objecten langzamer of sneller roteren. We kunnen natuurlijk ook objecten gebruiken
waarvan we weten dat ze stil staan (voor Newton de sterren) en de beweging daarmee vergelijken.
Ernst Mach, waar we het later nog over gaan hebben, bedacht een andere oplossing voor Newton’s
‘bucket argument’. Mach stelde dat we niet roteren ten opzichte van de absolute ruimte, maar ten
opzichte van de andere materie in het heelal. Dit wordt Mach’s principe genoemd[e]. Ik ga dit
uitleggen aan de hand van de onderstaande afbeelding. Twee emmers worden opgehangen aan een
lat, rondgedraaid en daarna los gelaten. De eerste is klein en bevindt zich dicht bij een veel
zwaardere aardbol. De tweede is groot en bevindt zich dicht bij een kleine aardbol. Volgens Mach
roteert een object als het zich dicht bij een ander object bevindt dat veel zwaarder is. Dus in het
linker geval ondervindt de emmer rotatie, hetgeen weerspiegeld is in de parabool-vormige stand van
het water. In het rechter geval heeft de emmer geen groot object in de buurt ten opzichte waarvan
het kan roteren. Het water blijft hier daarom vlak. Ook al draait de bak vanaf de planeet gezien, het
water in de bak voelt geen enkel effect van deze draaiing en denkt dus stil te staan. Een ander
voorbeeld dat Mach gebruikte om dit principe aan te geven ging als volgt: stel dat we de wanden van
de emmer in Newton’s lab zo zwaar maken dat de massa groot is ten opzichte van de aarde, zal het
water dan niet stil blijven staan ten opzichte van de draaiende emmer? Dit idee werd later door
Einstein opgepakt om de generale relativiteitstheorie te ontwikkelen. Hij gaf Mach hiervoor geregeld
complimenten.
44
MODERNE ANALYSE
De wetten van Newton werkten zo goed, dat het niet lang duurde voordat er niemand meer aan zou
twijfelen. Vooral in de 18de eeuw waren de wetten van Newton gelijk aan waarheden over de natuur.
Nu weten we dat geen van de drie wetten van Newton deductief in een experiment gevonden
kunnen worden. Het was een creatieve collectie van aannames, die op de natuur geprojecteerd
werden als principes van de natuur. Men kan denken dat dit filosofisch gezever is, maar in de 19de
eeuw vond men dat deze wet in het elektromagnetisme geschonden werd. Voor zijn definities van
ruimte en tijd geldt hetzelfde, ook deze gelden niet meer in de theorie die Einstein in het begin van
de 20ste eeuw opstelde. De principes van Newton waren dus duidelijk ‘bedacht’ door Newton en
waren niet inductief en niet deductief uit de natuur te extraheren. Maar de theorie werkte! Een
interessante vraag is hoe het mogelijk is, dat een theorie zo goed werkte en toch gededuceerd is uit
een stel verzonnen en incorrecte aannames.
HYPOTHESES
Een ander karakteristiek van de Principia was dat Newton zich niet waagde aan een oorzaak van de
zwaartekracht. Hij beperkte zich tot de logische conclusies uit zijn aannames en de astronomische
gegevens. Descartes was nog een mechaniek willen bedenken voor de krachten in het universum,
maar Newton zag in dat uitspraken over een dergelijke werking slechts berust was op speculatie. De
kritiek van de wetenschap van de verlichting was vaak dat de scholastici van de middeleeuwen vaak
zogenaamde ‘occulte krachten’ toeschreven aan fenomenen om ze te verklaren. Het probleem was
alleen dat deze verklaringen vaak als volgt op te sommen waren: dit object vertoont magnetische
verschijnselen, omdat het een magnetische kwaliteit heeft. Dit is natuurlijk een lege verklaring.
Descartes had hiervan afgestapt en een mechaniek bedacht voor bijvoorbeeld de zwaartekracht en
het magnetisme. Ook wilde hij zijn mechaniek zo construeren dat de krachten verklaart konden
worden met slechts het bewegen en botsen van deeltjes en niets meer. De zwaartekracht van
Newton werkte echter op afstand en kende geen mechanische verklaring. Dit zou Descartes een
occult effect hebben genoemd. Newton schreef hierover[c, 141]:
45
MAXWELL: HET ETHER-MODEL
Veel theorieën leken in hun tijd voorbelovend en naderhand absurd. Omdat zulke theorieën van alle
tijden blijken te zijn, kunnen we hier een belangrijke les uit leren: wij hebben waarschijnlijk ook dit
soort theorieën, die nu heel zeker lijken, maar later toch totaal fictief blijken te zijn. Een van de
grootste voorbeelden van een dergelijke theorie is het ethermodel van Maxwell. Hieronder lezen we
hoe dit werkte.
DE ETHER
Om de ether mechanisch te beschrijven gebruikte Maxwell zijn ‘Vortical theory of magnetism &
electricity’ ofwel zijn ‘theorie van moleculaire vortices’[a, 98]. Hij zocht een mechaniek om zijn
geometrische model van veldlijnen te verklaren. Maxwell dacht dat de magnetische veldlijnen, die
vaak cirkels beschrijven, te verklaren waren met kleine roterende bewegingen in de ether. Maxwell
ontwierp zelfs een apparaat om deze vortices te meten, door het effect van het moment van de
vortices op een vrij roterende magneet te meten[a, 101]. Maxwell vond geen bewijs voor de vortices en
concludeerde dat het effect zo klein moest zijn dat het apparaat het niet meten kon.
De draaisnelheid van de vortices, zo dacht Maxwell, correspondeerde met de intensiteit van het
magnetische veld. Als twee vortices langs elkaar in dezelfde richting roteren, dan heffen deze
bewegingen elkaar op, zoals hieronder is weergegeven.
Daarom bedacht Maxwell dat tussen deze vortices ‘idle wheels’ zaten (zoals hieronder
weergegeven), die ervoor zorgen dat de rotatie van de vortices elkaar niet afremt[a, 104]:
Maxwell merkte op dat de ‘idle wheels’ ook nog translatie ondergaan als de twee vortices waarmee
ze in contact staan met verschillende snelheid bewegen. Anderzijds kan een translatie van de ‘idle
wheels’ ervoor zorgen dat de rotatiesnelheid van de vortices verandert[c, 104]. De Fransen vonden dit
model maar niks, omdat het ze herinnerden aan de Engelse fabrieken, maar in Engeland werd het
heel serieus genomen.
46
Maxwell identificeerde de translatie van de ‘idle wheels’ met het voortbewegen van een elektrische
stroom. Hij kon hiermee verklaren dat als er een stroom loopt, er een magnetisch veld ontstaat. De
beweging van de ‘idle wheels’ zorgt er namelijk voor dat de vortices gaan roteren. Als deze roterende
vortices bij een stroomdraad terecht komt, zorgen deze vortices er voor dat ook in die stroomkring
voor een korte tijd een stroom gaat lopen. Met deze constructie kon Maxwell de inductie verklaren,
hetgeen veroorzaakt wordt door een veranderend magneetveld. Ook in het mechanische ethermodel
is het zo dat een verandering van de rotatiesnelheid van de vortices zorgt voor elektriciteit (het
bewegen van ‘idle wheels’). Als het magnetische veld eenmaal constant blijft en de vortices met een
constante snelheid gaan roteren, dan kunnen de ‘idle wheels’ ook weer gewoon meeroteren, zonder
zich te verplaatsen. Dus alleen een verandering van het magneetveld zorgt voor stroom, net als in
het geval van de inductie!
Maxwell illustreerde dit met het volgende figuur[a, 104] (voor de duidelijkheid: Maxwell maakte hierin
een klein foutje. Hij liet sommige van de zeshoeken onder de lijn AB tegen de klok in draaien (+), in
plaats ven met de klok mee (-) ).
Een stroom wordt aangezet die (in de bovenstaande afbeelding) van A naar B loopt. De rij vortices
‘gh’ wordt tegen de klok in, in beweging gezet (zoals aangegeven met de ‘+’) en laat tijdelijk een
stroom lopen van rechts naar links (van q naar p). Dit is de inductiestroom. Deze stroom zet de
vortices ‘kl’ weer in beweging. Als ‘AB’ zou stoppen, stoppen ook de vortices ‘gh’, maar de impuls van
de vortices ‘kl’ houdt dan nog even vol en beweegt de deeltjes ‘pq’ naar rechts.
Wat dacht Maxwell zelf van deze hypothese? Hij beschouwde zijn ‘hypothesis of vortices’ als
‘probable’, maar wel ‘provisional and temporary’[a, 105]. Hij schreef ‘I do not bring it forward as a mode
of connexion existing in nature, or even as that which I would willingly assent to as an electrical
hypothesis’[a, 105]. Maar de theorie is wel ‘mechanically conceivable’[a, 105], want het demonstreert de
mogelijkheid om het elektromagnetische veld te verklaren met de mechanica.
De ether van Maxwell bevatte ook een elastische eigenschap. Elasticiteit was al eerder het kenmerk
geweest van de optische ether (een ether voor licht). Maxwell schrijft deze eigenschap nu ook toe
aan de elektromagnetische ether[a, 105]:
47
Maxwell dacht ook dat energie een medium nodig had[a, 168]:
Ook probeerde Maxwell zijn theorie te laten gelden voor de elektrostatica[a, 107]. Hij probeerde het
ophopen van statische lading te verklaren door een vervorming van de vortexcellen, hetgeen voor
polarisatie zorgt.
Zoals in de afbeelding van Maxwell[a, 107] zorgt de vervorming van het medium voor de polarisatie.
Doordat de ether elastisch is, zal de cel zich proberen in zijn oorspronkelijke staat te herstellen en dit
levert de bijbehorende krachten op.
Door de koppeling van de optica en het elektromagnetisme vond Maxwell een relatie tussen de
brekingsindex en de dielektische constante. Het verklaarde ook het Faraday effect, het effect van
magnetisme op de polarisatie van licht. Hij ‘ontdekte’ dat de polarisatie in dezelfde richting roteerde
als de rotatie van de magnetische vortices. Ook vond hij dat de rotatie van de polarisatie
proportioneel was aan de dikte van het medium en de intensiteit van het magneetveld. Deze relaties
kwamen overeen met experimentele vondsten. De hypothese van de vortices bleek dus heel
productief.
In 1865 besluit Maxwell toch van het ethermodel af te stappen. Hij verlangt naar een ‘exact
mathematical expression for all that is known about electromagnetism without the aid of
hypothesis’[a, 113].
[a, 113]
William Thomson (die ook wel Lord Kelvin werd genoemd) beschouwde Maxwells afstandname als
een achteruitgang van de elektromagnetische theorie van Maxwell. Hij schreef ‘as long as I cannot
48
make a mechanical model all the way through I cannot understand; and that is why I cannot get the
electromagnetic theory’[a, 9]. Net als Fourier zag ook Maxwell van zijn mechanische model af en
gebruikte hij slechts een wiskundig model.
Uit zijn wiskundige overwegingen vond Maxwell dat[a, 114]:
Licht is een elektromagnetisch verschijnsel, waarbij het magnetische veld loodrecht staat op het
elektrische veld en beide loodrecht staan op de bewegingsrichting.
Hoewel Maxwell van zijn ethermodel afstapte, bleef hij geloven dat er een ether bestond waardoor
het licht en het elektromagnetisme bewegen. Ook stapte hij niet af van de mogelijkheid om een
correct mechanisch model te vinden. Vanwege het hypothetische karakter beschouwde hij zijn
model als onaantrekkelijk. Hij merkte op dat er in principe wel een oneindige hoeveelheid mogelijke
mechanische modellen voor het elektromagnetisch veld bedacht kunnen worden.
‘The problem of determining the mechanism required to establish a given species of connexion
between the motions of the parts of a system always admits of an infinite number of solutions. Of
these, some may be more clumsy or more complex than others, but all must satisfy the conditions of
mechanism in general’[a, 118].
Wel denkt hij nog steeds dat er goede reden is om aan te nemen dat de ether bestaat[a, 119]:
De theorie van Maxwell gaf hem een ‘a conviction of the reality of the medium’[a, 162].
Ook deed Maxwell de suggestie om de ether te detecteren door het verschil in de snelheid van het
licht ten opzichte van de aarde te meten. Omdat de aarde om de zon draait, beweegt hij dus door de
ether heen. Dit zou moeten betekenen dat licht, gemeten vanaf de aarde, in de ene richting (met de
aarde mee) langzamer gaat dan licht in de andere richting (tegen de aarde in). Michelson en Morley
(1887) lieten in een experiment zien dat licht in de richting van de beweging van de aarde even snel
voortbewoog als licht loodrecht op deze beweging. Dit werd later geïnterpreteerd als het bewijs voor
de afwezigheid van een ether.
49
HERTZ: SCIENTIFIC IMAGES
FUNDAMENTAL CONCEPTIONS
Een theorie zoals de mechanica van Newton, is gebaseerd op aannames. Omdat deze theorie zo’n
succes werd in het beschrijven en voorspellen van nieuwe fenomenen, werd lange tijd aangenomen
dat deze aannames dan ook juist moesten zijn. In de 19de eeuw ging men hier echter aan twijfelen.
Men ging zich afvragen: zijn deze aannames uit de ervaring te extraheren? Zijn deze aannames
uniek? In dezelfde eeuw ontstonden er een aantal aanwijzingen dat dit niet het geval was. Er werd
een nieuwe mechanica ontwikkeld, die alle wetten van Newton precies kon reproduceren, maar met
andere aannames.
Newton had zijn theorie opgebouwd uit 4 principes (of ‘fundamental conceptions’ zoals Hertz ze
noemde). Dit waren:

Tijd, Ruimte, Massa en Kracht
De nieuwe mechanica ging niet uit van Kracht, maar van Energie:

Tijd, Ruimte, Massa en Energie
Omdat we niet én kracht én energie nodig hebben, maar óf kracht óf energie, bracht dit wat vragen
aan het oppervlakte over het werkelijk bestaan van deze entiteiten.
Er was nog een andere en vreemdere mechanica ontstaan in de 19de eeuw. In de laatste jaren van
zijn korte leven werkte Hertz (1857–1894) aan een boek genaamd ‘Die Prinzipien der Mechanik’. Ook
Hertz was van plan de Newtoniaanse mechanica af te leiden met behulp van andere aannames. Hij
baseerde zijn werk op een aantal ongewone principes, die hij onder het mom van filosofische
elegantie rechtvaardigde. Hij postuleerde namelijk onzichtbare materie als de oorzaak van wat wij
krachten noemen. Omdat hij onzichtbare massa onder het kopje ‘massa’ kon zetten, had hij
uiteindelijk maar drie principes nodig:

Ruimte, Tijd en Massa
Dit is een principe minder dan Newton en de energietheorie nodig hadden!
SCIENTIFIC IMAGES
Hertz claimde dat zijn theorie empirisch niet te onderscheiden was van die van Newton. Dit is
daarom wederom een voorbeeld van twee wiskundige theorieën die beide de ervaring beschrijven,
hetgeen impliceert dat minstens een van de twee theorieën niet correspondeert met de
werkelijkheid. In een bepaald opzicht was de twijfel van Hertz radicaler dan de gebruikelijke
herschrijvingen van theorieën. Hertz wilde aantonen dat men met verschillende aannames dezelfde
theorie kon afleiden, terwijl men normaal gesproken de aannames verandert om nieuwe gegevens te
kunnen verklaren. Hertz onderzoek had een filosofisch karakter. Hij was niet van plan om nieuwe
fysische feiten te voorspellen of te verklaren, maar was van plan de ambiguïteit van de aannames
aan te tonen. Als deze aannames echt ambigu zijn, dan is de keuze van een bepaalde set aannames in
zekere zin een menselijke (in tegenstelling tot een fysisch gedetermineerde) aangelegenheid.
50
Professor Goldman verwoordde het als volgt: ‘Scientific knowledge is […] irreducibly subjective to the
extent that it is dependent on freely chosen assumptions’ [g, H12].
De theorie van Hertz wordt meestal te kort samengevat om het belang van de theorie goed te
kunnen inschatten. Hertz schrijft over zijn aannames bijvoorbeeld: ‘It differs from [the force and the
energy theorie] in this important respect, that it only starts with three independent fundamental
conceptions, namely those of time, space and mass’ [a, 24]. Maar een dergelijke samenvatting is veel
te kort door de bocht en roept daarom al snel vragen op. De aanname van onzichtbare materie is
bijvoorbeeld nog erg vaag. Waar was deze materie verspreid om precies de krachten te kunnen
nabootsen? En, nog dringender, hoe kan deze onzichtbare massa de krachten nabootsen als Hertz
geen principe van interactie toevoegt aan zijn theorie? Krachten en energie hadden ervoor gezorgd
dat deeltjes invloeden op elkaar konden uitwisselen, maar zonder een dergelijk postulaat hebben de
massa’s geen invloed op elkaar. Om een antwoord op deze vragen te vinden zullen we diep in de
theorie van Hertz moeten duiken. Nadat we dit hebben gedaan stel ik een nieuwe ‘samenvatting’
voor, die de theorie beter vertegenwoordigt.
In de inleiding van zijn boek schrijft Hertz dat een verschillende set van aannames in principe in staat
kan zijn om dezelfde fenomenen te beschrijven. Deze set van aannames noemt hij een ‘image’. Hij
zegt: ‘Various images of the same objects are possible’[a, 2]. Hij schrijft ook: ‘But two permissible and
correct images of the same external objects may yet differ in respect of appropriateness’[a, 2]. En zijn
dus verschillende ‘images’ mogelijk, maar niet elke daarvan heeft dezelfde logische voorkeur. Hertz
gelooft dat zijn mechanica een aantal logische voordelen heeft op zijn concurrenten. Toch blijft er,
volgens Hertz, in principe altijd een ambiguïteit over welke ‘image’ de voorkeur zou moeten krijgen.
Hertz stelt dat de theorie van krachten een groot nadeel heeft. Deze theorie is namelijk inconsistent.
Als wij een steen aan een touw rondslingeren en daardoor een kracht uitoefenen op de steen, zou
men volgens de 3de wet van Newton verwachten dat er een even grote tegengestelde kracht terug
zou moeten werken. Maar deze ‘kracht’ van de steen op de hand, de centrifugale kracht, wordt
veroorzaakt door de inertia van de steen? Hertz stelt: ‘Can we, without destroying the clearness of
our conceptions, take the effect of inertia twice into account, - firstly as mass, secondly as force?
[Since] force was a cause of motion […], can we, without confusing our ideas suddenly begin to speak
of forces which arise through motion, which are the consequence of motion? […] Properly speaking,
centrifugal force is not a force at all. […] But what [then] becomes of the demands of the 3rd law,
which requires a force exerted by inert stone upon the hand’[a, 6].
Wat kracht precies is weten we niet en als de wetten van kracht ook nog inconsistent zijn, wat
moeten we dan wel niet denken van dit concept? Hertz merkt op we in principe ook niet weten wat
‘goud’ of ‘snelheid’ is, maar er is een groot verschil tussen deze concepten en kracht:
51
[a, 7]
Hertz geeft wel toe dat deze onzekerheden over het begrip kracht niet of nauwelijks in de weg
hebben gestaan bij het ontwikkelen van de mechanica: ‘[they] have not prevented a single one of the
numerous triumphs which mechanics has won in its application. Hence, [the logical inconsistencies]
cannot consist of contradictions between essential characteristics of our image […]. They must rather
lie in the unessential characteristics which we have ourselves arbitrarily worked into the essential
content’[a, 8].
Toch kunnen we onze ‘images’ van de mechanica niet construeren zonder referentie naar
onobserveerbare fenomenen. Als we kracht willen verwijderen uit de mechanica, dan moet er een
ander onzichtbaar principe voor in de plaats komen. Hertz schrijft: ‘[if we pay] attention only to what
can be directly observed, our attempt will in general fail. We soon become aware that the totality of
things visible and tangible do not form an universe conformable to law. […] We may admit that there
is a hidden something at work’[a, 25]. Dit ‘hidden something’ is in de traditionele theorieën van de
mechanica de kracht of de energie. Omdat we niks weten over deze concepten, kunnen we beter een
concept gebruiken, dat we directer kennen. In plaats van de ‘mysterieuze’ kracht of de ‘mysterieuze’
energie te gebruiken, kunnen we dit ‘hidden something’ misschien beter beschrijven in de bekende
termen van massa. Hij vervolgt:
We may admit that there is a hidden something at work, and yet deny that this something belongs to
a special category. We are free to assume that this hidden something is nought else than motion and
mass again. […] We assume that it is possible to conjoin with the visible masses of the universe other
masses obeying the same laws, and of such a kind that the whole thereby becomes intelligible and
conformable to law. […] What we are accustomed to denote as force and as energy now becomes
nothing more than an action of mass and motion, but not necessarily of mass and motion
recognizable by our senses[a, 25].
Naast de gebruikelijke massa is dan ‘concealed mass’ of ‘hidden mass’ nodig. Het enige verschil
tussen deze onzichtbare materie en de gewone materie is dat de eerste niet waargenomen kan
worden en de tweede wel. Voor de rest zijn alle eigenschappen van de twee gelijk.
52
EEN FUNDAMENTELE WET
Maar dit is niet het enige logische voordeel. Hertz beweerde dat hij maar één fundamentele wet
nodig had, terwijl Newton er wel drie nodig had. De wet die Hertz gebruikte was een modificatie van
de eerste wet van Newton:
Fundamental Law.
Every free system persists in its state of rest or of uniform motion in
a straightest path [a, 144].
Een vrij systeem is een systeem waarop geen externe krachten, maar wel interne krachten mogen
opereren. Laten zullen we uitgebreid stilstaan bij de wiskundige formulering van deze wet.
NORMAL CONNECTIONS
Hertz gebruikt dus maar één wet en drie ‘fundamental conceptions’! Dit lijkt een grote logische
vooruitgang. Maar er is een adder onder het gras. Tussen neus en lippen door vertelt Hertz in zijn
inleiding dat hij toch een extra aanname moet maken om de interactie tussen deeltjes te kunnen
verklaren. Hij maakt hiervoor gebruik van zogenaamde ‘normal connections’ of ‘rigid constraints’. Dit
zijn geometrische constructies, die de zichtbare met de onzichtbare massa verbinden (een simpel
voorbeeld is een touw of een stok tussen de twee massa’s). Met deze concepten op zak concludeert
Hertz:
From it, together with the admitted hypothesis of concealed masses and the normal connections, we
can derive all the rest of mechanics by purely deductive reasoning. [From these axioms] the general
properties of force must clearly follow as a necessary consequence of thought from the fundamental
law’[a, 28].
In de rest van het boek probeert Hertz deze deductie tot stand te brengen. Dit onderdeel is zeer
abstract en Hertz geeft geen enkel praktisch voorbeeld. Na een nauwkeurige bestudering blijft de
volgende vraag bestaan: hoe weet men waar je de onzichtbare massa moet plaatsen om een
bepaalde kracht te kunnen nabootsen? Toch maakt een nadere beschouwing ook veel duidelijk. Ik zal
de inhoud in grote lijnen schetsen aan de hand van een boek genaamd ‘Mechanistic Images in
Geometric Form’[b], vrij recent geschreven door professor Lützen, te Kopenhagen. Lützen vat de
theorie als volgt samen:
The most distinguishing feature of Hertz’s Mechanics is that it only operates with three fundamental
concepts, namely time, space and mass. The concept of force (or energy) that is assumed as a fourth
independent fundamental concept in other contemporary treatises of mechanics is defined a
posteriori by Hertz. However, in order to eliminate force as a fundamental concept Hertz had to
introduce two kinds of mass: ordinary of tangible (visible) mass and hidden or concealed mass. The
first kind of mass is the one we can observe directly with our sensort apparatus. The aim of
mechanics is to describe its motion. The concealed mass, on the other hand, is only felt through its
interaction with ordinary mass. The material points of the system (visible as well as concealed) are
allowed to interact through so-called rigid constraints. […] This includes connections through
imaginary rods and rolling but also many other types of constraints [b, 3].
Lützen bevestigt dat deze connecties de interactie tussen de materie veroorzaken. Hij vervolgt:
53
[b, 4]
Het was Hertz dus blijkbaar gelukt om de potentiële energie te schrappen en deze te vervangen door
kinetische energie van de onzichtbare massa. Aangezien Hertz elk deeltje (zichtbaar en onzichtbaar)
een massa en een snelheid had gegeven, kon hij de kinetische energie (0.5mv2) probleemloos
posteriori berekenen. De potentiële energie, die de veroorzaker is van krachten, hebben we nu
echter niet meer nodig.
KRACHTEN
Het is pas op bladzijde 116 dat Lützen antwoord geeft op de vraag hoe het mogelijk is om krachten
na te bootsen en waar men de onzichtbare massa’s moet plaatsen. Verwacht er niet te veel van:
[b, 116]
Hertz had beweerd dat zijn theorie gelijkwaardig was aan die van Newton, maar de theorie van
Newton heeft weinig moeite met het opstellen van bijvoorbeeld een zwaartekracht of een
elektromagnetische kracht. In de theorie van Hertz moeten we echter nog maar zien of deze
krachten wel in zijn systeem uit te drukken zijn. Lützen schrijft: ‘Hertz did not solve the crucial
problem of constructing a concealed system that would account for the empirically known forces of
nature such as gravitation and electromagnetic forces. [He] had argued that both types of forces
could be described in terms of field theories […]. However, the question still remained, how to
construct a hidden mechanical system (the ether) that could carry these fields’[b, 266]
De theorie van Hertz is hierdoor van weinig praktisch nut. Hij verdedigde zich hiertegen door te
stellen dat zijn werk puur theoretisch is en nooit bedoeld is om van praktisch nut te zijn. Als hij alleen
al kon laten zien dat de mechanica van Newton in principe ook in zijn elegantere aannames was te
schrijven had hij zijn doel bereikt. Hij heeft dan laten zien dat de keuze van aannames in principe een
creatieve aangelegenheid is en dat inderdaad meerdere sets van aannames (‘images’) aangewend
kunnen worden voor het beschrijven van een set fenomenen.
54
Lützen geeft ons ook toelichting op de keuze van de ‘constraints’ in plaats van de gebruikelijke
kracht. Het begrip kracht in de theorie van Newton was een differentiaalvergelijking, F = m d2x/ dt2,
hetgeen afhangt van de tijd. De ‘constraints’ zijn daarentegen alleen afhankelijk van een
geometrische connectie tussen de massa’s en niet van de tijd. Ook dit was een voordeel van de
mechanica van Hertz. Krachten zijn dynamisch (van de tijd afhankelijk), terwijl deze ‘connecties’
geometrisch zijn (niet van de tijd afhankelijk)[b, 118].
DE ETHER
Zoals we in het vorige hoofdstuk hebben gezien was de ether voor de meeste fysici in de 19de eeuw
een essentieel ingrediënt voor het beschrijven en begrijpen van de natuurlijke fenomenen. Hertz was
geen uitzondering en zag het probleem van de ether zelfs als het belangrijkste onopgeloste probleem
van de natuurkunde van zijn tijd. Hij schreef: ‘Take away from the world electricity, and light
disappears; remove from the world the luminiferous aether, and electric and magnetic actions can
no longer traverse space. It is therefore certain that all space known to us is not empty, but is filled
with a substance, the aether, which is able to support waves’ [h, 144]. Ergens anders schreef hij ‘Is
space really empty? Do not the phenomena of light compel us to regard it as filled with something?’
[h, 144]
.
Hertz geloofde dat de zee van onzichtbare massa in zijn theorie hem wellicht een mechanisch ethermodel kon leveren. In 2001 schreef Mulligan hierover: ‘The added complications introduced by these
hidden masses seem to have been outweighed, in Hertz’s view, by the need to construct a
mechanical model of the ether, which could then be used to explain electromagnetic and other
physical phenomena’ [h, 151]. FitzGerald (1851–1901) had dit al veel eerder door: ‘Hertz sees in all
actions the working of an underlying structure whose masses and motions are producing the effects
on matter that we perceive, and what we call force and energy are due to the actions of these
invisible structures, which he implicitly identifies with the ether’ [h, 152]. Toch gaf Hertz aan dat zijn
identificatie van de onzichtbare massa en de ether niet een noodzakelijkheid was voor de geldigheid
van zijn theorie. Ook zonder de ether blijft zijn theorie in tact en dit was de reden dat hij in de
formele uiteenzetting van zijn theorie niet verwijst naar de ether, maar alleen in de interpretatie van
zijn mechanica.
Er waren nog twee andere filosofische voorkeuren die Hertz wilde koppelen aan zijn theorie. Het
eerste was het verdrijven van de ‘action-at-a-distance’ uit de natuurkunde. De geometrische
mechaniek van de connecties vervingen de ‘mysterieuze’ krachten die op een afstand werkte. Maar
omdat men ook connecties kon construeren tussen heel ver gelegen objecten (bijvoorbeeld twee
sterren) kon de actie-op-een-afstand niet helemaal uit zijn theorie verdreven worden. Boltzmann
merkte op dat in zijn poging de krachten op afstand te verwijderen, hij ‘connections acting at a
distance’ [b, 284] toevoegde. Een tweede voorkeur was de volledige mechanisatie van de natuurkunde,
hetgeen hij als het hoofddoel van de natuurkundige zag. Dit idee is nauw verbonden met zijn idee om
de ether aan zijn theorie te koppelen. Als men namelijk een mechaniek van de ether kon vinden, dan
had men ook een mechaniek voor de voortplanting van elektromagnetische golven en wellicht ook
voor de zwaartekracht.
Verder dan dit kan ik niet gaan zonder gebruik te maken van de formelere eigenschappen van de
theorie. Deze zullen we dan ook gaan behandelen.
55
EEN MEER FORMELE AANPAK
Het begrip ‘constraint’ of ‘connection’ dat Hertz gebruikte stamt uit de 18de eeuw. Destijds
probeerde men een mechanica te creëren voor systemen die bepaalde beperkingen opgelegd
kregen. De volgende formules komen uit het werk van Lützen [b]. Als we een verzameling van n
deeltjes beschouwen in drie dimensionale ruimte, dan hebben we 3n vrijheidsgraden en deze
kunnen bijvoorbeeld beperkt worden met behulp van een dergelijke formule:
‘Constraints’ die aan deze vergelijking voldoen werden door Hertz ‘holonomic constraints’ genoemd.
Niet alle vormen van ‘constraint’ kunnen hier echter mee uitgedrukt worden. Een generalisatie
hiervan kan dit echter wel. Deze wordt gegeven met behulp van een homogene eerste orde
differentiaal vergelijking:
We kunnen beide ‘constaints’ natuurlijk ook schrijven met behulp van gegeneraliseerde coördinaten:
Een ander begrip dat we nodig zullen hebben is de zogenaamde ‘Principle of Virtual Work’. Dit
principe vertelt ons dat een systeem in equilibrium is, als de totale arbeid van de krachten P, virtueel
verplaatst in de richting van P, gelijk is aan nul:
Ook moeten we u attenderen op ‘d’Alembert’s Principe’. Een systeem zonder ‘constraints’, onder
invloed van verschillende krachten P, wordt als volgt beschreven:
Als er echter wel ‘constraints’ zijn, dan vinden we een andere versnelling, maar toch zullen de
krachten ‘P – ma’ in het systeem in equilibrium blijven. Gecombineerd met het ‘Principle of Virtual
Work’ vinden we dan ‘d’Alembert’s Principe’:
Een andere benodigdheid zijn de ‘Lagrange Multipliers’. Lagrange vermenigvuldigde elk van de
vergelijkingen in de som van de gegeneraliseerde ‘constraint’ met een tweede som werkend op een
56
arbitrair getal Qk. Qk wordt een zogenaamde Langrange Multiplier genoemd. De formule die dan
ontstond telde hij op bij de formule voor de ‘Principle of Virtual Work’:
Hieruit vinden we dat:
Uit deze formules vinden we dat de som in de bovenstaande formule gelijk is aan min de ρde
component van de kracht. Het is dus een reactiekracht, veroorzaakt door de ‘constraint’. Hiermee
had Lagrange vanuit het concept kracht een manier gevonden om deze krachten uit te drukken met
behulp van ‘constraints’. Volgens deze redenering zijn de ‘constraints’ dus het resultaat van krachten
die het systeem beperking in hun bewegingen. Lützen vertelt dat Hertz de omgekeerde route volgde:
‘Hertz conversely used the method of multipliers to introduce the concept of forces. In his image of
mechanics there are a-priori no forces, but there are constraints’.
Gauss gaf een re-interpretatie van d’Alembert’s Principle [e, H2.4]. Stel dat op tijdstip t de posities en de
snelheden, maar niet de versnellingen gegeven zijn voor alle deeltjes in het systeem. Met behulp van
de Taylor benadering, vinden we dan de positie op een tijdstap τ later:
Omdat de eerste twee termen al vast stonden, kunnen we de positie op tijdstip t+τ variëren door de
versnelling te variëren:
Nu gebruiken we d’Alembert’s principe met een virtuele verplaatsing van de posities r(t+τ). Omdat
we weten dat:
vinden we dat:
Als de krachten ook al gegeven zijn (en we deze dus niet kunnen variëren), vinden we
57
Dit kunnen we ook schrijven als:
Als we aannemen dat de massa van alle deeltjes gelijk is, dan kunnen we de vrijheid in deze formule
gebruiken om de term ½ te verruilen voor de term 1/mυ, waarbij mυ een derde van deze constante
massa is (een derde, omdat elk van de drie ruimtelijke dimensies deze term krijgt aangewezen):
Dit is het zogenaamde ‘Principle of least constraint’ dat Gauss in 1829 formuleerde. Het principe
vertelt ons dat een systeem met ‘constraints’ zo beweegt dat het zo min mogelijk afwijkt van de vrije
beweging van het systeem.
Hertz gebruikte een speciaal geval van het ‘Principle of least constraint’ van Gauss in zijn ‘Principle of
least curvature’. In dit geval werken er geen externe krachten op het systeem en zijn alle massa’s
gelijk. We kunnen Z dan schrijven als:
Zoals we straks zullen zien is een lijn element ds in de mechanica van Hertz te schrijven als:
Tevens geldt:
Als we d2x/ds2 schrijven als x’’, dan ziet de definitie van kromming c er als volgt uit (zoals we ook
straks zullen beargumenteren):
We kunnen x’’ als volgt uitschrijven:
58
We kunnen dan mc2 als volgt opschrijven:
Met behulp van de eerder genoemde formules voor het lijnelement vinden we dan:
Dit kunnen we verder versimpelen tot:
Gebruikmakend van het speciale geval van de ‘Principle of least constraint’, vinden we uiteindelijk:
Een minimalisering van c, met behulp van het variatieprincipe, geeft ons ‘the trajectory of least
curvature’ :
Dit is het ‘minst gekromde’ of het ‘rechtste’ (straightest) pad, dat recht doet aan de opgelegde
‘constraints’. De fundamentele wet van Hertz vertelt ons dat een systeem waar geen externe
krachten op werken de baan van de minste kromming zal aannemen. Het zegt echter niks over het
geval waarin er wel externe krachten werken en het blijkt dat dit principe dan niet geldig is. Hertz
laat wel zien dat het principe van Gauss en die van d’Alembert wel geldig blijven.
Ook zullen we vaak gebruik maken van Langrange’s ‘Equation of Motion’:
Voor L = T – U en met de extra conditie dat de afgeleide van U naar q gelijk is aan P en U zelf
onafhankelijk is van de afgeleide van q, wordt deze formule vaak omgeschreven tot:
59
LIJN ELEMENT
Als we een collectie van deeltjes hebben met elk een begin en een eindpositie (resp. x en x’), dan
zouden we de afstand tussen de twee configuraties kunnen definiëren als [b, 147]:
Dit was echter niet wat Hertz deed. Hij koos voor:
Het lijkt vreemd om de massa te verwerken in een afstandsbegrip, maar Hertz had goede redenen.
Als we twee punten nemen en deze op dezelfde coördinaat plaatsen, dan kunnen we het totaal
opvatten als twee punten of als één punt. Als we de gebruikelijke ‘s’ nemen, dan vinden we een
verschillend resultaat als we kiezen voor de een of de andere situatie. De ‘s’ van Hertz heeft hier
geen last van. Een ander voordeel is dat we met deze keuze de kinetische energie op dezelfde wijze
kunnen schrijven als in het gebruikelijke geval (dit zullen we later zien).
Een oneindig kleine verplaatsing geven we weer met:
Dit is het ‘fundamentele lijn element’ dat Hertz gebruikte in zijn theorie. Hij definieerde ook een
versie voor gegeneraliseerde coördinaten:
VECTOREN
Hertz introduceerde ook vectoren in zijn mechanica. Lützen merkt op: ‘Ultimately, mechanics is not
only about geometric displacements, but about kinematic concepts involving time, such as velocity,
momentum, and acceleration’ [b, 173]. Om deze termen toch in een geometrische manier te kunnen
beschrijven maakte hij gebruik van zijn originele vector definitie. Een vector is een verplaatsing van
het systeem in een bepaalde richting. De richting van een vector stelde hij zich voor als een oneindig
kleine verplaatsing in de desbetreffende richting. Hertz schreef [a, 121]:
Every vector quantity with regard to a system can be represented geometrically by a conceivable
displacement of the system. The direction of the displacement representing it is called the direction
of the vector quantity.
Hertz introduceerde ook de zogenaamde ‘reduced components’. Lützen schrijft: ‘In an ordinary
rectangular coordinate system the coordinates of a vector can be found by projecting the vector
orthogonally onto the coordinate axes. However, when the coordinate system is not rectangular, this
60
no longer holds true. This is the background for Hertz’s introduction of the reduced components’[b,
173]
. Als we de gewone componenten dq noemen en de gereduceerde componenten noteren met een
streep boven de q, dan vinden we de volgende relaties tussen de twee:
De matrix bρσ is de inverse van de matrix aρσ. Een coördinatentransformatie van q naar q’ kunnen we
noteren als:
Voor de gereduceerde componenten vinden we dat de vectoren transformeren als covariante
vectoren:
Een afgeleide waarbij een coördinaat q gevarieerd wordt noemde Hertz ∂q en de afgeleide naar de
gereduceerde coördinaat noemde hij ∂p.
KROMMING
Hiervan uitgaande construeerde Hertz begrippen als hoek, kromming en ‘straightest path’. Met deze
begrippen kon hij namelijk op een wiskundige manier zijn enige fundamentele wet uitdrukken. Om
de hoek uit te drukken tussen twee paden maakte Hertz gebruik van de volgende oude wijsheid:
Proposition.
The distance between two positions of a system is always smaller than the sum of the
distances of the two positions from a third [a, 55].
Hij kon hiermee een driehoek ABC construeren. De hoek A van de driehoek definieerde Hertz als de
hoek tussen de verplaatsing van een punt van A naar B en de verplaatsing van een punt van A naar C.
Hij noemde dit ook wel de ‘difference in direction’ van de twee paden. De hoek tussen twee
verplaatsingen s’ en s’’ noemde hij (s’s’’). We vinden:
x is de beginpositie en x’ en x’’ de respectievelijke eindposities. Om ook de situatie te kunnen
beschrijven waarbij de beginposities van elkaar verschillen, gebruikte Hertz het begrip ‘parallel
transport’. Hij vond hiermee:
61
, waarbij x0 een ander beginpunt is. Voor een oneindig kleine verplaatsing vinden we:
Voor het begrip ‘kromming’ was ook het begrip ‘pad’ nodig. Hertz beschreef een pad als ‘the
simultaneously considered aggregate of positions which a system occupies in its passage from one
point to another’ [a, 164]. Deze definitie in opmerkelijk in de zin dat het wederom een referentie naar
de tijd vermijdt. Hertz wilde zijn mechanica geheel geometrisch houden. Met behulp van een pad
element, kunnen we de kromming kwantificeren. Lützen schrijft:
An element of a path is a portion of a path limited by two infinitely near positions, and the direction
of a path in a given position is defined as the direction of a path element at this position. The path is
called straight if it has the same direction in all its positions. If it is not straight, the direction will
change and its rate of change with regard to the length of the path is what Hertz called the
curvature[b, 165].
Zoals we al eerder hebben opgemerkt, noteren we deze kromming met de letter c. ε is een vector die
zich bevindt op het pad s en in de richting van dit pad wijst. Als dε de hoek is tussen de richting van
het pad aan het begin van het element en de richting aan het eind, dan vinden we:
Omdat de elementen van ε bestaan uit xυ’=dxυ/ds, vinden we dat de elementen van c gelijk zijn aan
xυ’’. De elementen van een vector X zijn op de volgende wijze gerelateerd aan de waarde van een
vector S [c]:
Een inprodukt van c met zichzelf kan geschreven worden als de waarde van c in het kwadraat.
Daarom geeft deze formule ons de formule die we al eerder zijn tegengekomen voor de kromming [b]:
In gegeneraliseerde coördinaten vinden we:
62
KINEMATISCHE CONCEPTEN
Hertz beschouwde de waarde van de snelheid van een systeem, v = ds/dt, als de ‘instantaneous rate
of motion’. In snelheidsvector wordt geschreven met de gotische letter v. Om dit te vinden moeten
we de waarde van v vermenigvuldigen met de eenheidsvector in de richting van de snelheid,
genoteerd met de gotische letter D [c]:
Voor v2 vinden we dat [b]:
Energie en impuls zijn dan als volgt te vinden:
We zien hier dat de energie gegeven wordt door de gebruikelijke formule en dit is een direct gevolg
van de keuze van het lijnelement. In gegeneraliseerde coördinaten vinden we:
De gewone en de gereduceerde afgeleiden leveren ons het volgende:
Omdat er geen kinetische energie is in de mechanica van Hertz kunnen we de E vervangen door L. De
eerste term is dan gelijk aan de gegeneraliseerde impuls in de traditionele mechanica.
De versnellingsvector wordt geschreven als de tijdsafgeleide naar de versnellingsvector [c, 47]:
We kunnen dit als volgt opdelen in een tweetal termen:
Dit zijn de component in de richting van het pad en de component loodrecht op het pad. In
gegeneraliseerde coördinaten vinden we:
63
Dit is ook te schrijven als:
In dit geval geldt dat als E=T en mf = P, we de Lagrangiaan vinden uit de traditionele mechanica.
EEN VRIJ SYSTEEM
Laten we nu een vrij systeem bestuderen (een systeem met alleen interne en geen externe
krachten). Volgens tweede soort ‘constraints’ geldt dat de afgeleiden x’ moeten voldoen aan:
Hieruit vinden we dat x’’ aan de volgende vergelijking moet voldoen:
Laten we x en x’ (het beginpunt en de richting) constant houden en x’’ variëren om zo de minimale
kromming c vinden. Als we de vergelijkingen in de voorgaande formule allemaal vermenigvuldigen
met de Lagrange multiplier Ξ en dit toevoegen aan de formule van de kromming, dan vinden we:
In het gegeneraliseerde geval vinden we:
Als Π Lagrange multipliers zijn, dan schrijven we de bijbehorende krommingformule als volgt:
64
Hertz merkt op dat de totale massa en de totale snelheid van het gehele vrije systeem constant blijft.
Dit betekent dat de kinetische energie behouden is. Ook kon Hertz de bewegingsvergelijkingen voor
dit systeem opstellen. Voor het gemak maakt Hertz daarvoor even gebruik van de tijd als een
onafhankelijke variabele. Met v = ds/dt, vinden we dat:
Als we X schrijven in plaats van
en Q in plaats van
vergelijkingen vermenigvuldigen met mv2, dan vinden we:
en de bovenstaande
De laatste formule kunnen we echter veel compacter schrijven met behulp van de formule voor f, die
we eerder zijn tegengekomen:
Uit deze formule kunnen we de ‘equations of motion’ vinden:
Dit is wederom gelijk aan Lagrange’s vergelijking in het traditionele geval, maar in plaats van de
kracht zien we een negatieve ‘constraint’!
Een systeem dat niet vrij is, wordt door Hertz beschreven met de aanname dat elk onvrij systeem een
deel is van een groter vrij systeem. Dit systeem zullen we hier niet verder behandelen.
MODIFIED LAGRANGIAN
Nu zijn we toe aan het idee van Thomson en Helmholtz om de potentiële energie van een systeem
onder te brengen als de kinetische energie van een onzichtbaar systeem dat met dit systeem in
contact staat. Dit kan met behulp van de zogenaamde ‘cyclische coördinaten’. Dit zijn coördinaten
die niet expliciet in de energie vergelijking van een systeem voorkomen en dus ook niet in de
Lagrangiaan. In 1877 werden deze coördinaten gebruikt door Routh om een zogenaamde ‘modified
lagrangian’[b, 208-210] te construeren. Routh beschouwde een r aantal coördinaten:
65
Routh koos ervoor om de coördinaten q van k+1 tot r cyclisch te maken, maar hun tijdafgeleiden niet.
Dit betekende dat:
En hieruit concluderen we dat:
Met deze formule kon hij de afgeleide van q schrijven in termen van c (waarbij c een constante is en
niet de kromming). De nieuwe Lagrangiaan, waarbij q te schrijven is in termen van c, noemde hij L2.
Voor de partiële afgeleiden van de coördinaten 1 tot k geldt dan:
We moeten nu een manier vinden om de functie L2 om te schrijven in een functie die afhankelijk is
van ck voor alle cyclische variabelen. Dit kan gedaan worden met de zogenaamde Legendre
transformatie. Een Legendre transformatie gaat uit van een functie f(x). De infinitesimale versie
hiervan definiëren we als volgt:
We definiëren ook een functie g(u), het eindproduct van de Legendre transformatie:
De infinitesimale versie schrijven we als:
Uit deze vergelijkingen vinden we:
66
In ons geval kiezen we x en u als volgt:
Voor de functie f vullen wij L2 in en voor de nieuwe functie g gebruiken we de zogenaamde ‘modified
Lagrangian’ L’:
Gebruikmakend van de ‘equations of motion’ en de bovenstaande formules voor L’, en de afgeleiden
van L2 vinden we dat voldaan moet worden aan:
De structuur van deze vergelijkingen zijn gelijk aan die van de bewegingsvergelijkingen van Lagrange.
Twee inhoudelijke verschillen zijn echter dat L hier vervangen is door L’ en dat ρ alleen loopt van 1
tot k en niet tot r. We hebben dus een Lagrangiaan L’ gevonden die onafhankelijk is van de cyclische
variabelen q en hun afgeleiden! Het is deze Lagrangiaan die door Helmholtz en Thomson gebruikt
werd om de kinetische energie van de verborgen materie uit te drukken als de potentiële energie V’.
Stel dat we een systeem hebben met de variabelen q1 tot en met qr en hun afgeleiden, maar we geen
weet hebben van de cyclische coördinaten qk+1 tot qr. Wij kunnen dan de kinetische energie bepalen
van het zichtbare deel. Dit is echter niet de kinetische energie van het totale systeem. We noemen
deze kinetische energie T’. Als we ook een Lagrangiaan L’ kunnen vinden voor dit subsysteem, vinden
we ook potentiële energie: T’ – L’ = V’. Lützen schrijft: ‘However, we may have been deceived by our
lack of knowledge of a certain number of hidden cyclic coordinates so that what we believed was the
Lagrangian, was in fact only the modified Lagrangian. What we mistook for potential energy may
therefore have been the result of kinetic energy due to the hidden coordinates’[b, 210].
We zullen Thomson’s uitwerking van dit idee bestuderen. Thomson bestudeerde een systeem met
alleen kinetische energie. Er geldt dan dat L = T. Hij verdeelde T in twee componenten:
Het eerste component is de kinetische energie van het zichtbare deel en het tweede van het
cyclische deel. Omdat geldt dat:
vinden we uit de definitie van L’ dat:
67
De afgeleiden van de cyclische coördinaten worden op de volgende manier uitgedrukt als functie van
c:
Dankzij de gemodificeerde bewegingsvergelijkingen vinden we:
Dit staat geschreven in dezelfde vorm als een bewegingsvergelijking met kinetische energie T1 en
potentiële energie Tcycl, terwijl in werkelijkheid het systeem slechts kinetische energie bevat!
EEN VOORBEELD
Dan zijn we eindelijk toe aan een voorbeeld. We bekijken de volgende situatie [b, 211]:
Het kan bewezen worden dat de relatie tussen de lengte van de stok en de hoek ‘ω’ gegeven wordt
door:
De totale energie bedraagt dan:
68
De energie is ook te schrijven als:
De hoek ф is in ons geval de cyclische variabele, omdat het niet in de energie vergelijking terugkomt.
Omdat de afgeleide van ω behoort tot het zichtbare systeem en die van ф tot het onzichtbare
systeem, kunnen we de kinetische energie van het hele systeem in tweeën opsplitsen. De eerste
twee termen behoren dat tot T1 en de derde tot Tcycl. We kunnen de laatste term ook als volgt uit
drukken, met behulp van de gegeneraliseerde impuls:
We vinden dan dat:
T is gelijk aan L, maar wij zijn echter geïnteresseerd in het vinden van de gemodificeerde Lagrangiaan
L’ van het zichtbare subsysteem. We hadden eerder gevonden dat:
We vinden dus:
We hebben dus een systeem L’, waarbij de kinetische energie gelijk is aan:
En de potentiële energie aan:
Het blijkt dus echt mogelijk om potentiële energie te schrijven als de kinetische energie van
onzichtbare materie!
Hertz zag in dat er in dit voorbeeld toch een addertje onder het gras zat. Zowel Thomson als hijzelf
beschouwde de eerste term als de kinetische energie van de zichtbare stok en de derde term als de
potentiële energie[b, 232]. Zoals we hebben gezien groepeerde Thomson de tweede term ook bij de
kinetische energie van het zichtbare systeem. Hertz had echter aangenomen dat het mogelijk was
69
om de totale massa van het zichtbare systeem te kunnen bepalen en we dus in dit geval ook de
kinetische energie van het zichtbare deel van het systeem kunnen bepalen:
Omdat deze ‘echte’ kinetische energie van het zichtbare systeem afwijkt van de ‘schijnbare’
kinetische energie T’, kunnen we afleiden dat er een onzichtbaar systeem moet bestaan dat deze
extra kinetische energie veroorzaakt. In dat geval laat het onzichtbare systeem zich niet alleen zien
als potentiële energie, maar ook als een extra term in de kinetische energie. Dit kunnen we
verhelpen door aan te nemen dat de tweede term verwaarloosbaar klein is in vergelijking met de
andere twee termen. Dit kunnen we doen door de massa van het onzichtbare systeem klein te
maken, maar dit vermindert het effect van deze massa op het zichtbare systeem. Dit kan weer
verholpen worden door de snelheid van de onzichtbare massa’s erg groot te maken. Dit is dus een
duidelijk gebruik van een benadering in de theorie van Hertz. Sommige commentatoren, die de
connectie met de ether-theorie met de mechanica van Hertz behandelden, interpreteerde dit als
eigenschappen van de ether. De ether bestond volgens deze theorie dus uit heel kleine massa’s, die
enorm snel rondbewogen en zo de waargenomen krachten veroorzaakten.
LIOUVILLE EN DE CYCLISCHE COORDINATEN
In de 19de eeuw beschouwde Liouville[b, 217-18] een conservatief systeem S, dat beschreven kon
worden met de coördinaten q1, . . . , qk. Het systeem had een kinetische energie T en een potentiële
energie U. Daarna construeerde hij een nieuw systeem S’, beschreven met q1, . . . , qk en een
cyclische coördinaat qr. Het nieuwe systeem had alleen kinetische energie T’, gegeven door:
De bewegingsvergelijkingen voor S’ werden:
en
Uit de laatste formule blijkt dat de afgeleide van q gedeeld door U gelijk is aan een constante. Als we
deze constante gelijk aan 1 zetten, dan vinden we:
Dit is exact gelijk aan de Lagrange vergelijkingen voor S. Dit is een omgekeerde versie van de theorie
van Thomson. Deze theorie is toegepast in een voorbeeld uit 1916 gemaakt door ene Paulus. (We
zullen straks de constante gelijk zetten aan C en dit levert dus een term C2U in de bovenstaande
vergelijking).
70
PAULUS EN KRACHTEN-SIMULATIE
Paulus beschouwde een massa m, die langs een z-as kon bewegen en zich op hoogte z bevond [b, 27476]
. Vanaf deze massa loopt een massaloos koord via de katrol naar de massa op afstand van de
z-as. Het katrol bevindt zich altijd op dezelfde hoogte als de massa . De massa roteert om de z-as
en met deze massa roteert een kromme = f( ) mee. De hoek, gemeten vanaf de x-as, wordt
genoteerd met de letter ф.
Als
0 en
0
de coördinaten zijn van
en als z = 0, dan vinden we:
Met de eis dat op de functie f blijft wordt dit:
Paulus gebruikte de hoek ф en de afstand
kinetische energie wordt gegeven door:
als de gegeneraliseerde coördinaten van . De
Met:
In plaats van de afgeleide van vinden we in de derde term eigenlijk de afgeleide van - 0, maar
omdat 0 constant is, wordt deze afgeleide nul. Omdat klein is en de rotatiesnelheid van de
onzichtbare massa groot (vanwege de benadering van Hertz), kunnen we de eerste term
verwaarlozen. De tweede term gebruiken we voor de potentiële energie en de derde voor de
kinetische energie van de zichtbare massa. We houden over:
Paulus maakte gebruik van de theorie van Liouville. Alleen stelt hij de constante nu niet op één maar
op C. In de Lagrange vergelijking van Liouville vinden we dan de term C2V. In het geval van Liouville
71
hadden we een potentiële energie V, maar in dit geval wordt de potentiële energie dus gegeven door
C2V = U(z). Er geldt dat:
U correspondeert met de potentiële energie, werkend op de zichtbare massa m, gegeven door:
Omdat afhankelijk is van z, bestaat er ook een getransformeerde functie U-1, die afhankelijk is van
U(z), oftewel:
Hiermee vinden we een nieuwe uitdrukking voor f:
Als we bijvoorbeeld kiezen dat:
Dan kunnen we U-1 vinden en dit invullen voor z:
Als γ gelijk is aan GMm, dan is U de zogenaamde zwaartekrachtspotentiaal. We kunnen echter niet
elke U kiezen. We moeten ervoor zorgen dat de rechterkant van de potentiaalvergelijking altijd
positief is. Maar Lützen merkt op: ‘To be sure, one can always add or subtract an arbitrary constant
from the function U so that one can reproduce negative potentials as well, but only if they remain
bounded from below. […] k […] may be chosen arbitrarily large, but once it has been chosen z cannot
obtain values less than γ/k’[b, 276].
Dit en het vorige voorbeeld hebben een groot nadeel, dat voor veel kritiek heeft gezorgd. De
mechanismes die gebouwd worden om te krachten te simuleren zijn ad hoc en elke interactie vereist
een eigen set van mechanismen. De theorie heeft duidelijk behoefte aan een natuurlijke manier om
de mechanismes te construeren, maar deze is tot dusver nog niet gevonden.
ONTVANGST VAN DE MECHANICA VAN HERTZ
De theorie van Hertz kreeg veel aandacht onder de filosofen, maar ook onder vooraanstaande fysici.
Velen prezen het systeem van Hertz, maar er waren ook veel nadelen. Fitzgerald schreef
72
bijvoorbeeld: ‘Among the merits they counted its philosophical sophistication, the rigorous and
elegant mathematical structure, and the avoidance of forces acting at a distance. As its main
weakness they mentioned its complete neglect of the question of how to construct the hidden
systems that would account for the observed motions in the physical world’ [b, 278]. Helmholtz schreef:
‘Unfortunately he has not given examples illustrating the manner in which he supposed such
hypothetical mechanism to act; to explain even the simplest cases of physical forces on these lines
will clearly require much scientific insight and imaginative power’ [b, 278]. Boltzmann was ook een
voorstander, maar zag ook in dat er nog veel problemen aanwezig waren. Hij schreef daarom: ‘The
Hertzian mechanics seems to me to be more like a program for a far future’[b, 285].
VOORZETTING VAN DE MECHANICA VAN HERTZ
Naast het werk van Paulus, waren het vooral Lorentz, Ehrenfest en de wiskundige Brill, die een
poging waagde om de theorie van Hertz te bevorderen. De contributie van Ehrenfest [d] en Lorentz [c]
staan hieronder beschreven.
LORENTZ
Een verdere uitwerking of liever een alternatief op de theorie van Hertz, werd geformuleerd door
Lorentz. Lorentz was van mening dat Hertz een heel elegante grondslag van de mechanica had
bedacht, maar met de onzichtbare massa kon Lorentz niet overweg. Hij onderzocht in een artikel
genaamd ‘Some considerations on the principles of dynamics, in connexion with Hertz’s Principien
der mechanik’[c] in hoe verre deze elegantie zou verdwijnen als men vasthield aan het gebruikelijke
krachtsprincipe. Hij schreef:
[b, 286][c, 36]
Uitgaan de van de beginselen van Hertz (minus de onzichtbare materie) vond Lorentz een vergelijking
die afhankelijk was van de gebruikelijke externe kracht. Als deze kracht in zijn vergelijking op nul
werd gezet, dan reduceert deze formule weer tot de fundamentele wet van Hertz. Het is dus een
generalisatie van deze wet voor externe krachten. Ook laat hij zien dat hij ‘Hamilton’s Principle’ en de
‘Principle of Least Action’ kan afleiden uit zijn generalisatie. Hieruit concludeert Lorentz dat er geen
noodzaak is om in het systeem van Hertz de kracht te vervangen voor onzichtbare massa. Het
systeem werkt ook goed met krachten [f, 177-78].
EHRENFEST
In 1904 schreef Ehrenfest zijn dissertatie [d]. Hij liet daarin zien dat hij de methode van Hertz kon
gebruiken om de ‘equations of motion’ te vinden voor een ‘incompressible fluid’ en ook de
vergelijkingen waarin een object in deze vloeistof beweegt. Om dit te doen moesten de systemen
van punten die Hertz gebruikte gegeneraliseerd worden naar een continue massaverdeling.
73
Het belangrijkste dat Ehrenfest moest doen was het vinden van een manier om het begrip druk uit te
kunnen drukken zonder het begrip kracht te gebruiken. Hij moest in plaats daarvan een ‘constraint’
vinden die deze druk kan representeren. De ‘constraint’ die hij gebruikte is de zogenaamde ‘equation
of incompressibility’:
Met behulp van Lagrange multipliers vond hij uiteindelijk de volgende vergelijking:
Ehrenfest toonde aan dat λ de eigenschappen had die we associëren met het begrip druk. Zo voldoet
λ aan de conditie ‘ρa = - λ’ en op zogenaamde ‘free surfaces’ (oppervlakken waar geen kracht wordt
uitgeoefend) gaat λ naar nul, zoals ook van de druk verwacht wordt.
VIJF PRINCIPES
Hertz beweerde dat hij maar drie ‘fundamental conceptions’ (tijd, ruimte en massa) nodig had. Maar
in feite verplaatste hij de dynamische kracht door zowel de geometrische ‘connecties’ als de
onzichtbare massa. Beiden horen dus in zijn lijst van ‘fundamental conceptions’ te staan. Ik schreef
professor Lützen het volgende:
When in Hertz’s mechanics forces are replaced by 'rigid connections' and the effect of 'hidden
masses', isn't this multiplying instead of reducing entities?
Hij schreef terug:
Of course this criticism was raised against Hertz. However, to Hertz the important thing is that the
hidden masses are of the same kind as ordinary masses. Thus he did not have to introduce a new
mysterious kind of entity (forces). In the introduction he did not comment on the introduction of
connections at all.
Lützen beschrijft hier de redenering van Hertz, maar deze redenering is niet vol te houden. De
toevoeging van de ‘constraints’ is ook ‘mysterieus’ en wellicht nog wel mysterieuzer dan kracht. In
een tweede mail probeerde ik de theorie als volgt samen te vatten:
Although Hertz uses only one law, he extended his mass concept with hidden masses and replaced
his force concept with constraints. The constraints are, just like force, mysterious (or metaphysical;
they cannot be observed), although they reduce the dynamic aspect of force to geometry. The
theoretical power lies primarily in the generalization of Helmholtz’s and Thomson’s inclusion of
potential energy into the domain of kinetic energy.
Lützen reageert kort maar krachtig: ‘Your ultra short characterization of Hertz's mechanics is fine’.
74
Hieruit kan ik niets anders concluderen dan dat Hertz vier ‘fundamental conceptions’ gebruikte, mits
we accepteren dat onzichtbare massa geen nieuwe entiteit is. Als we dit niet accepteren worden het
er maar liefst vijf. Mijn versie van de opsomming van de ‘fundamental conceptions’ van Hertz is als
volgt:

Ruimte, Tijd, Zichtbare Massa, Onzichtbare Massa en Rigid Constraints
Dit commentaar staat echter niet het belangrijkste filosofische punt van de theorie van Hertz in de
weg, namelijk dat van het ‘scientific image’. Dat nu blijkt dat Hertz niet 1 maar 2 ongebruikelijke
entiteiten nodig had is filosofisch misschien zelfs wel gewenst (hoewel het een deel van de logische
elegantie te niet doet, hetgeen zeker niet Hertz’s eigen voorkeur zou hebben). Twee bizarre
entiteiten stellen de wispelturigheid van de menselijke beschrijvingen van systemen op een nog
scherpere manier aan de kaak. Ook praktische nutteloosheid en het onvermogen om nieuwe
voorspellingen te kunnen doen kunnen we Hertz vergeven, omdat zijn theorie slechts een filosofisch
belang diende.
Als we het over het simplificeren van de ‘fundamental conceptions’ hebben, wil ik graag nog even
wijzen op Einstein die er maar twee nodig had:

Ruimte-Tijd en Massa-Energie
75
DUHEM: HET KARAKTER VAN DE WETENSCHAP
In 1906 schreef de wetenschapper en wetenschapsfilosoof Pierre Duhem een belangrijk boek over de
filosofische kant van de natuurkunde en de wetenschap in het algemeen. Het werk heette: ‘The Aim
and Structure of Physical Theory’[a]. Hij betoogde in dit werk dat een wetenschappelijke theorie niet
in de eerste plaats ‘verklaart’, maar ‘classificeert’ of ‘ordent’. Een wetenschapper probeert een
theorie zo simpel mogelijk te maken door het te baseren op een klein aantal aannames, waaruit de
rest af te leiden is. Soms echter is de structuur die hierdoor ontstaat zo uniek dat de wetenschapper
gaat geloven dat de classificatie een zogenaamde ‘natuurlijke classificatie’ is. Hiermee bedoelde hij
dat de classificatie niet arbitrair is, maar een werkelijke relatie tussen werkelijke fenomenen
beschrijft. De wetenschapper heeft echter geen logische argumenten om dit geloof te kunnen
bevestigen. Hij hamert ook op het verschil tussen de vaak simplistische modellen en theorieën en de
veel complexere realiteit en concludeert dat de eerste een benadering is van de laatste. Duhem ziet
een historische benadering als de beste wijze om een wetenschap te begrijpen, omdat men dan in
aanraking komt met de vaak niet triviale of vanzelfsprekende keuzes die in het verleden gemaakt zijn
en nog steeds dominant zijn in de huidige theorieën. Het logische karakter van de theorieën kan dit
volledigere begrip niet dekken.
In dit werk geeft Duhem ook nog een serie interessante filosofische opmerkingen over
wetenschappelijke vraagstukken. Een aantal zullen we hier kort de revue laten passeren.
THEORETISCH
Er zijn theoretische vraagstukken, die zich helemaal niet lenen voor de praktijk. Als we willen weten
of een deeltje een cirkelbaan op het oppervlak van een kegel uitvoert, dan hoeven we theoretisch
alleen maar te weten of het deeltje beweegt binnen een vlak parallel op de basis van de kegel (een
voorbeeld is het rode pad in de onderstaande tekening).
Praktisch gezien is dit echter niet te controleren. Een deeltje kan altijd een dergelijke kleine
component hebben in de richting loodrecht op de parallelle vlakken, die niet meetbaar is, waardoor
het deeltje langzaam maar zeker langs de kegel omhoog of naar beneden klimt. Duhem schrijft[a, 141]:
Als voorbeeld geeft hij de poging van Laplace om aan te tonen dat het zonnestelsel stabiel is.
76
THEORIE EN EXPERIMENT ZIJN NIET TE ONDERSCHEIDEN
Duhem schreef ook over het volgende belangrijke punt: ‘it is impossible to leave outside the
laboratory door the theory that we wish to test, for without theory it is impossible to regulate a
single instrument or to interpret a single reading’[a, 182]. Het is onmogelijk om de theorie te scheiden
van het experiment: ‘the result of an experiment implies, in general, an act of faith in a whole group
of theories’[a, 183].
GEDACHTE-EXPERIMENTEN
Ook het gebruik van gedachte-experimenten kan wat subtiliteiten gebruiken. Een dergelijk
experiment maakt niet gebruik van gevonden feiten om de geldigheid van een bepaald principe aan
te duiden, maar een voorspelling van hoe het experiment zal aflopen en deze voorspelling is vaak op
niets anders gebaseerd dan op het geloof in het principe zelf. Dit is dus een vicieuze cirkel. Om deze
stelling op de proef te nemen heb ik de twee gedachte-experimenten die het eerst bij me opkwamen
geanalyseerd.
De eerste was het gedachte-experiment van Schrödinger’s kat. Schrödinger’s experiment, waarin een
quantummechanisch effect gerelateerd wordt aan een macroscopisch effect, is juist gebaseerd op
zijn idee over hoe quantummechanische effecten gerelateerd wordt aan macroscopische effecten.
Men kan namelijk ook aannemen dat een quantummechanisch effect verdwijnt als hij in contact
komt met de macroscopische wereld en dan treedt Schrödingers voorspelling helemaal niet op. Het
is dus Schrödinger’s dat er macroscopische quantumeffecten bestaan, dat hem uiteindelijk doet
concluderen dat er macroscopische quantumeffecten bestaan.,
Het tweede voorbeeld was de valproef van Galileo. Hij beschreef het zelf als volgt in zijn ‘Dialogue
Concerning the Two Chief World System’[b, 63-64]:
Salviati. If then we take two bodies whose natural speeds are different, it is clear that on uniting the
two, the more rapid one will be partly retarded by the slower, and the slower will be somewhat
hastened by the swifter. Do you not agree with me in this opinion?
Simplicio. You are unquestionably right.
Salviati. But if this is true, and if a large stone moves with a speed of, say, eight while a smaller moves
with a speed of four, then when they are united, the system will move with a speed less than eight;
but the two stones when tied together make a stone larger than that which before moved with a
speed of eight. Hence the heavier body moves with less speed than the lighter; an effect which is
contrary to your supposition. Thus you see how, from your assumption that the heavier body moves
more rapidly than ' the lighter one, I infer that the heavier body moves more slowly.
[...]
One always feels the pressure upon his shoulders when he prevents the motion of a load resting upon
him; but if one descends just as rapidly as the load would fall how can it gravitate or press upon him?
Do you not see that this would be the same as trying to strike a man with a lance when he is running
away from you with a speed which is equal to, or even greater, than that with which you are
77
following him? You must therefore conclude that, during free and natural fall, the small stone does
not press upon the larger and consequently does not increase its weight as it does when at rest.
Laten we nu Duhem’s hypothese checken. De algemene relativiteitstheorie van Einstein maakt
gebruik van het empirische feit dat gravitationele massa gelijk is aan inertiële massa om de
karakteristieke eigenschap van de zwaartekracht te benoemen (namelijk dat deeltjes van
verschillende massa’s dezelfde valversnelling kennen). Waarom zou Einstein echter niet gewoon
gestart zijn met Galileo, die hier uit logische overwegingen bewijst dat dit zo moet zijn? Is het hier
niet gewoon onomstotelijk bewezen en hebben we het empirische bewijs nog wel nodig?
We kunnen het logische bewijs niet gebruiken, omdat er een denkfout in zit. We zouden immers
precies dezelfde argumenten kunnen ophouden als we de massa’s een negatieve lading geven en ze
naar een positieve lading toe zouden laten vallen. In dat geval zouden we moeten concluderen dat
alle ladingen even snel versnellen in een constant elektrisch veld, maar dat is onjuist. Galileo heeft
dus ergens in zijn beredenering aangenomen dat massa een speciale eigenschap heeft waardoor het
gelijk versnelt. Maar dit is nu net wat hij wilde aantonen!
Stel dat we het combineren van de twee stenen voorstellen door een massaloos touw te binden
tussen de twee stenen. In dat geval geldt inderdaad dat de kleine steen de grote steen zou
afremmen, als de grote steen sneller zou vallen. Als we echter het hele systeem bekijken, dan
kunnen we niet zomaar de massa’s bij elkaar optellen, omdat de situatie met het touw niet
equivalent is aan de situatie waarbij we een grote steen hebben gecombineerd uit beide massa’s. Als
we de krachten op de deeltjes nauwkeurig uitrekenen vinden we dat de kracht van de
gecombineerde massa niet gelijk is aan die van de twee massa’s met een touw in het midden.
Het is wel equivalent aan een situatie waarbij twee massa’s worden verbonden met een rigide stok.
Ook in dat geval van verliest de grote massa inderdaad snelheid, doordat hij de kleine massa moet
meetrekken, maar precies deze snelheid wint hij weer doordat de kleine massa zelf ook bijdraagt aan
de beweging (hetgeen niet het geval is met een touw). Deze twee situaties zijn equivalent, los van
het feit of de valversnelling afhankelijk is van de massa of niet. Vanwege dit laatste kunnen we ons
ook voorstellen dat deze equivalentie ook geldt in het geval waarbij we ladingen beschouwen.
Duhem beschrijft ook nog een ander soort gedachte-experiment: ‘there remains to be pointed out a
form more illogical than all the others, namely, the absurd experiment. The latter claims to prove a
proposition which is contradictory if regarded as the statement of an experimental fact’[a, 202]. Een
absurde situatie ontstaat bijvoorbeeld als we het statement ‘er is geen elektriciteit in het binnenste
van een geleidend lichaam in equilibrium’ beschouwen. We kunnen dit echter nooit testen, omdat
we in de dat geval een testlichaam moeten inbrengen in het materiaal en hiervoor moeten we eerst
een stuk materiaal weghalen om het lichaam te kunnen plaatsen, maar in dat geval meten we niet de
elektriciteit in het materiaal, maar weer de lading aan het oppervlak.
ONVERWERPBARE STATEMENTS
Dan vraagt Duhem zich af: ‘are certain postulates of physical theory incapable of being refuted by
experiment’[a, 208]. Zijn antwoord is positief. Sommige fundamentele hypotheses lijken in
werkelijkheid meer op definities. We bekijken bijvoorbeeld het volgende statement: ‘een vrij vallend
zwaar lichaam ondergaat een constante versnelling’[a, 209]:
78
Een ander voorbeeld is het principe van inertia. Dit begrip heeft geen betekenis als we geen
reverentiepunt vaststellen, maar omdat we alleen in staat om relatieve beweging te zien, zijn we niet
in staat dit punt te vinden. Zonder een dergelijk punt raakt het principe zijn betekenis kwijt. Ook
kunnen we altijd een referentiepunt kiezen waarvoor geldt dat de beweging in kwestie uniform is.
Een ander voorbeeld[a, 214] komt uit de scheikunde. Stel dat we een stof M onderzoeken. Tijdens de
analyse wordt M opgesplitst in stoffen, wiens massaverhouding gegeven wordt door a : b. We
zouden kunnen kijken of de verhoudingen tussen de twee massa’s gehele getallen opleveren (zoals
Dalton deed). We kunnen echter altijd een getal x vinden waarbij de verhouding xa : xb een
verhouding van gehele getallen oplevert. Als a : b gegeven is door bijvoorbeeld 1 : 1,25, dan vinden
we 4 : 5. Als a : b gegeven wordt door 1 : 1,00001, dan vinden we 10.000 : 10.001. Deze vraag kan
dus niet opgelost worden.
79
EINSTEIN: HET FOTON
In dit stuk zullen we het ontstaan van het foton illustreren.
HET ONTSTAAN VAN DE QUANTUM THEORIE
In 1896 schreef Wilhelm Wien een formule op, die de energiedichtheid u van black-body straling op
een bepaalde temperatuur en frequentierange kon vaststellen (de formules komen uit [a]):
, waarbij α en β constant zijn. Zijn wet werkte alleen niet voor de lage frequenties en het was Planck
die zijn formule dan ook aanpaste om ook de hoge frequenties te kunnen beschrijven:
Nu had Planck de formule die overeenkwam met de data, maar kon hij deze formule ook afleiden
vanuit fysische principes? Dit was de taak die Planck op zich nam. In zijn afleiding van Wiens
vergelijking had Planck de aanname gemaakt, dat een zwart lichaam behandeld kan worden alsof het
een collectie van lineaire, harmonische oscillatoren was. Met de elektrodynamica kon hij laten zien
dat de energiedichtheid op een bepaalde frequentie proportioneel was aan de gemiddelde energie
van de resonatoren. Hij had toen de gemiddelde energie bepaald met de thermodynamica, door de
energie van een resonator te schrijven in termen van entropie. Maar als hij deze methode voor zijn
eigen vergelijking gebruikte, kwam hij er niet uit. Hij besloot aan te nemen, dat de entropie voor een
bepaalde staat proportioneel was aan de kans op die bepaalde staat (de hypothese van Boltzmann):
met Sn als de entropie van een set van N resonatoren met totale energie En. Het aantal manieren,
waarop de totale energie verdeeld kan worden over deze oscillatoren, was gelijk aan W. Planck
merkte op dat als En een oneindig deelbare grootheid was, er een oneindige hoeveelheid verdelingen
mogelijk waren. Planck volgde Boltzmann dan ook door aan te nemen dat En eindig deelbaar was. Het
bestond uit een eindig aantal ‘energie elementen’, die hij ε noemde. Met deze aanname kwam hij
verder. Hij kwam uit op de volgende formule:
Dit wordt ‘Planck’s energy distribution law’ genoemd. Deze formule presenteerde hij in het jaar
1900. Zijn energie element ε was gelijk aan:
Boltzmann had er altijd voor gekozen, om op een bepaald moment in zijn berekeningen, ε gelijk aan
nul te zetten, maar dit was voor Planck in dit geval niet mogelijk; zijn energie bleef gequantiseerd. In
80
zijn artikelen van 1900 en 1901, is nergens op te merken, dat Planck ervan bewust was, dat zijn
theorie het einde van de klassieke natuurkunde zou inleiden. De mogelijkheid was voor hem nog
open om te geloven dat de energie van de individuele resonatoren, maar niet de energie van de
straling, gequantiseerd was. Of dat ook de energie van de individuele resonatoren niet gequantiseerd
was, maar alleen het totaal van de resonatoren en wederom niet de straling. Energie-quanta werden
dus toegeschreven aan de resonatoren en niet aan de radiatie! Het was Einstein (en onafhankelijk
ook Jeans) die de niet-klassieke natuur van de aanname van Planck benadrukte in 1905. In 1906
merkte Einstein ook op dat de resonatoren alleen gehele veelvouden van ‘hν’ aan energie mochten
bezitten en dat de energie discontinu veranderde bij absorptie en emissie.
In 1905 stelde Einstein de hypothese van het ‘licht-quantum’ voor (hetgeen later fotonen werden
genoemd). Einstein dacht dat hij licht geheel kon beschrijven als een deeltje. En niet alleen dat. De
theorie van Einstein was realistisch, het was een theorie over wat licht is en niet alleen een theorie
over hoe licht zich gedraagt. Omdat een theorie over wat licht is, niet inconsistent kan zijn (want hoe
kan het anders de waarheid beschrijven), deed Einstein er alles aan (maar tevergeefs) om zijn ‘lichtquantum’ hypothese af te leiden in een consistente manier, waarbij hij geen golf-aspecten meer
nodig zou hebben.
Einstein dacht een analogie te hebben gevonden tussen karakteristieken van een ideaal gas en de
zwarte straling. Voor een ideaal gas geldt, dat bij een verandering van het volume, de entropie als
volgt verandert:
Dit was analoog aan de verandering van de entropie van een zwart lichaam in het domein van Wien:
Ook merkte hij op dat in een ideaal gas de kans dat een N aantal moleculen in een bepaald
subvolume van dit volume zitten, gelijk is aan:
Dit was weer analoog aan het geval van de straling van een bepaalde frequentie in een bepaald
volume om een zwarte straler:
Einstein concludeerde[a, 5]:
81
Einstein dacht dat deze gelijkheid niet slechts formeel was, maar dat het hier om een echte fysische
relatie ging. De energie-distributie van deze straling verspreidde zich niet continu, maar discontinu
binnen het volume, in de vorm van onafhankelijke, gelokaliseerde quanta. Einstein kon ook nog een
voorbeeld noemen, waarin deze discontinuïteit duidelijk meetbaar was: het foto-elektrische effect.
Omdat Einstein dankzij zijn relativiteitstheorie geloofde dat er geen ether bestond voor licht, was het
ook niet nodig om licht als een golf te beschouwen.
In 1906 schreef Einstein, dat de afleiding van Planck inconsistent was geweest. Einstein
beargumenteerde dit, door erop te wijzen dat Planck twee verschillende uitdrukkingen voor de
gemiddelde energie van een resonator had gebruikt, waarbij ‘u’ wederom de energiedichtheid is,
namelijk:
en
De eerste van de twee formules kwam uit de klassieke elektrodynamica en ging uit van een continue
energie-verdeling, terwijl de tweede formule uit de statistische mechanica kwam en een discontinue
energie-verdeling nodig had. Einstein meende, dat als we de tweede formule gebruiken, we de
eerste formule niet kunnen gebruiken, zonder inconsistent te zijn.
Er waren in het begin maar weinig natuurkundigen die Einstein’s quantum-hypothese serieus namen.
Hieronder waren wel een aantal belangrijke namen: Stark, Wien, Ehrenfest, Lorentz en Planck. De
hypothese kreeg pas in 1911 een bredere aanhang, hoewel de meeste natuurkundigen het met
Planck eens waren, dat de hypothese alleen zou gelden voor de resonatoren en niet voor de radiatie
zelf[a, 8]. Einstein wees erop, dat als licht een golf was, we de absorptie van licht niet kunnen
verklaren. Om de energie, verspreid over de golf, te absorberen, moest het atoom de energie
instantaan absorberen. Dit, zei Einstein, is in tegenspraak met de eindige signaalsnelheid van de
relativiteitstheorie. In 1909 liet Einstein zien dat ‘het gemiddelde van het kwadraat van de energiefluctuaties’ uit te drukken was in twee termen:
De eerste term kon verklaard worden als men de quantum-hypothese aannam, terwijl de tweede
term de interferentie van golven leek te beschrijven. Einstein merkte ook op dat de constante ‘h’ van
Planck dimensionaal gelijk was aan e2/c, waarbij ‘e’ een discrete elektrische lading was. Dit was
onbekend in de klassieke elektrodynamica. Nu leek het dat behalve licht, ook elektriciteit een
quantum-structuur had, met een quantum van de elektriciteit (het elektron) en een quantum voor
het licht (het foton). Einstein poogde de golf en deeltjes-aspecten te verenigen. Zijn theorie leek erg
op wat we gezien hebben bij Newton. Hij dacht dat het elektromagnetische veld gebonden is aan
82
licht-quanta, zoals het elektrostatische veld gebonden is aan elektronen, maar maakte het mogelijk
dat de licht-quanta (net als de elektronen) bronnen waren van velden met de karakteristieken van
golven. Net als Newton dacht Einstein dus dat licht uit deeltjes bestond, maar dat deze deeltjes de
bron waren van golfverschijnselen! Dit maakte de continue en discontinue aspecten van de straling
verenigbaar. Interferentie kon verklaard worden door de interactie tussen de velden van de lichtquanta. Lorentz liet echter zien dat twee ver verwijderde lichtbronnen ook interferentie konden
veroorzaken en dit bleek alleen consistent met de licht-quanta, als deze enorm groot zouden zijn
(soms groter dan 80 cm). Dus dit sprak Einstein tegen. Tussen 1909 en 1918 had Einstein enorm veel
tijd besteed om zijn theorie kloppend te maken, maar zoals hij zelf toegaf, zonder succes.
In 1916 beschreef Einstein de kanswetten voor de emissie en absorptie van stralingen van een
atoom. Hij baseerde zijn theorie op de gequantiseerde staten van het atoom van Bohr en vond dat hij
‘in an astonishingly simple and general way’[a, 11] hieruit de wet van Planck had kunnen afleiden.
Einstein bedacht dat in een substantie in equilibrium, de emissie van fotonen gelijk was aan de
absorptie van fotonen. Er was één absorptie-proces bekend (B1u) en twee emissie-processen (A2 en
B2u), waarvan de eerste spontaan gebeurde en de tweede gebeurde, wanneer een foton in botsing
kwam met een atoom. De absorptie en de gedwongen emissie zijn dus (begrijpelijkerwijs) afhankelijk
van de energiedichtheid van de straling (u), maar de spontane emissie niet. Het aantal deeltjes dat
geen foton had geabsorbeerd, noemde hij n1 en het aantal deeltjes dat dit wel had gedaan, noemde
hij n2. Einstein schreef:
Dit kan herschreven worden als:
Met behulp van de Boltzmann distributie:
Vindt men:
Deze formule heeft al de vorm van de wet van Planck!
Als men nu kiest:
83
Dan vindt men:
Dit is de wet van Planck.
Einstein beschreef tevens, dat naast ε = hν voor de energie, ook de impuls discontinu veranderde: p =
hν/c. Dit was eveneens onmogelijk in de elektrodynamica. In de klassieke theorie veranderde de
impuls niet, omdat werd gedacht dat de straling in de vorm van sferische golven werd uitgezonden.
Het probleem was wel dat in het geval van Einstein, de spontane emissie van een atoom een op kans
gebaseerde verandering van de impuls voorspelde (terwijl dit met sferische golven niet het geval is).
Maar Einstein was ervan overtuigd, dat er een onderliggend mechanisme te vinden moest zijn, dat
het kansaspect in deze spontane emissie causaal kon verklaren. Dit zou Einstein uiteindelijk niet
lukken.
Planck geloofde echter dat de quantizatie in zijn theorie niet veroorzaakt werd door de straling, maar
juist door de materie. Ook Bohr was het met Planck eens: de discontinuïteit zat in de materie en niet
in de straling. Hij stelde dat het probleem van de klassieke natuurkunde hem niet zat in de
stralingsvergelijkingen van Maxwell, maar in de mechanica. Na 1923 werd dit dan ook zijn
belangrijkste probleem, het verenigen van het discontinue atoom met de continue straling. Dit was
dus een geheel andere aanpak dan Einstein! Alleen met behulp van golven kon men interferentie
verklaren, dacht Bohr, en hoewel hij toegaf dat de licht-quanta wel grote heuristische voordelen
hadden, had het voor Bohr geen realistische waarde.
HET EPR-EXPERIMENT
Van 1927 tot 1936 had niemand een grotere invloed op de gedachten van Bohr, dan Einstein. De
sterke kritieken van Einstein op zijn theorie, forceerde Bohr om zijn theorie verder uit te werken. Als
reactie op de theorie van de complementariteit, die Bohr in 1927 presenteerde, bedacht Einstein een
gedachte-experiment. Wanneer een elektron een dunne spleet doorgaat en daarna op een scherm
landt, laat het een enkel punt achter. Dit kon, volgens Einstein, maar op twee manieren
geïnterpreteerd worden:


Het ene elektron was een golf en wanneer de uitgebreide golf het scherm bereikte, klapte hij
instantaan in elkaar tot een punt
De golfvergelijking beschrijft alleen een groep elektronen en niet de individuele elektronen
Einstein merkte op dat het eerste standpunt problematisch was, omdat er dan een ‘curious action at
a distance’ nodig was, die de verspreide golf plots tot een punt zou verkleinen. Einstein’s voorkeur
ging daarom uit naar het tweede standpunt. De golfvergelijking representeert voor Einstein, een
staat van een statistische verzameling van objecten en niet echt ‘matter-waves’. Einstein hield met
deze keuze de mogelijkheid open, dat de quantummechanica niet in zijn essentie een
probabilistische theorie was, maar dat het weldegelijk een deterministische basis heeft. Met een
collectie van elektronen is het mogelijk om de geobserveerde statistiek op een deterministische wijze
te verklaren. Op gelijke wijze is de statistische mechanica deterministisch, omdat het uiteindelijk
geheel te beschrijven is met de klassieke mechanica.
84
Ook geloofde Einstein dat het mogelijk moest zijn om de onzekerheidsrelatie te omzeilen. In 1930
bedacht Einstein een gedachte-experiment, waarin hij een doos met een klein gat voorstelt, met een
deurtje om het gat te openen en te dichten. Er zat straling in de doos en het deurtje kon heel even
open worden gemaakt, om één enkel foton eruit te laten. De doos werd voor en na de meting
gewogen, waardoor met het verschil de energie van het foton berekend kon worden. Einstein dacht
dat hij hiermee zowel de tijd, als de energie, exact had gemeten en dus de onzekerheidsrelatie had
omzeild.
[a, 158]
Bohr’s antwoord was als volgt. Hij hing de doos aan een veer, waardoor hij de massa van de doos kon
meten, aan de hand van de uitrekking van de veer. Het meetresultaat, met een onzekerheid Δm, kon
dus ook geschreven worden als een onzekerheid Δy van de uitrekking van de veer. Omdat ΔyΔp ≥ h,
betekent dit dat er ook een onnauwkeurigheid is in de impuls van de doos. In de berekeningen is
nodig dat de doos zwaar genoeg is. De onzekerheid in de impuls is daardoor kleiner dan de impuls
die de zwaartekracht, tijdens de meettijd T, op de doos uitoefent. We vinden hieruit de vergelijking[a,
159]
:
en dit is ook te schrijven als,
Of
Bohr plaatst ook een klok in de doos. De doos, met daarin de klok, stijgt een klein stukje Δy, tijdens
het verlaten van het foton. De klok heeft ook een onzekerheid in het aflezen van zijn tijd Δt en via de
algemene relativiteitstheorie zijn deze Δy en Δt te relateren, met behulp van de zogenaamde ‘redshift’ formule:
Als we dit combineren met de formule die we eerder vonden, krijgen we:
85
En met behulp van E = mc2 wordt dit gelijk aan:
Einstein accepteerde het antwoord van Bohr. Maar Einstein gaf niet op. Hij probeerde het op een
andere manier. Einstein schreef dat we, nadat het foton de doos had verlaten, konden kiezen tussen
het herwegen van de doos of het aflezen van de klok, maar niet allebei. Einstein nam ook aan dat we
deze handelingen kunnen verrichten zonder het foton te verstoren. Het foton kan immers al
willekeurig ver weg zijn, als wij een van deze twee handelingen willen verrichten. Als het mogelijk is
om ‘de energie te meten zonder het foton te verstoren’ of ‘de tijd te meten zonder het foton te
verstoren’, heeft het foton dan niet gewoon een exacte energie en een exacte tijd, ook al kunnen wij
maar één van beide meten!?
Einstein denkt dat de quantummechanica, die maar een van deze twee dingen boven water kan
halen, daarom een incomplete beschrijving geeft van de natuur. Dit gedachte-experiment wordt een
‘delayed choice’-experiment genoemd, om de voor de hand liggende reden, namelijk dat de keuze
over wat we van het foton kunnen weten, pas na het event kan worden gekozen. Dit experiment van
Einstein was ook het begin van een argument dat hij in 1935 zou uitwerken in het zogenaamde EPR
argument.
Bohr vulde Einstein’s experiment aan met een ander voorbeeld. Als een foton een dubbele spleet
gepasseerd is, kan nog steeds worden besloten of de positie of de impuls gemeten wordt en dus ook
of we een interferentiepatroon waarnemen of niet! Het lijkt dus mogelijk dat de uitkomst van een
experiment afhangt van wat we doen met de apparatuur, nadat de relevante interactie tussen het
object en het instrument heeft plaatsgevonden. Bohr reageert door te stellen dat het meten van de
energie een compleet ander experiment was, dan het meten van de tijd. Hoewel de interactie al
heeft plaatsgevonden blijft Bohr volhouden dat beide keuzes niet dezelfde ‘fysische realiteit’
beschrijven, zoals Einstein denkt, maar twee totaal verschillende fenomenen. Hoewel Einstein het
belachelijk vond dat deze ‘delayed choices’ het eindresultaat van het experiment konden
beïnvloeden, concludeerde Bohr dat het toch mogelijk is.
In het EPR-argument stellen Einstein, Podolsky en Rosen zich een systeem voor, dat zich in een
‘singlet-staat’ bevindt (hetgeen betekent dat de totale spin van de twee deeltjes in totaal nul is). Men
kan deeltjes, die in deze staat terecht zijn gekomen, zo ver van elkaar af laten bewegen, dat ze geen
interactie meer met elkaar kunnen hebben. Als men nu besluit het eerste deeltje te meten en
bijvoorbeeld het resultaat ½ħ vindt (waar men 50% kans op heeft), dan moet het andere deeltje zich
per direct in de staat -½ħ bevinden. Wanneer de quantummechanica dus inherent probabilistisch is,
heeft de meting van het ene deeltje invloed op de staat van het andere deeltje, ook al kunnen deze
deeltjes zo ver van elkaar af staan, dat zelfs de lichtsnelheid deze informatie niet had kunnen
overbrengen. Einstein vond dit absurd en dacht daarom dat de quantummechanica incompleet was.
Dit kan alleen door de quantummechanica verklaard worden, als er ‘curious action at a distance’
mogelijk zou zijn. Einstein heeft hier een enorm sterk punt!
86
Bohr bleef echter volhouden. Als de quantumtheorie deze ‘curious action at a distance’ moet
accepteren om compleet te blijven, dan accepteert de quantummechanica van Bohr dat! Men kan
zich afvragen welke redenen Bohr kon hebben om deze ‘absurditeit’ in zijn theorie te laten bestaan!
Later werd Bohr’s gelijk aangetoond, maar destijds was het een hele grote (onlogische) stap om te
geloven dat ‘curious action at a distance’ zou bestaan! Bohr reageert[a, 169]:
Murdoch citeert Bohr over hetzelfde onderwerp[a, 170]:
Bohr geeft toe dat een meting van het ene deeltje, het andere deeltje niet fysisch kan verstoren,
maar toch blijft hij denken dat de experimentele meting van één deeltje, voor zowel het ene als het
andere deeltje, de staat kan bepalen.
[a, 170]
De conditie waarover gesproken wordt, wordt bepaald door de experimentele set-up, en moet zich
noodzakelijk houden aan de onzekerheidsrelatie. Dus zelfs in dit geval offert Bohr de
onzekerheidsrelatie niet op! Murdoch merkt op: ‘Einstein, understandably, was never able to grasp
Bohr’s point here’.
Het EPR-argument en Bohr’s reactie maakte een eind aan het debat tussen Einstein en Bohr. Einstein
bleef geloven dat de quantummechanica incompleet was en dat er ‘hidden states’ bestonden, die de
mechaniek achter de statistische fenomenen konden verklaren. In 1964 toonde Bell echter aan dat
deze ‘hidden states’ niet konden bestaan. Ook werd het bestaan van ‘delayed choice’ aangetoond.
87
EPILOOG
FILOSOFIE IN DE WETENSCHAP
We hebben gezien dat de filosofie geen bevredigend antwoord kan geven op vragen als:



Wat is wetenschap?
Wat is een natuurwet?
Wanneer is een theorie bewezen of verklaard?
Wat zegt dit over de wetenschap? Volgens Feyerabend betekent dit niets minder dan dat de enige
wetenschappelijke methode ‘anything goes’[f, H16] is. Filosofen en wetenschappers (zoals Quine,
Duhem en Mach) hebben kritische vragen gesteld over de aannames en de onzekerheid van
wetenschappelijke theorieën. Ook Einstein, die vaak als een extreme realist wordt afgeschilderd,
geloofde dat er geen logische methoden bestaan om achter de axioma’s van een theorie te komen.
Einstein geloofde wel dat de mens in staat is om een theorie te bedenken, die de wereld juist
beschrijft, maar hij gaf wel toe, dat dit idee eerder was gebaseerd was op ‘faith’, dan op rationaliteit.
Ook Penrose geeft toe, dat zijn extreme realisme een voorkeur was en niet zozeer een logische
deductie[d]. Wigner had echter de problemen van een dergelijk standpunt als te groot ervaren, om
dezelfde conclusie te kunnen trekken[e].
Ook Hertz liet zien, in zijn gewaagde poging om de theorie van Newton op een geheel ander
fundament te zetten, dat aannames onzeker waren. De ontwikkeling waarbij zelfs axioma’s van grote
succesvolle theorieën bekritiseerd werden, stamt voornamelijk uit de filosofie van de 19de eeuw. Het
heeft uiteindelijk de consequentie gehad, dat veel wetenschappers in de 20ste eeuw heel flexibel
omgingen met hun axioma’s. Men deinsde er niet eens meer voor terug om belangrijke axioma’s te
verwerpen, die ooit beschouwd werden als ‘self-evident truths’. Met deze mogelijkheid kon men de
theorie die de voorkeur had, van de ondergang behoeden. Ook Quine bevestigde dit, toen hij
beschreef dat het filosofisch altijd mogelijk is, om een alternatieve theorie te bedenken, die dezelfde
data kan verklaren[f, 26].
Nietzsche dacht dat er zelfs in de logica vooroordelen huisden. Niet alleen de axioma’s zijn dus
onzeker, maar ook de logische redeneringen, waarmee we onze theorie uit deze axioma’s
opbouwen[g]. Dit werd fenomenaal bewezen in het werk van Bohr, die liet zien dat zelfs onze logische
concepten niet altijd geldig waren. Einstein had laten zien, dat veel van onze concepten (die eerst
‘self-evident’ leken) toch onwaar waren, maar zijn theorie bleef wel deterministisch en logisch
consistent. Bohr blies ook deze fundamenten van de oude natuurkunde omver.
WETENSCHAPPELIJKE VOOROORDELEN
Veel wetenschappers geloven dat de filosofie niets te bieden heeft en dat het bestuderen ervan een
tijdsverspilling is. Er heerst de gedachte dat de filosofie in de twintigste eeuw zo goed als niets heeft
geleverd, dat interessant is voor een fysicus. De natuurkunde daarentegen, heeft heel veel
bijgedragen aan de filosofie.
Ik wil betogen dat de werken van o.a. Quine, Kuhn en Feyerabend, maar ook Nietzsche, Maxwell en
Hertz, wel degelijk iets interessants te vertellen hebben aan fysici. We hebben bijvoorbeeld gezien
dat de starheid en dogmatiek van sommige naïeve vormen van realisme (die in de wetenschap veel
88
invloed hebben) met een korrel zout genomen kunnen worden. De opvatting van Maxwell en
Whewell over dit onderwerp vind ik erg duidelijk: de wetenschap is gebaseerd op metafysische
aannames en deze praktische metafysica moet dus door de wetenschappers beheerst worden[j, 189].
De aannames, de logica en de wetenschappelijke theorieën bevinden zich voor een deel op erg glad
ijs. In plaats van hier over in te zitten, kan dit juist weg vrijmaken voor creativiteit, verbeelding,
flexibiliteit en een openheid voor verschillende ideeën, zoals ook Feyerabend beweert.
Ook in de 17de en 18de eeuw is er veel input geweest van de filosofie in de wetenschap. Zo maakte
Hobbes ons bewust van onzekerheden in de experimenten van zijn tijd[i, H5]. Hij vroeg zich af: hoe
weten wij wanneer een instrument werkt? Misschien concluderen we wel dat het werkt wanneer het
apparaat het gewenste antwoord geeft! Ook is de welbekende stroming genaamd het empirisme van
onschatbare waarde geweest voor de natuurkunde. Hume and Berkeley bijvoorbeeld maakten ons
bewust van de limieten van onze kennis. Hume stelde dat wij alleen in staat zijn om patronen te
herkennen in hoe de natuur opereert, maar dat we niet in staat zijn om oorzaak en gevolg te ‘zien’.
Dit is slechts onze een interpretatie van een correlatie.
De logisch positivisten hebben ons erop geattendeerd dat onze theorieën elementen kunnen
bevatten, die niets van de natuur weerspiegelen, maar juist van de specifieke manier waarop wij
theorieën construeren. Veel metafysische statements werden daarom door Russell en de logisch
positivisten omgeschreven tot slechts ‘taalkundige’ constructies, die de metafysische entiteiten
konden terugleiden tot ‘gepraat’ over observeerbare entiteiten. Hoewel het niet lukte om alle
metafysica op deze wijze uit de theorie te verwijderen, zijn er voorbeelden te bedenken waarin dit
wenselijk is.
Een ander vooroordeel van moderne wetenschappers is het geloof dat de wetenschapper ‘door
heeft’, wanneer hij een stukje ‘Zekere Kennis’ ontdekt. Hoewel vaak erkent wordt dat de wetenschap
inderdaad door sociologische factoren beïnvloed wordt, is het eindproduct onafhankelijk van deze
factoren. Wij hebben echter genoeg ‘aha-momenten’ gezien (zoals de ether-theorie), die uiteindelijk
verworpen werden. Er zijn vele voorbeelden, zoals de zogenaamde phlogiston-theorie waarbij het
bestaan van phlogiston werd gepostuleerd, waar een hele goede theorie wordt gecreëerd, die grote
voorspellende waarde heeft, veel aha-momenten kent en dan uiteindelijk toch blijkt te gaan over een
substantie die niet bestaat.
Pickering in zijn analyse van het ontstaan van de quarktheorie, merkte op dat er vaak meerdere
modellen zijn (waaronder de zogenaamde theorie van Regge, die van Zweig en Gell-mann en die van
Feynman), die juiste voorspellingen maken, maar uiteindelijk blijft alleen de meest succesvolle
bestaan (in dit geval een combinatie van de laatste twee). Pickering heeft laten zien, dat het vrij
gemakkelijk is om data te fitten met behulp van de veelheid van wiskunde, die we tegenwoordig tot
onze beschikking hebben. Het is dus veel te gemakkelijk is om ‘aha-momenten’ te krijgen, waarin een
theorie precies lijkt te kloppen met een observatie. We hebben een soortgelijke conclusie ook gezien
in het werk van N. Goodman[f, H11].
Een veel gebruikte metafoor die vaak door wetenschappers gebruikt wordt, is de metafoor van een
berg, waarbij er meerdere routes naar de top bestaan, maar waarbij deze top een stukje zekere
kennis bevat. Vanuit deze top, zijn er echter altijd weer hogere bergen te zien, waar een volgende
groep klimmers naartoe zou kunnen klimmen.
89
Maar dan vraag ik mij af: wat heeft het te betekenen, als men boven op een de berg de wetten van
Newton vindt en op een andere berg de wetten van Einstein en op een andere de Regge theorie, als
deze theorieën uiteindelijk allemaal onjuist blijken te zijn. Wat men vindt op de top van de berg heeft
dus weinig met de realiteit te maken, want hoe kan anders later blijken, dat wat men vond verkeerd
was.
De situatie doet me denken aan een verhaal van Alphonse Allais, dat hieronder wordt verteld door
Jean Baudrillard[b, 209]:
‘Twee jonge mensen, twee jonge minnaars, ontvangen elk een anonieme brief waarin ze worden
gewezen op de ontrouw van de ander: als de vrouw zich ervan wil overtuigen hoeft ze slechts naar
een bepaald gemaskerd bal te gaan – haar minnaar zal er zijn, vermomd als Harlekijn. De ander
ontvangt dezelfde geheime raad: ga naar dat bal, je vrouw zal er zijn, vermomd als een Congolese
Kano. Die betreffende avond, als het gemaskerde bal in volle gang is, zitten twee personen zich in een
hoekje te vervelen: een Harlekijn en een Congolese Kano. Tenslotte benadert hij haar en nodigt haar
uit. Het eindigt in een privévertrek waar ze op elkaar afstormen en elkaar het masker afrukken. En
dan – toppint van consternatie – constateert het verhaal: ZE WAREN HET GEEN VAN BEIDEN!’
Zo ook liepen Zweig en Gell-Mann tegen dezelfde berg der wetenschap, hadden hun ‘ahamomenten’ en bereikten de top en concludeerde beide ‘gelukkig, de ander is er nog niet’. Feynman
klimt ook naar boven en vind ‘ze zijn er geen van beiden’!
Een ander bekend voorbeeld zijn de drie verschillende oplossingen, die Bohr, Heisenberg en Pauli
voorstelden om een quantummechanisch probleem op te lossen. Bohr geloofde dat het behoud van
energie geschonden werd, Heisenberg dat de ruimtetijd niet continu was en Pauli dat er een ander
deeltje bestond, waarvan wij hij bestaan nog niet kende (Pauli kreeg uiteindelijk gelijk). Wat is dit
voor een berg, die dit soort situaties toelaat? En waarom zou dit resultaat los staan van sociale
factoren? We hebben gezien dat wetenschappelijke feiten soms later onwaar bleken te zijn, omdat
de standaarden van de tijd veranderden. Als het paradigma verandert, dan verandert ook de berg. Zo
kan men denken jaren lang een berg te hebben beklommen, die uiteindelijk plots in rook op gaat!
Wat is dit voor een berg?
In de 17de eeuw was de wetenschap gevuld met mechanistische denkbeelden over magnetisme en
zwaartekracht. Hoe ingenieus het magnetisme ook door Descartes beschreven was, het heeft het
niet gehaald. Deze nadruk op de mechanistische wetenschap was duidelijk een vooroordeel van de
tijd, maar ook deze vooroordelen vond men op de top van de berg. Ik noem dit sociologische
invloeden! In de 19de eeuw was de ethertheorie een vereiste van elke zichzelf respecterende theorie
over het elektromagnetisme. De theorieën, zelfs die van Maxwell, leken allemaal te wijzen op het
bestaan ervan.
We hebben keer op keer gezien, dat wetenschappers nieuwe deeltjes en alomtegenwoordige velden
postuleerden om fenomenen met hun theorieën in overeenstemming te brengen. Vaak bleken deze
voorspellingen later onwaar te zijn, ook al waren ze in overeenstemming te brengen met de data.
Wat zegt dit over de moderne theorie van de donkere materie? Waarom wordt aanvaard dat ons
universum vol zit met materie, die we niet kunnen waarnemen, terwijl er een scala van andere,
minder extreme alternatieven te bedenken zijn, die dezelfde data kunnen verklaren, met andere
aannames!
90
Als laatste beweren wetenschappers ook geregeld, dat ze op de vragen van de filosofen (bijvoorbeeld
‘wat is wetenschap?’) gemakkelijk een voor de hand liggend antwoord kunnen vinden. Hiermee
wordt de diepte van een dergelijk probleem onderschat. Men denkt vaak dat men met simpelweg
‘common sense’ antwoorden kan geven op al deze vragen! Wij hebben nu gezien, dat al deze vragen
na een eeuw van studie nog geen oplossingen hebben gevonden.
Ik snap dat sommige wetenschappers zich op hun teentjes getrapt voelden, doordat sommige
filosofen en sociologen vaak schaamteloos kritisch zijn op de wetenschappelijke praktijk en mogelijke
onzekerheden zo uit het verband halen, dat de suggestie wordt gewekt dat het de sterke kanten van
veel belangrijke technieken te niet zou kunnen doen. Toch denk ik dat een te grote focus op de
objectiviteit ook niet goed is. Een middenweg (zoals Ian Hacking dat ook betoogt) lijkt de juiste
oplossing.
Het is voor mij een filosofisch vraagstuk, wanneer wij ons afvragen wat de waarde is van onze
wetenschappelijke theorieën, aannames, methoden en technieken. Duhem onderzocht bijvoorbeeld
de overeenkomsten van verschillende gedachte-experimenten. Dit is duidelijk een filosofisch
vraagstuk, omdat het een nauwkeurige vergelijking van bewijs-structuren (ofwel ‘rational
reconstructions’) vereist en niet gaat over het bestuderen van natuurlijke fenomenen. Men zou ook
een nauwkeurig onderzoek kunnen doen naar de bewijsstructuur van bijvoorbeeld de algemene
relativiteitstheorie. Wellicht vindt men dan dat alle succesvolle testen van deze theorie niet zijn
gebaseerd op voorspellingen die gebruik maken van de meest algemene theorie, maar slechts op het
equivalentie principe en de daaraan nauw verwante wiskunde. Een ander voorbeeld van een
filosofische vraag vindt men in de mechanica van Hertz. Ook Hertz stelde een vraag die niet specifiek
verwees naar het beschrijven van een natuurlijk fenomeen, maar naar een filosofische probleem. Het
was niet perse zijn doel om een correcte mechanica te maken, maar eerder om aan te tonen dat een
theorie van een dergelijk kaliber (de mechanica) meerdere representaties kende (meerdere
‘scientific images’) en dat zijn representatie beter was omdat het filosofisch correcter was. Een ander
vraag, die Wigner onder andere heeft gesteld, is het onderzoeken in de verschillende
wetenschappelijke theorieën, naar aanwijzingen over de natuur van de wiskunde. Men kan zich
bijvoorbeeld afvragen af het altijd mogelijk is om een representatie van een theorie te vinden zonder
bijvoorbeeld imaginaire of Grassmann-getallen. Als blijkt dat dit soms onmogelijk is of juist altijd
mogelijk is, dan kunnen we daaruit leren over de connectie tussen onze wiskundige methode en de
natuur.
Wellicht had Nietzsche gelijk had toen hij zei dat we onze waarden (in ons geval de
wetenschappelijke gebruiken en methoden) niet alleen moeten gebruiken om externe statements te
beoordelen, maar dat we ook de waarden zelf moeten bestuderen. Hij schreef: We have taken the
worth of these “values” as something given, as self-evident, as beyond all dispute[o, 6]. We zijn in een
bepaalde mate onzeker over ‘the value of our values’[o, 6]. Dit leert ons om niets voor vanzelfsprekend
aan te nemen, zelfs niet onze best onderbouwde of meest voor de hand liggende theorieën en
axioma’s en onze wetenschappelijke gebruiken en methoden. Aan de andere kant moeten we het
ook niet overdrijven. Hacking heeft betoogd dat in een hele hoop situaties geen grote twijfel bestaat
en dat we er in deze situaties met een redelijke zekerheid voor kunnen kiezen om een fenomeen als
realistisch aan te duiden[n].
Dank voor uw aandacht.
91
Referenties
Inleiding
[a]
[b]
[c]
De Stelling van Gödel
Newman & Nagel
Het Spectrum
1986
Gödel’s Incompleteness Theorems
R. Smullyan
Oxford University Press US
1992
Brouwer’s Cambridge lectures on intuitionism
L. Brouwer
Cambridge University Press
1981
(oorspronkelijk 1951)
[d]
[e]
[f]
[g]
Representing and Intervening
I. Hacking
Cambridge University Press
1983
Two Dogma’s of Empiricism
W. Quine
The Philosophical Review 60: 20-43
1951
Constructing Quarks
A. Pickering
University of Chicago Press
1984
Against Method
P. Feyerabend
Verso
1993
(oorspronkelijk 1975)
[h]
[i]
Philosophy of Science
J. Kasser
The Teaching Company
2006
Aim & Structure of Physical Theory
P. Duhem
Princeton University Press
1991
(oorspronkelijk 1906)
Descartes: De Analytische Meetkunde
[a]
[b]
Descartes: Philosophy, Mathematics & Physics
S. Gaukroger (ed.)
Harvester
1980
La Geometrie
R. Descartes
92
Digitale versie van de nederlandse vertaling:
http://digbijzcoll.library.uu.nl/metadata.php?lang=nl&W=On&BoekID=338
(oorspronkelijk 1659)
[c]
[d]
The Originality of Descartes Conception of Analysis
B. Timmermans
Journal of the History of Ideas. Vol. 60, Nr. 3
1999
History of Science: 1700 – 1900
F. Gregory
The Teaching Company
2003
Newton: De Zwaartekracht
[a]
Philosophiae Naturalis Principia Mathematica
I. Newton
Daniel Adee
1846
(oorspronkelijk 1687)
[b]
Newton's Principia for the common reader
S. Chandrasekhar
Oxford University Press
1995
Let Newton Be!
Roche (ed.)
Oxford University Press
1989
[d]
http://en.wikipedia.org/wiki/Bucket_argument
-
[e]
http://en.wikipedia.org/wiki/Mach's_principle
-
[c]
Maxwell: Het Ether-model
[a]
[b]
[c]
The Natural Philosophy of J. C. Maxwell
P. Harman
Cambridge University Press
2001
On the Notation of Maxwell’s Field Equations
A. Waser
rexresearch.com/maxwell1/20equations.pdf
2000
History of Science: 1700 – 1900
F. Gregory
The Teaching Company
2003
Hertz: Scientific Images
[a]
Principles of Mechanics
H. Hertz
Cosimo, Inc.
2007
93
[b]
[c]
[d]
[e]
[f]
[g]
[h]
Mechanistic Images in Geometric Form
J. Lützen
Oxford University Press
2005
Some considerations on the principles of dynamics
H. Lorentz
Te vinden in: Collected papers
Zeeman & Fokker
???? volume
1934-39
Paul Ehrenfest
M. Klein
American Elsevier Pub. Co
1970
Variational Methods
B. Tabarrok (ed.)
Springer
1994
Hertz: Classical Physicist, Modern Philosopher
D. Baird (ed.)
Springer
1998
Science Wars
S. Goldman
The Teaching Company
2006
The Aether and Hertz’s Principles of Mech.
J. Mulligan
Physics in Perspective. Vol. 3 Nr. 2
2001
Overizcht: Wetenschapsfilosofie
[a]
[b]
[c]
[d]
Philosophy of Science
J. Kasser
The Teaching Company
2006
Wetenschapsfilosfie voor geesteswetenschappen
Leezenberg (ed.)
Amsterdam University Press
2003
Representing and Intervening
I. Hacking
Cambridge University Press
1983
Paradigm_shift
Wikipedia
Duhem: Het Karakter van de Wetenschap
[a]
Aim & Structure of Physical Theory
P. Duhem
Princeton University Press
1991
(oorspronkelijk 1906)
94
[b]
Dialogue Concerning Two New Sciences
G. Galilei
Vertaling 1914 op pagina 63-64:
http://galileoandeinstein.physics.virginia.edu/tns_draft/tns_061to108.html
(oorspronkelijk 1638)
Einstein: Het Foton en het EPR-experiment
[a]
[b]
Bohr’s Philosophy of Physics
D. Murdoch
Cambridge University Press
1989
What Was Born's Statistical Interpretation?
L. Wessels
Philosophy of Science association. Vol. 2, pp. 187-200 1980
[c]
[d]
Condensed Matter Field Theory
Altland (ed.)
Cambridge University Press
2006
Ideas & Opinions
A. Einstein
Crown Publishers
1954
Against Method
P. Feyerabend
Verso
1993
Epiloog
[a]
(oorspronkelijk 1975)
[b]
[c]
[d]
[e]
[f]
Fatal Strategies
J. Baudrillard
Pluto
1999
Ideas & Opinions
A. Einstein
Crown Publishers
1954
What is Reality?
R. Penrose
New Scientist magazine, Nov. 18-24
2006
The Unreasonable Effectiveness of Mathematics
E. Wigner
Pure and Applied Mathematics. Vol. 13, No. I
1960
Philosophy of Science
J. Kasser
The Teaching Company
2006
95
[g]
De Vrolijke Wetenschap
F. Nietzsche
Arbeiderspers
1980
(oorspronkelijk 1882)
[h]
[i]
[j]
[k]
[l]
[m]
[n]
[o]
Laboratory Life
Woolgar & Latour
Princeton University Press
1986
Science Wars
S. Goldman
The Teaching Company
2006
The Natural Philosophy of J. C. Maxwell
P. Harman
Cambridge University Press
2001
History of Science: Antiquity to 1700
L. Principe
The Teaching Company
2002
Constructing Quarks
A. Pickering
University of Chicago Press
1984
Will to Power
Solomon & Higgins
The Teaching Company
1999
Representing and Intervening
I. Hacking
Cambridge University Press
1983
On the Genealogy of Morals
F. Nietzsche
Courier Dover Publications
2003
(oorspronkelijk 1887)
96
Download