OVER DE GESCHIEDENIS, FILOSOFIE & SOCIOLOGIE VAN DE WETENSCHAP S DINKGREVE INHOUDSOPGAVE Inleiding Overzicht: Wetenschapsfilosofie 6 Descartes: De Analytische Meetkunde 33 Newton: De Zwaartekracht 40 Maxwell: Het Ether-model 46 Hertz: Scientific Images 50 Duhem: Het Karakter van de Wetenschap 76 Einstein: Het Foton en het EPR-experiment 80 Epiloog 88 Referenties 92 2 Alle citaten zijn voorzien van een letter en een cijfer. De letter is een verwijzing naar de literatuurlijst achterin en het cijfer geeft de bladzijde weer van het betreffende boek, waarin dit citaat te vinden is. INLEIDING Dit is de ingekorte versie van 400 pagina’s tellend werk, dat ik gedurende een jaar tijd heb geschreven. Hoewel de totale versie evenveel aandacht gaf aan filosofische, geschiedkundige, sociologische en natuur-wiskundige onderwerpen, is in deze verkorting vooral de nadruk gelegd op de natuurkundige aspecten, hoewel ik zal proberen de rode draad van het origineel te behouden. Wat is deze rode draad? Het doel was het schrijven van een werk, dat genoeg geschiedenis, filosofie en sociologie van de wetenschap zou bevatten, dat een natuurkundige lezer voldoende op de hoogte is van de belangrijkste resultaten uit deze vakgebieden. Maar omdat de gemiddelde natuurkundige het nut niet ziet van deze filosofische kennis, zal ik het als mijn belangrijkste taak zien om te betogen dat de filosofie wel degelijk zijn sporen heeft nagelaten in de wetenschap en zelfs belangrijke dingen onderzocht heeft, die belangrijk kunnen zijn voor de dagelijkse praktijk van de wetenschapper. Wetenschappers weten precies hoe ze met wetenschap om moeten gaan, maar wat is deze wetenschap nu precies en waarom werkt het zo goed? Dit zijn vragen die een wetenschapsfilosoof zich stelt. Wat is logica? Waarom werkt de wiskunde zo goed? Wat zijn de karakteristieken van een goed gedachte-experiment? Wanneer is iets experimenteel bewezen? Deze wetenschapsfilosofische vragen en meer zullen we in dit werk bestuderen. Een andere belangrijke vraag is: in hoeverre beschrijft de wetenschap realiteit? Verklarende en voorspellende waarden van de wetenschap en de toenemende controle over de natuur zijn enkele redenen, die zo nu en dan gegeven worden om de monopoliepositie van de wetenschap op het vinden van realiteit te verklaren. Maar we zullen zien dat dit soort redenen niet voldoende zijn om de 2 zekerheid van de wetenschappelijke kennis te waarborgen. Zelfs niet in onze beste theorieën, zelfs niet in de fundamentele wiskunde. Er is mij meerdere malen door wetenschappers verteld dat de filosofie niet echt iets opgeleverd heeft, dat interessant is voor de natuurkundige, terwijl dit andersom wel sterk het geval is geweest. Toch is dit niet waar. De logica, een van de belangrijkste subgebieden van de filosofie, heeft in de 20ste eeuw bijvoorbeeld een enorme verandering doorgemaakt. Een aantal eeuwen terug had Kant nog gedacht dat de logica af was, maar in de 20ste bleken hier een aantal revolutionaire veranderingen aan te komen. Zo vond Russell, in een werk waarin hij juist het tegenovergestelde probeerde aan te tonen, dat het niet mogelijk is wiskunde terug te brengen tot de logica, omdat de wiskunde een aantal onlogische paradoxen kent, die niet tot de logica gereduceerd kunnen worden[a, 40-41] . Dit was het einde van een eeuwenoud vooroordeel. Tarski liet in zijn versie van de theorie van Gödel zien, dat in de gewone rekenkunde er logische juiste theorema’s bestaan, die niet uit deze axioma’s afgeleid kunnen worden, hoe men de axioma’s ook kiest[b, H2]. Brouwer vond dat het principe van de uitgesloten derde, een belangrijk onderdeel van de logica sinds Aristoteles, niet een tautologische, maar een empirische wet was[c, 3]. William Craig vond dat voor elke axiomatische theorie met zowel observationele als theoretische termen, er ook een axiomatische theorie bestaat met alleen observationele termen[d, 50]. Buiten deze logische onderwerpen, zijn er ook belangrijke resultaten, die gevonden zijn tijdens een zoektocht naar de karakteristieken van de wetenschap. Deze resultaten zijn vaak negatief, maar daarom niet van minder belang. Quine en Pickering wezen bijvoorbeeld op de mogelijkheid om een theorie aan te passen, zonder dat er iets veranderd aan de observationele gegevens. Er zijn dus meerdere equivalente theorien mogelijk. Quine liet zien dat dit altijd in principe mogelijk was[e, VI]. Pickering liet zien dat dit ook vaak gebeurd in de dagelijkse natuurkunde[f]. Kennis van deze wispelturigheid van de theorie kan natuurlijk erg handig zijn, omdat in de theorie vaak ontologische aspecten worden gepostuleert, die invloed hebben op ons wereldbeeld en dus niet noodzakelijk bestaan. Vanwege deze wispelturigheid is het belangrijk om niet alleen van een theorie te weten te komen of deze strookt met de feiten, maar ook om de geschiedenis van de theorie en de bewijsstructuur ervan te analyseren. Uit de geschiedenis leert men welke keuzes men heeft moeten maken om uiteindelijk op de theorie uit tekomen. Vaak is het geval dat er op een bepaald tijdstip de mogelijk bestond voor de theorie om een geheel andere weg in te slaan. Als we serieuze studenten zijn, moeten we ook de alternatieven eerlijk beschouwen en pas naderhand een keuze maken. Als deze stap wordt overgeslagen, dan verliest een theorie aan bewijskracht. Ook de bewijsstructuur is het bestuderen waard. Wanneer een theorie met veel verschillende methoden is bevestigd, heeft dit natuurlijk veel meer waarde, dan wanneer men maar een of twee bevestigende experimenten kent. Als men eerst een theorie opbouwt en gebaseerd op dit werk een experiment voorstelt, dat succesvol blijkt, dan heeft dit natuurlijk veel meer waarde, dan wanneer men een theorie zo omschroeft tot hij met bekende feiten in overeenstemming is. Dit geldt vooral nu we weten van Pickering en Quine. In het eerste geval laat u veel meer over aan de natuur, terwijl de tweede methode veel kunstmatiger is. Ook is een bewijs sterker als het een experiment voorstelt dat een heel onverwachts resultaat heeft. 3 Feyerabend had betoogt dat er geen manier bestond om rationaliteit of wetenschap te definieren[g, H2] . Altijd als we een definitie kiezen, dan blijken er goede voorbeelden van wetenschap buiten te vallen en slechte voorbeelden binnen te vallen. Hieruit leren we dat de strikte scheiding tussen wetenschap en niet-wetenschap, die binnen veel wetenschapsfaculteiten heerst, vaak te scherp is aangezet, hetgeen ervoor kan zorgen dat sommige legitieme onderzoeksgebieden buitenspel gezet worden. Een ander nuttig voorbeeld komt uit het logisch-positivisme en is voor mij al vaak nuttig gebleken. De logisch positivisten vroegen zich af of een resultaat van bijvoorbeeld een berekening iets zegt over de natuur of misschien slechts een ‘taalkundige constructie’ is, die eerder een eigenschap is van de manier waarop wij onze wiskunde of logica gebruiken[h, H7]. Als we bijvoorbeeld schrijven dat een golffunctie samenvalt tot een deltafunctie, moeten we niet geloven dat dit echt is wat de natuur doet. Er is niemand die ooit heeft gemeten dat het deeltje hier echt tot een punt samenvalt. Dit deel van de theorie is gekozen omdat er gemakkelijk mee te rekenen is, maar een iets andere vorm is net zo goed mogelijk. Het wordt interessanter als we het voorbeeld van Einstein nemen van een lichtstraal, dat een lichtstraal uitzendt, waarbij men toch vanuit elk inertiaalframe meet dat de tweede lichtstraal met de lichtsnelheid beweegt. Niemand heeft ooit zoiets dergelijks gemeten, zelfs niet in benadering. Misschien is dit niet een feit van de natuur, maar eerder onze eigen wiskundige constructie, we weten immers dat wetten vaak stuklopen op extrema. Soms blijkt wat we opvatten als een feit over de wereld simpelweg een definitie te zijn (wederom een taalkundige constructie). Soms, en dit heb ik al een aantal keer meegemaakt, lijkt het of het samenvallen van twee uitkomsten uit twee verschillende gedachte-experimenten, een bewijs vormt voor de juistheid een theorie. Nadere beschouwing kan dan toch uitwijzen dat beide experimenten uiteindelijk afkomstig waren uit een bron, waarin dit samenvallen als definitie werd aangenomen. Een laatste voorbeeld komt uit het werk van Duhem[i, 202]. Duhem vertelde dat het vaak zo is dat gedachte-experimenten zo zijn opgesteld dat ze het eindantwoord al latent bevatten als een aanname. Zoals men later kan lezen heb ik deze stelling getest op de bekende valtijdproef van Galileo, die door velen wordt gezien als het typische voorbeeld van een geslaagd gedachteexperiment. Toch kreeg Duhem ook in dit geval gelijk. In dit werk zullen we een groot aantal casestudies bekijken, die allemaal een geschiedkundig of filosofisch karakter gemeen hebben. Zo behandelen we analytische meetkunde van Descartes, die voor het eerst de algebra en de geometrie expliciet verenigde. We zullen lezen dat een directe vertaling van de geometrie naar de algebra grootse gevolgen heeft gehad voor de reikwijdte van wetenschap. Descartes liet met simpele algebra alle problemen van de Grieken achter zich en kon hiermee veel complexere situaties beschrijven. In het hoofdstuk over Newton zullen we de inhoud van de Principia bespreken, maar ook ingaan op de discussie over de absolute ruimte. In het stuk over Maxwell zullen we ons focussen op zijn ether model. Sommige wetenschappers geloofden dat het noodzakelijk was om een mechanisch model van de ether te construeren om deze echt te kunnen begrijpen. Het lukte Maxwell om zo’n model te construeren, maar uiteindelijk verwierp hij dit werkende model toch. We zullen lezen waarom. In het hoofdstuk over Hertz zullen we een theorie bestuderen met een filosofisch karakter. Hertz deed een onderzoek naar de aannames van de mechanica en zag dat het mogelijk was om een mechanica te creëren door slechts gebruik te maken van ruimte, tijd en massa. We zullen ook kort kijken naar de opvattingen van de belangrijke 4 wetenschapsfilosoof Pierre Duhem, waarover we het hiervoor al even hebben gehad. Zowel Einstein en Bohr filosofeerden vaak over hun wetenschappelijke vindingen. We gaan het hebben over hun discussie over fotonen en andere quantum-fenomenen. Maar we zullen beginnen met een uitgebreide inleiding in de wetenschapsfilosofie zelf. 5 EEN OVERZICHT: WETENSCHAPSFILOSOFIE Hier volgt een overzicht van de belangrijkste thema’s uit de wetenschapsfilosofie. DEMARCATIE Hoewel de fysica in de 17de eeuw afstand begon te nemen van de filosofie (en dit in de 19de eeuw bevestigde door de naam ‘natural philosopher ‘ te veranderde in ‘scientist’), bestaan er vandaag de dag nog grote controversies over de natuur en de karakteristieken van de wetenschap. Wetenschap wordt veelal gezien als een ‘speciale’ manier om kennis te verwerven, maar is het mogelijk te definiëren wat dit verschil maakt? Een belangrijk probleem in de filosofie van de wetenschap (Philosophy of Science) is dan ook het probleem van de demarcatie: het zoeken naar een methode waarop men op een logische wijze een wetenschap van een pseudowetenschap kan onderscheidden. Een pseudowetenschap is een wetenschap, die niet deze ‘speciale’ status heeft [a, H2]. Het probleem van de demarcatie werd op originele wijze aangepakt door Karl Popper (1902 – 1994). Popper stelde dat het de openheid tegenover kritiek was, die cruciaal was voor een echte wetenschap. Het ging Popper er niet zozeer om dat een wetenschap consistent is, want ook pseudowetenschappen zijn vaak consistent. De theorie van Freud bijvoorbeeld of de astrologie waren immers in staat om alle mogelijke fenomenen in termen van hun theorie te verklaren. Astrologen zagen continu fenomenen die in overeenstemming waren met hun theorie! Zelfs fenomenen, die in eerste instantie in strijd waren met de theorie, konden uitgelegd worden in het voordeel van de pseudowetenschap, mits de pseudowetenschappers slim genoeg waren. Popper dacht dat het een kenmerk van een pseudowetenschap was, dat ze niet te falsifiëren waren en bijna door alles bevestigd werden. Een goede theorie was niet perse goed in overeenstemming te brengen met de data, maar eerder informatief, verrassend en op een bepaalde manier onverwacht. De relativiteitstheorie van Einstein werd voor Popper hét voorbeeld van zo’n soort theorie. De theorie maakte verrassende onverwachte voorspellingen, die makkelijk gefalsifieerd konden worden. Voor veel mensen was de fit tussen de theorie van Einstein en de observaties belangrijk, maar voor Popper niet. De theorie van Einstein was op een aantal momenten aan een experimentele tests onderhevig, waarbij het mogelijk gefalsifieerd kon worden. Het doorstond deze testen en werd daardoor geloofwaardiger. Voor Popper was dus de mogelijkheid tot falsifiëren belangrijk, maar hoewel een goede theorie falsifieerbaar is, is het omgekeerde niet altijd waar. Een zin als ‘morgen landen er aliens in mijn tuin’ is ook falsifieerbaar, maar niet meteen wetenschappelijk. Maar er kwam kritiek op de methode van Popper. Een zin als ‘zwarte gaten bestaan’ is niet falsifieerbaar, maar niet perse onwetenschappelijk. Ook kunnen sommige problemen met kans niet gefalsifieerd worden. Als ik 80 keer gooi met een dobbelsteen en telkens 6 gooi, wil dit immers nog niet zeggen dat mijn dobbelsteen oneerlijk is. Ook is het niet duidelijk of wetenschappers een theorie moeten laten vallen, als deze gefalsifieerd wordt. Stel dat een test van de theorie van Einstein negatief voor Einstein uitpakte, was het dan verstandig om de theorie te verwerpen? Waarschijnlijk was het dan beter om een aanpassing te maken aan de theorie. Veel critici wilden ook niet verwerpen, dat een groot verklarend vermogen 6 een gunstig teken voor een theorie is. Een valse voorspelling in de wetenschap leidt over het algemeen niet meteen tot het verwerpen van een theorie. Veel complexe wetenschappen tolereren zelfs een aantal valse voorspellingen, omdat dit opweegt tegen de grote voordelen van de theorie. In de praktijk bestaat veel wetenschappelijk werk juist uit het repareren van deze foute voorspellingen van de theorie. Een ander criterium voor de demarcatie zou een historische kunnen zijn. Bijvoorbeeld: ‘pseudowetenschappen maken niet veel vooruitgang’. Maar ook dit werkt niet omdat een theorie als astrologie ook sterk veranderde over de tijd. Ook evolueert een correcte theorie niet meer. Een andere moeilijkheid is dat een theorie, die in zijn tijd werd beschouwd als een wetenschap, later in een pseudowetenschap kan veranderen, zonder dat er iets aan de theorie zelf veranderd. Dit lijkt zeer onredelijk. Ook is een theorie zonder serieuze alternatieven niet te vergelijken met betrekking tot zijn progressie. Als we een theorie beoordelen op de aanwezigheid van mechanische verklaringen, dan stuiten we ook op problemen. De astrologie geeft geen verklaring voor de hypothese van de beïnvloeding van het leven op aarde door de sterren, maar de zwaartekrachttheorie van Newton vertelt ook niet hoe de zwaartekracht werkt! Ook kan het verschil niet liggen aan manier van redeneren. Sommige pseudowetenschappen gebruiken ook wiskunde, statistische analyse, causale verklaringen en de gebruikelijke componenten voor een degelijk wetenschappelijk experiment. We moeten ons ook realiseren dat de wetenschap ook vaak onnauwkeurige en onzekere redenatiemethoden gebruikt, als er geen betere voor de hand liggen. We merken dat telkens wanneer we een criterium verzinnen, sommige pseudowetenschappen binnen het criterium vallen en sommige wetenschappen erbuiten! We mogen hier natuurlijk niet uit concluderen dat het geheel onmogelijk is om een adequate demarcatie theorie te vinden, maar tot nu toe en na vele pogingen, lijkt men gefaald te hebben. WAT LEREN WE VAN EINSTEIN De theorie van Einstein wierp vragen op over hoe wij concepten moeten definiëren. Bridgman verzon een methode genaamd ‘operationalism’, waarbij een concept alleen beschreven mag worden in termen van de operatie, die uitgevoerd werd bij het meten of het detecteren ervan. [a, H4] Lengte bijvoorbeeld mocht niet meer geïdentificeerd worden met het opmeten van een stuk, maar slechts met de procedure van het gebruik van een liniaal. Het betekent dat onder conditie X, we een meetwaarde Y hebben afgelezen op de liniaal. Dit is alles dat we met lengte bedoelen. Wanneer we aan een liniaal de eigenschappen zouden toeschrijven van het opmeten van ruimte, dan zouden we fouten maken. Volgens Einstein geven bewegende linialen bijvoorbeeld een andere meetwaarde dan stilstaande linialen. Strikt genomen zouden we met deze theorie ook de ‘alchohol-thermometer temperatuur’ moeten onderscheiden van de ‘kwik-thermometer temperatuur’, omdat een verschil in procedure een verschil in betekenis inhoud. Het wordt helemaal gekkenwerk als we de ‘alchohol-thermometer temperatuur, vastgehouden door een laborant met een groen jasje’ gaan onderscheiden van ‘alchohol-thermometer temperatuur vastgehouden door een laborant met een rood jasje’[a, H4]. Om 7 dit te voorkomen stelt Bridgman dat niet alle operaties problematisch zijn. Maar dit lost zijn probleem niet op! Voor de aanvang van de relativiteitstheorie was men immers niet goed wijs als men het opmeten van lengte problematisch zouden noemen. De bedoeling van de theorie van Bridgman was om schijnbaar problematische identificaties te vermijden, maar als we juist deze operaties onproblematisch gaan noemen, dan schieten we met zijn methode weinig op. HET LOGISCH POSITIVISME Het ‘logisch positivisme’ is een invloedrijke stroming in de wetenschapsfilosofie, die ontstaan is in de 1920’s. De ‘logisch positivisten’ geloofden dat wiskundige logica een goede tool was voor het ontwikkelen van een nieuwe vorm van empirisme. Deze nieuwe vorm had als doel de wetenschap te scheiden van de metafysica, zodat de metafysica verbannen kon worden uit de wetenschap. Net als Mach maakte de ‘logisch positivisten’ gebruik van relaties en niet van de dingen op zichzelf. De belangrijkste taak van de logisch positivisten was het specificeren van de relatie tussen de wetenschappelijke theorie en de observatie. Samengevat geloofden ze dat: Elk ‘cognitief betekenisvol statement’ is analytisch of een claim over een ‘mogelijke observatie’ [a, H6] Laten we deze zin in stappen verklaren. Een ‘cognitief betekenisvol statement’ is een statement, dat waar of onwaar is. Een analytisch statement is een taalkundige relatie tussen ideeën en kent geen feitelijke inhoud (een synthetisch statement daarentegen heeft wel een feitelijke inhoud). Analytische statements zijn a priori kenbaar en noodzakelijk waar. Er is dus geen observatie nodig om de waarheid van deze statements te onderschrijven. Volgens de logisch positivisten waren logische en mathematische statements voorbeelden hiervan. Een bekend voorbeeld uit de filosofie is: ‘een vrijgezel is niet getrouwd’ of ‘elk gevolg heeft een oorzaak’. Ook dit laatste voorbeeld is geen metafysisch inzicht, het is gewoon de manier waarop we deze woorden gebruiken. Het zijn definities, die geen extra’s kennis toevoegen. Een logisch positivist gelooft dat er geen zekerheid bestaat in de ervaring, maar wel in dit soort taalkundig-logische waarheden. Als deze inhoudsloze waarheden de enige waarheden zijn, dan wil dit zeggen dat er geen synthetische a priori statements bestaan volgens de logisch positivisten. Nietzsche dacht dat ook deze logica mogelijk een vooroordeel was, hetgeen mijn eerste kritiek is op de logisch positivisten. Een traditionele ‘metafysische statement’ is te onderscheiden van een analytisch statement, doordat dit wel een feitelijke inhoud heeft. Ook zijn beide statements a priori. Een statement als ‘elk event heeft een oorzaak’ is een voorbeeld hiervan. Men kan dit niet falsifiëren. Het verschilt met ‘oorzaakgevolg’, is dat een oorzaak per definitie een gevolg heeft. De logisch positivisten accepteren daarom geen metafysische statements. Nu nog over de ‘mogelijke observatie’. Wanneer een statement met inhoud goedgekeurd wordt door de logisch positivisten, betekent dit dat de inhoud ervan mogelijk te testen is met behulp van een experiment. Een statement is betekenisvol als er een juiste manier is om de waar- of onwaarheid van het statement te testen. Maar hier zit ook het probleem. Hoe kunnen wij bijvoorbeeld aantonen, dat het statement ‘al het koper geleidt elektriciteit’ waar of onwaar is. Ook al vindt men duizenden stukjes geleidend koper, hieruit kan men niet concluderen dat het volgende stukje ook geleidt. Dit is weer het probleem van de inductie. Ook het toepassen van de falsifieerbaarheid werkt niet altijd. ‘Al het koper geleidt elektriciteit’ kan gefalsifieerd worden door één stuk niet-geleidend koper te vinden, 8 maar hoe kan men bijvoorbeeld falsifiëren dat ‘elk metaal in ieder geval door een zuur opgelost kan worden’. Ook is het ingewikkeld om statements te gebruiken over niet-observeerbare objecten. Hoe kan men bijvoorbeeld zeker weten dat een streep in een detector een elektron is? Het is dus nodig om de criteria iets te verzwakken. Ayer bedacht dat een statement misschien al betekenisvol moet worden verklaard, als we het statement kunnen gebruiken om nieuwe observatie statements af te leiden, die we zonder dit statement niet hadden kunnen afleiden. Maar ook dit is zeer problematisch, omdat het een statement als ‘alles verloopt volgens het plan van God’ niet uitsluit. Het sluit andere goede voorbeelden juist wel uit. De overgang van de fysica van Newton naar de mechanica van de energie bracht geen nieuwe observatie statements, maar kan toch niet betekenisloos worden genoemd. Verder over de logisch positivisten. De speciale status van de wetenschap zit hem volgens de logisch positivisten in de manier waarop statements met elkaar samenhangen. De logisch positivisten waren ervan bewust dat wetenschappers hun theorieën natuurlijk niet op deze manier benaderden, maar dat hinderde niet. De zoektocht van de logisch positivisten was immers geheel theoretisch. Ze noemde het de ‘rational reconstruction’ van een wetenschap. Ze wilden slechts laten zien dat het mogelijk was om een wetenschappelijke theorie uit te drukken in een relatie van statements, hetgeen de theoretische vraag van de speciale status van wetenschap wellicht kon beantwoorden. Al snel bleek dat alleen de observatie en logica statements niet genoeg waren voor een wetenschappelijke theorie. Er waren ook theoretische termen nodig. Als we de statement ‘al het koper geleidt elektriciteit’ beschouwen, dan moeten we ook weten wat koper is en wat elektriciteit is. Omdat deze termen niet behoren tot de observatietermen, ontstaat er een afstand tussen de theorie en de observatie. De logisch positivisten wilden zo dicht mogelijk bij observatie blijven, maar in een wetenschap moet men de observatie ook deels verlaten voor de theoretische input. Het gevaar was, dat de theoretische termen de metafysica weer binnen de wetenschap brachten. Tijd voor een voorbeeld: een term als ‘breekbaar’ is niet direct uit observatie data af te lezen. We moeten dus iets voorbij de data gaan om het te kunnen gebruiken. De logisch positivisten handelden als volgt op zo’n probleem. Ze definieerde het als: ‘alles dat geslagen word (met een standaard slag) is breekbaar in de gevallen waarin het breekt’. Op deze manier kunnen ze een theoretisch statement heel dicht bij de observatie statement brengen. We moeten nog weer verder van de observatie afzitten, als we bijvoorbeeld ‘breekbaarheid’ weer gaan verklaren aan de hand van molecuul structuren. We moeten dus een manier vinden waarin we op een logische manier deze termen kunnen linken, gefundeerd in de observatie statements. De ‘betekenis’ (meaning) komt binnen via de observatie statements en wordt via de logische relaties tussen de theoretische statements ‘verspreid’. Aan een statement over onobserveerbare realiteit wordt, door de logisch positivisten, niet al te veel waarde gehecht, vanwege de mogelijke insluip van de metafysica. Het ging de logisch positivisten vooral om het beschrijven van de observatie en niet zozeer om de volledige realiteit van de wereld te kennen. Het doel van statements was niet om iets te zeggen over dingen die we niet kunnen observeren, maar om statements te maken over de patronen in onze observatie. Om het samen te vatten: Een theorie bestaat uit een serie statements, die gefundeerd zijn in observatie statements, die met theoretische en logische statements aan elkaar worden gelinkt. 9 Theoretische statements kunnen weer de basis zijn voor een hogere laag theoretische statements, maar men moet oppassen niet tot de metafysica verleid te worden. Uitspraken krijgen dus betekenis toegekend in dit systeem, als ze kunnen worden teruggekoppeld tot verifieerbare statements. Een uitspraak krijgt dus betekenis als er een methode tot verifiëren bestaat. Deze analyse van een theorie heet een ‘rationele reconstructie’. De wetenschapsfilosoof Hacking vertelt ons dat een groot verschil tussen de logisch positivisten en Popper te vinden is in het volgende. De logisch positivisme zijn op zoek naar verificatie en dat is een proces dat van beneden naar boven werkt. Er worden experimenten gemaakt en daarna wordt gekeken hoe deze een meer algemeen statement kunnen bevestigen of verifiëren. Popper’s falsificatie werkt van boven naar beneden. Eerst bedenkt men een theorie, men zoekt naar een voorspelling die deze theorie doet en dan test men of deze voorspelling overeenkomt met de werkelijkheid. Er zijn echter ook overeenkomsten, zoals het scherpe onderscheid tussen de observatie en de theorie dat door beide wordt gemaakt en het verschil tussen de ‘context of justification’ en de ‘context of discovery’. Ook zijn beide benaderingen ‘tijdloos’, ze zijn onafhankelijk van de geschiedenis. HOLISME Er is nog een probleem met een statement als ‘al het koper geleidt elektriciteit’. Wanneer wij de geleiding van een stuk koper meten, moeten wij o.a. eerst weten of het object in kwestie echt van koper is gemaakt en dat onze voltmeter werkelijk stroom kan meten. Dit zijn hypothesen, die we naast de te bewijzen hypothese aan moeten nemen; ze worden ‘auxiliary hypothese’ genoemd. Heel strikt genomen is de onafhankelijkheid van de groene of de rode kleur van het jasje van de laborant, ook een ‘auxiliary hypothese’, maar zo ver willen we natuurlijk niet gaan. Wanneer onze theorie een foute voorspelling maakt (en er dus in ieder geval één statement niet klopt), kan de logica over het algemeen niet gebruikt worden om de fout te achterhalen, omdat er een oneindig scala aan ‘auxiliary hypothese’ verantwoordelijk kan zijn. Popper stelde dat noch de logica, noch de observatie ons in staat kan stellen om een theorie te falsifiëren. Wanneer een theorie niet werkt kan je de schuld altijd schuiven op een ‘auxiliary hypothese’ en Popper vond dit goed, mits deze ‘auxiliary hypothese’ zelf ook onafhankelijk te testen waren. Maar het probleem is dat ook de ‘auxiliary hypothese’ niet onafhankelijk te testen zijn, omdat ook deze weer afhankelijk zijn van andere ‘auxiliary hypothese’. Een bekend voorbeeld: Copernicus kon verklaren dat er geen parallax werd gemeten in de sterren, door een niet-te-testen ‘auxiliary hypothese’ aan te nemen. Hij stelde dat de sterren zo ver weg stonden, dat deze parallax niet gemeten kon worden. Of een gekker voorbeeld: Toen A dacht dat hij kon vliegen begon hij een experiment om dit aan te tonen. Hij sprong van een dak en viel direct op de grond. Persoon B herinnerde hem dat hij dus niet kon vliegen, maar A liet de hoge luchtvochtigheid de klap van zijn theorie opvangen. ‘Door de vochtigheid is het moeilijker om met mijn armen te wapperen, het is dus nog steeds mogelijk dat ik kan vliegen’. Popper geloofde dat we een dergelijk excuus alleen mochten gebruiken, als we correlatie tussen luchtwrijving en het wapperen ook werkelijk konden aantonen. Omdat veel mensen het eerste 10 voorbeeld wel tot de wetenschap willen rekenen (misschien vooral omdat het uiteindelijk bleek te kloppen), stuiten we hier op een minpunt van de methode van Popper, omdat hij deze niet-te-testen auxiliary hypothesis’ niet accepteerde. In 1951 schreef Quine (1908 - 2000) een belangrijk filosofisch artikel waarin hij stelde dat statements geen betekenis hebben in isolatie en dat alleen een groep statements (een theorie) betekenis kan hebben. Hij noemde dit ‘holism’ vanwege de noodzaak van een groep statements in plaats van slechts één. Hij kwam tot de conclusie (anders dan de logisch positivisten), dat er geen fundamenteel verschil was tussen analytische en synthetische statements. Eerder leek het verschil tussen ‘alle vrijgezellen zijn niet getrouwd’ (analytisch) en ‘de gemiddelde Amerikaanse vrijgezel weegt 80 kilo’ (synthetisch) onbetwist, maar Quine dacht dat het verschil tussen een analytische en synthetische statements geen filosofisch of wetenschappelijk werk deed. Alle statements zijn voor Quine onzeker en nooit a priori kenbaar. [a, H8] Een voorbeeld: koper heeft een uniek atoom nummer dus zou gedefinieerd kunnen worden aan de hand van dit atoomnummer: ‘koper is die materie met atoom nr. X’. Dit is dus een analytisch statement. Maar voordat men afwist van het atoomnummer van koper, had men een andere definitie om het te beschrijven (wellicht met behulp van de dichtheid of bepaalde chemische eigenschappen). Toen men op een dag het atoom nr. van koper vond, vond men: ‘Koper blijkt atoom nr. X te hebben’. Hoewel dit statement amper verschilt van de vorige, is dit wel een synthetisch statement. De scheidlijn tussen de twee statements lijkt daarom te vervagen. Nog een ander voorbeeld. Stel dat we beginnen met twee analytische statements: ‘een object is koper als het smelt bij X graden’ en ‘een object is koper als het een dichtheid Y heeft’. De twee statements samen zijn al genoeg om een synthetisch statement te maken: ‘Je vindt niks met dichtheid Y dat niet smelt bij X graden’. Dit statement heeft empirische consequenties, terwijl we dachten simpelweg over een inhoudsloos en taalkundig-logisch probleem te praten. In de tijd van Aristoteles was water per definitie een element, maar toen men vond dat water uit meerdere soorten atomen bestond veranderde dit. En nu extreem een voorbeeld. Als je vrijgezel definieert als ‘niet voorkomend in een bepaalde lijst in het gemeentehuis’ (wat een prima definitie kan zijn) zal het je als een nieuw feit kunnen voorkomen, dat deze mensen ook nog eens gemeen hebben dat ze niet getrouwd zijn! In de 19de eeuw had Nietzsche al gewaarschuwd dat veel van onze a priori logica eigenlijk vooroordelen konden zijn. In het werk van Quine zien we dit dus nog specifieker terug. Ook Quine dacht (net als Duhem) dat een theorie altijd ‘underdetermined by data’ is. Observatie kan iemand nooit logischerwijs dwingen tot het maken van bepaalde veranderingen in een theorie. Elk statement kan standhouden, welke observatie er ook voor handen is. Men kan bijvoorbeeld de Euclidische ruimte en tijd redden in de relativiteitstheorie, door aan te nemen dat er extra ondetecteerbare krachten werken, die linialen doen krimpen en klokken langzamer doen lopen. Quine gebruikte een metafoor om dit te illustreren. Hij noemde het zijn ‘web of belief’. Op vaste punten, aan de rand van dit web, bevond zich de data en in het web, dat deze datapunten verbond, 11 bevond zich de theorie. Hoewel de datapunten vast staan, bestaan er vele manieren om een web aan te leggen tussen deze datapunten. Er kunnen dus veel theorieën bedacht worden, die allemaal dezelfde data kunnen verklaren. Het is dus mogelijk om elk statement te redden van de ondergang als je maar bereid bent om genoeg andere statements aan te passen. In de praktijk, zegt Quine, zijn de veranderingen in het web vaak gebaseerd op de simpelheid van het web en op conservatisme (het behouden van zoveel mogelijk van het oude web). Het is daarom moeilijk om de theorie rechtstreeks aan de ‘realiteit’ te koppelen. Wederom zien we, zoals in Duhem en Maxwell, dat de wetenschap de filosofie niet kan afzweren. Metafysica en wetenschap zijn nooit keurig te scheiden, zelfs niet in simpele theorieën! We hebben al gezien dat John Herschel het onderscheid maakte tussen de ‘discovery’ en de ‘justification’ van een theorie. Een goede wetenschappelijke methode, zo werd gedacht, moet er voor zorgen dat we nieuwe informatie vinden en dat we deze informatie kunnen rechtvaardigen. Ook Popper en de logisch positivisten geloofden dat er een belangrijk verschil tussen de ‘context of discovery’ en de ‘context of justification’ bestond. Ze dachten dat het niet mogelijk was om de ontdekking van een theorie in een methode te vangen. Het bedenken van goede hypotheses had te maken met geluk, genialiteit en hard werken, maar niet door het toepassen van een methode. Maar als de ontdekking eenmaal is gedaan, kan men een logische methode vinden om de nieuwe hypothese te testen, welke oorsprong de theorie ook had. Dit is het ‘justification’ gedeelte. Later zullen we zien, dat niet iedereen dit onderscheid tussen ‘discovery’ en ‘justification’ zo stellig maakte. INDUCTIE Een belangrijke vraag gaat over de ‘logic of confirmation’. Waar moet de relatie tussen een theoretisch en een observatie-statement aan voldoen, wil de laatste bewijslast zijn voor de eerste? De vraag is dus wanneer een statement ‘evidential support’ geeft en wanneer niet. Het belang voor een onderzoek naar deze vraag ligt voor de hand. De wetenschap gaat namelijk voor een groot gedeelte over het afwegen van verschillende bewijslast. Wanneer is een theorie bewezen? Wat is daar voor nodig? Hiervoor moeten we weer terug naar de inductie: In de breedste zin van het woord, valt elke gevolgtrekking die niet deductief is onder de inductie. In een minder brede zin zijn inducties ‘meer-van-hetzelfde’- gevolgtrekkingen.[a, H10] Omdat ik al 100 stukken geleidend koper heb gezien, geleidt het volgende stuk koper dus ook elektriciteit. Copernicus dacht niet: ‘alle geobserveerde planeten draaien om de zon, dus alle planeten draaien om de zon’ (meer-van-hetzelfde). Hij had immers nog nooit een planeet om de zon zien draaien. Hij bedacht een ‘betere’ manier om astronomische gegevens te verklaren. Dit soort redeneringen passen dus alleen in de brede definitie van inductie. Normaal gesproken bedoeld men met inductie echter de ‘meer-van-hetzelfde’- gevolgtrekkingen en dit zullen wij in wat volgt ook bedoelen. Hume dacht dat inductie niet te rechtvaardigen was. Hij vertelde dat hoe vaak hij de zon ook zag opkomen, hij geen bewijs had, dat de zon ook morgen zal opkomen. Hume dacht dat de onzekerheid in inductie ons er niet van moest weerhouden om inductie te gebruiken. Hij wilde gewoon dat we ons realiseren, dat de uitkomsten ervan onzeker zijn. Popper dacht dat heel de inductie niet nodig 12 was in de wetenschap, omdat hij niet naar confirmatie zocht, maar juist naar falsificatie. Popper dacht dat men met alleen observatie en deductie kon falsifiëren. Wanneer men een zwarte zwaan vindt, wordt het statement ‘alle zwanen zijn wit’ gefalsifieerd. Quine zou zeggen dat dit niet mogelijk is, omdat je de theorie altijd kan aanpassen zodat dit statement geldig blijft, maar Popper dacht dat sommige aanpassingen aan een theorie niet wetenschappelijk waren en zo de falsificatie mogelijk maakte. Het meeste dat we volgens Popper kunnen zeggen over een theorie, is dat het een aantal pogingen tot falsificatie heeft doorstaan. Om dit proces te onderscheiden van confirmatie, gaf Popper het de naam ‘corroboration’. Corroboratie is niet in staat om het succes van een theorie te garanderen, maar geeft wel een voorkeur aan de theorie, die vaak een poging tot falsifiëren heeft doorstaan. Een wetenschappelijke theorie probeert de waarheid te beschrijven, maar we kunnen nooit zeker weten of we deze waarheid bereikt hebben of niet. PROPERTIES De ‘wet van de grote nummers’ is een wiskundige theorie, waarin gesteld wordt dat hoe groter het aantal metingen is, des te zekerder we kunnen zijn van de waarheid van ons statement. Als we maar een groot genoeg sample hebben, dan werkt de inductie. Maar hoe weten we dat ons sample random is? Misschien geleidt koper alleen in de omgeving van de aarde of in aardse omstandigheden? Of misschien geleidt koper pas sinds een paar eeuwen? Maar het gebruik van inductie is heel nuttig voor zowel het dagelijks leven als de wetenschap, dus het moet in ieder geval iets goed doen. Stel dat we ons sample van koper zo groot maken dat we al het koper in elke omstandigheid in ons sample hebben zitten. Uit dit sample kunnen we deductief het antwoord op de stelling ‘al het koper geleidt elektriciteit’ vinden. Het is dus waar is dat men met een groot genoeg sample, de inductie uiteindelijk naar het juiste antwoord kan laten convergeren. Met een relatief ‘klein’ sample zijn we echter toegewezen op de zogenaamde ‘background beliefs’, maar als het sample maar groot genoeg is, zullen deze geleidelijk verdwijnen. Als we bijvoorbeeld uit een gigantische bak vol knikkers met drie kleuren, een rode knikker pakken, dan zou de inductie ons vertellen dat alle knikkers rood zijn. Maar dit zou een domme beslissing zijn. We zouden dan beter eerst kunnen aannemen dat een derde van de knikkers rood is, dit is een ‘background belief’. Pas als we een genoeg aantal knikkers hebben gepakt, kunnen we van de inductie gebruik maken. Met een grotere set, wordt de inductie steeds betrouwbaarder. Het probleem is natuurlijk: hoe weten we wanneer een dataset groot genoeg is en dus de werkelijkheid representeert? Misschien liggen de rode knikkers in de bak wel allemaal onderop en is dat de reden dat we minder rode knikkers vinden. Toch is ook de beslissing, om aan te nemen dat 33% van de knikkers rood is, gevaarlijk. Wanneer wij bijvoorbeeld ook zouden selecteren op donker- en lichtgroene knikkers, dan zou de inductie verwachten dat slechts 25% rood was, terwijl er wellicht niets is veranderd aan de knikkerbak. We hebben nu niet de knikkerbak, maar alleen de beschrijving veranderd. Toch komen we zo uit op een ander percentage! We moeten er ook rekening mee houden dat in sommige situaties niet inductie, maar counterinductie wordt verwacht. Stel dat een blik is gevuld met 100 rode en 20 gele knikkers. Er worden 40 knikkers random uitgepakt en allemaal zijn ze rood. In plaats van dat we in deze situatie 13 zouden denken dat de volgende knikker weer rood is (als bij inductie), wordt de kans juist groter dat het niet rood is! Hoe meer rode knikkers er uit het blik verwijderd zijn, hoe meer er een gele knikker verwacht wordt. GOODMAN Nelson Goodman (1906 - 1998) bedacht de ‘new riddle of induction’. Volgens Goodman is het probleem niet, dat het te moeilijk is om in een dataset een patroon te vinden, maar juist te gemakkelijk. Professor Kasser beschreef een bekend voorbeeld van Goodman als volgt: Call an object “grue” if it is first observed before January 1 3000 and is green or if it is first observed after that time and is blue. [If] All emeralds ever observed have been grue; [by induction], then, we should expect emeralds first observed after January 1 3000 to be blue. [a, H11] Het gebruik van de term ‘grue’ is voor ons natuurlijk vreemd, maar dat is juist de bedoeling. Goodman heeft hier een gek concept bedacht, dat wel een logisch legitieme term is! Het is dus te gemakkelijk om logisch consistente concepten te vinden. Hoe weten wij eigenlijk zeker, dat ook wij geen logisch consistente, maar verkeerde termen gebruiken, om de dingen te beschrijven? Kasser vertelt: It seems weird to us, but green would seem weird to us if we were “grue speakers.” [a, H11] Een term als ‘brocosaxodil’ (voor alles dat of broccoli of een saxofoon of een krokodil is) is duidelijk een belachelijke property. We kunnen beargumenteren dat deze objecten niet genoeg overeenkomsten hebben om gegroepeerd te worden, maar wie zijn wij om te bepalen wat ‘natures preferred language’ is? Eerst maakte de natuurkunde onderscheid tussen ruimte en tijd, maar nu blijkt er alleen zoiets te bestaan als ruimte-tijd. Het is dus niet duidelijk wanneer een distinctie in de taal zit en wanneer in de externe wereld. Een term als ‘roofdier’ is ook een ruime collectie van heel verschillende dieren. Bestaat dit onderscheid echt in de natuur of is dit slechts een handige manier van spreken? Een zelfde probleem deed zich voor in de pre-Darwinistische biologie. Men vroeg zich af: hoe moeten we deze dieren categoriseren? Is er een natuurlijke manier om de dieren te categoriseren of zijn er slechts kunstmatige manieren? Neem als voorbeeld het ‘curve fitting problem’[a, H11]. Dit is het probleem dat er in principe een oneindige hoeveelheid manieren zijn om een curve door een eindige hoeveelheid data te fitten. ‘Grue’ zou een voorbeeld kunnen zijn van zo’n alternatieve curve. Ook deze curve snijdt alle data punten! De vraag komt dan op: waarom zou de natuur voor de simpele curve gaan en niet voor de meer ingewikkelde? Dit voorbeeld laat zien dat er grote problemen zijn met inductie. Net als in Quine is onze taalkeuze ononderscheidbaar van de feiten. De taalkeuze heeft in dit voorbeeld immers invloed op de inductie! Hume dacht dat we geen echte connecties in de natuur konden vinden. Goodman liet zien dat deze connecties in zo’n overvloed vindbaar waren, dat velen zelfs waardeloos zijn! Bij Goodman moeten we juist uitvinden welke connecties of patronen belangrijk zijn en welke niet. Omdat het zo gemakkelijk is om verschillende properties te bedenken, moeten we misschien een methode bedenken om ‘echte properties’ te onderscheid van ‘niet echte properties’. Zijn er 14 properties, die echt in de natuur voorkomen en properties die dit niet doen? Deze vraag is nog onopgelost in de filosofie. BEWIJSLAST De logisch positivisten zochten een logische relatie tussen observatie statements en een hypothese, zodat de observatie als bewijslast kon dienen voor de hypothese. Een simpele poging om dit probleem aan te pakken, wordt beschreven door het ‘instantial model’. Dit model veronderstelt dat als men een A vind met eigenschap B, dat dit een bewijslast is voor ‘alle A’s zijn B’. Carl Hempel stelde de ‘paradox of the ravens’[a, H12] op om aan te tonen dat dit model niet werkt. De stelling ‘Alle raven zijn zwart’ is logisch equivalent aan ‘alle niet-zwarte dingen zijn niet-raven’. Dit betekent dat alle niet-zwarte dingen, die geen raaf zijn, ook bewijs zijn voor ‘alle raven zijn zwart’. Een groene pinguïn geldt dus als bewijslast voor ‘alle raven zijn zwart’! Het wordt pas echt vreemd als we ons realiseren, dat dit betekent dat een groene pinguïn ook bewijs levert voor ‘alle raven zijn geel’ of voor ‘elke mier is een olifant’. Hempel beschouwde het als een vooroordeel, dat ‘alle raven zijn zwart’ alleen maar over raven moet gaan. Als men immers alle niet-zwarte objecten zou bekijken en geen raven zou aantreffen, dan zou men weten dat alle raven zwart zijn! Ook is het idee geopperd, dat als een observatie als bewijs wil dienen, er de mogelijkheid tot falsifiëren moet zijn. Als wij eerst een zwart object bekijken en pas daarna kijken of het om een raaf gaat, dan is dit geen bewijs. Het wordt in deze volgorde immers onmogelijk gemaakt om raven van een andere kleur te vinden (en dus om te falsifiëren). Dit betekent wel, dat als men een geel object vindt en het geen raaf blijkt te zijn, dit wel als bewijslast geldt voor ‘alle raven zijn zwart’. Er bestond immers de mogelijkheid, dat het gele object een raaf was. Als men in tegenstelling een potlood vindt dat geel blijkt zijn, dan is dit weer geen bewijs. De volgorde waarin iets ontdekt wordt, heeft dus in het geval van de falsificatie, invloed op de bewijslast. Dit was de reden waarom Hempel dit idee van falsificatie niet kon accepteren. Een ander probleem van het ‘instantial model’[a, H12] is dat het alleen over confirmaties van de vorm ‘alle A’s zijn B’ gaat. Het zegt dus niets over een hypothese als ‘er bestaat op zijn minst één vliegend zoogdier’. Een meer populair alternatief op dit model is het ‘hypothetico-deductive’ model. Het zegt dat een hypothese geconfirmeerd is, als de consequenties of gevolgen ervan waar blijken te lijk. Zo kunnen we zeggen dat het golfkarakter van licht geconfirmeerd werd door ´het vinden van een lichte stip in het midden van de schaduw van een ronde schijf´, ook al kunnen we niet direct zien dat licht een golf is. Maar ook deze hypothese heeft zijn nadelen. Stel dat mijn hypothese is: ‘roken is slecht’. Zonder de logica te breken kan men de hypothese ook opschrijven als ‘Of roken is slecht, of het is een mooie dag vandaag of allebei tegelijk’. Stel dat het een mooie dag is, dan is dit een aanwijzing voor de tweede hypothese, omdat deze hypothese als consequentie een mooie dag verwachtte. Als het tweede statement wordt bevestigd, dan wordt ook direct het eerste statement bevestigd. Dit maakt een zonnige dag een aanwijzing voor ‘roken is slecht’. Wederom zien we dat wanneer we wat meer ruimte maken om goede voorbeelden toe te kunnen voegen, we tegelijkertijd ook een hele hoop gekke voorbeelden binnenhalen. 15 ‘Inference to the best explanation’[a, H12] is een derde mogelijkheid. Het stelt niet alleen dat de gevolgen waargenomen moeten zijn, maar ook moet de hypothese de data verklaren. De beste verklaring van de data confirmeert de hypothese. Wanneer een natuurkundige in een detector een lijn vindt en dit als bewijs voor de aanwezigheid van een elektron beschouwt, gebruikt hij de ‘inference to the best explanation’. Ook Copernicus deed dit in zijn theorie van het zonnestelsel. Het omvatte niet alleen de data, maar verklaarde het ook. De moeilijkheid is dat we niet weten welke theorie het best verklaart. Het begrip ‘beter’ is onduidelijk, want soms wordt een ‘mooie’ of ‘symmetrische’ theorie beter gevonden dan een waarschijnlijkere theorie en soms niet. Ook hoeft een theorie, die beter verklaart, nog niet de juiste theorie te zijn. Hoewel de bewegingsleer van Aristoteles meer verklaarde dan de theorie van Galileo, betekende dit niet, dat de theorie van Aristoteles beter was. KUHN De grootste klap voor het logisch positivisme kwam vanuit de geschiedenis van de wetenschap, voornamelijk van ene Thomas Kuhn (1922 – 1996). Kuhn dacht dat Popper en de logisch positivisten een theorie hadden opgesteld, die weinig te maken had met hoe wetenschap er in de praktijk aan toe gaat. Volgens Kuhn was het ontdekken van het speciaal van de wetenschap niet een zaak van het vinden van een onderliggende methode. Kuhn koos ervoor om de mechanismes te onderzoeken, waarmee men in de praktijk theorieën aannam en veranderde. Maar omdat Kuhn keek naar de praktijk, bestond het gevaar dat hij zowel goede als slechte wetenschap behandelde, terwijl Popper alleen belangstelling had voor ‘goede wetenschap’. Popper accepteerde dat veel van de conclusies van Kuhn overeenkwamen met hoe wetenschap in de praktijk werkt, maar dat dit voorbeelden waren van slechte wetenschap. Kuhn geloofde dat wetenschappers hun geschiedenis systematisch misrepresenteren. Ze beschrijven hun ontdekkingen in een progressieve logische lijn van wetenschappelijke triomfen. Kuhn beschouwde dit zelfs als een vorm van ‘brain washing’. De tekstboeken volgden volgens Kuhn een Popperiaans plaatje van de wetenschap, met helden, triomfen en onverwachte voorspellingen (bold conjectures). Wat de meeste wetenschappers echter het meest van de tijd doen, noemde Kuhn ‘normal science’ en dit was relatief dogmatisch en zeker niet zo dramatisch als de Popperiaanse voorbeelden. Kuhn geloofde dat de normale wetenschap gedomineerd werd door een paradigma (een consensus, een wereldbeeld). De bedoeling was om voorbeelden uit de tekstboeken te leren en soortgelijke redeneringen te gebruiken op nieuwe gevallen. Deze voorbeelden waren in ‘normal science’ van groter belang dan een wetenschappelijke methode. Ian Hacking schrijft het volgende over de ‘normal science’ [c, 7]: 16 Het paradigma geeft een consensus over hoe en aan wat er gewerkt moet worden. Normale wetenschap bestaat niet uit het testen van het paradigma zelf of het te proberen te falsifiëren, maar uit het oplossen van ‘puzzles’, die door het paradigma gedefinieerd zijn. Deze puzzels dienen opgelost te worden met de methoden, die door het paradigma zijn vastgesteld. Het meeste werk van de ‘normal science’ is heel gedetailleerd en een poging om het paradigma te fitten aan de observatie. Normale wetenschap houdt dus stand tegenover falsifiërende data en het is juist de hoofdtaak van de wetenschappers in de normale periode om deze data in overeenstemming te brengen met de theorie! Een ‘crisis’ ontstaat wanneer een paradigma zijn grip op de wetenschappers kwijt raakt. Dit gebeurd door het optreden van ‘anomalies’, puzzels die zich blijven verzetten tegen een oplossing. ‘Anomalies’ worden geregeld ontdekt in periodes van normale wetenschap, omdat men juist in deze periodes heel nauwkeurig en gedetailleerd werkt. In de periode van crisis kan het paradigma getest worden en wellicht naar de prullenbak worden verwezen. Men gaat zich nu afvragen hoe wetenschap gedaan moet worden en in plaats van de gebruikelijke ‘puzzle solving’, gaat men nu filosoferen. Als een nieuw paradigma de plaats van de eerste inneemt dan heeft er een wetenschappelijke revolutie plaatsgevonden. Hierna treedt ‘normal science’ weer in. Volgens Kuhn had Popper de periode van crisis verward met normale wetenschap. Hacking vertelt [c, 8]: Volgens Kuhn zijn zowel normale wetenschap als revoluties goede wetenschap. In een revolutie wordt vaak een nieuw onderzoeksveld geopend. Normale wetenschap is nodig om de theorieën uit te diepen en zorgt ook voor veel van het wetenschappelijke succes. Rationaliteit en Waarheid spelen amper een rol in Kuhn’s beschrijving van de wetenschap. Als een nieuw paradigma ontstaat, heeft het een aantal successen gekend, maar is het in vergelijking met het oude paradigma nog onderontwikkeld. Het is zelf vaak niet in staat om alle problemen op te lossen, die in het eerste paradigma wel opgelost konden worden. Het zijn vaak de jongere wetenschappers, die minder gebonden zijn aan het oude dogma, die de overstap maken naar een nieuw paradigma. In tijden van crisis spelen generatie verschillen, maar ook persoonlijkheden en persoonlijke voorkeuren een rol. Deze aspecten hebben minder invloed in normale wetenschap. Planck verwoordde dit als volgt: ‘a new scientific truth does not triumph by convincing its opponents and making them see the light, but rather because its opponents eventually die’ of ‘science changes, funeral by funeral’ [d]. Het is niet mogelijk om op een logische wijze tussen paradigma’s te kiezen. Kuhn noemt deze onmogelijkheid ‘incommensurabiliteit’. Wat in het ene paradigma als een bewijs of een feit doorgaat, 17 kan wellicht afgewezen worden in een ander paradigma. Kuhn geloofde dat elke nieuwe theorie in een zekere zin een nieuwe taal is. Ook is het onmogelijk om een theorieneutrale taal te vinden waarin we beide theorieën kunnen uitdrukken en vergelijken. De wetenschapsfilosoof Hacking schrijft[c, 68]: ‘We cannot say that successor T* does the same job better than T, because they do different jobs’. Elk paradigma kent andere regels en standaarden en evalueert zijn theorieën op een andere manier. Dit maakt de vergelijking tussen paradigma’s niet mogelijk. Dit maakt effectieve communicatie tussen paradigma’s problematisch. Verschillende paradigma’s kennen zelfs een verschillend wereldbeeld. Kuhn schreef: ‘theories can shape what we see’[a, H26]. Een paradigma definieert als het ware de realiteit. Traditioneel gezien zijn het de sociale factoren in de wetenschap, die bepalen welke vragen er op het toneel van de wetenschap verschijnen. De antwoorden hierop, staan echter los van deze sociale factoren. Dit onderscheid wordt in de theorie van Kuhn niet meer gemaakt. Het opkomen van een paradigma is immers een sociaal fenomeen en het paradigma vertelt ons behalve welke vragen we moeten stellen, ook op welke manieren deze opgelost moeten worden. Omdat het paradigma beslist wat een goede redenering is en de methodes voorstelt waarmee problemen moeten worden opgelost, is ‘discovery’ ook niet meer te geheel te scheiden van ‘justification’. Net als Quine gebruikt Kuhn een holistische versie van betekenis (meaning), waarin hij stelt dat de betekenis van een term (bijvoorbeeld massa) afhangt van het paradigma waar vanuit men deze term beschouwt. Newton en Einstein hadden bijvoorbeeld een heel ander begrip van wat massa betekende. Ook observatie is voor Kuhn ‘theory-laden’. Wat mensen in observatie zien hangt af van hun vooroordelen en verwachtingen. Voor Kuhn had de overstap van het ene naar het andere paradigma iets weg van een bekering of een ‘gestalt-switch’ (een afbeelding die je op meerdere manieren kan bekijken). Een volgeling van Copernicus ziet het opkomen van de zon als een bewijs voor de bewegende aarde, terwijl een volgeling van Aristoteles de opkomende zon ziet als een bewijs voor een stilstaande aarde. Net als een gestalt switch zijn er meerdere manieren om naar de wereld te kijken. Een ander voorbeeld is dat de oude chinezen het verschijnen van nieuwe sterren hadden opgetekend, terwijl men er in het westen blind voor leek te zijn. Kuhn geloofde dat dit kwam, doordat men in het westen had gedacht dat de hemel onveranderlijk was. In beide voorbeelden heeft een paradigma invloed op onze ‘observatie’. Er is volgens Kuhn geen logische progressieve voortgang in de wetenschap volgens Kuhn. Als voorbeeld gebruikt hij dat theorie van Einstein op een aantal belangrijke aspecten meer overeenkomt met Descartes dan met Newton! Hoewel Descartes geen occulte krachten wilde gebruiken maar een mechanisme wilde vinden, was dit niet wat Newton deed. Newton liet de verklaringen juist achterwegen. Na Einstein zijn we weer mechanieken aan het verzinnen om de zwaartekracht te verklaren, net als Descartes had geprobeerd. Toch schreef Kuhn ook vaak alsof wetenschap toch in de tijd verbetert, hetgeen niet gemakkelijk met zijn incommensurabiliteit te verenigen is. In ieder geval geloofde hij dat wetenschap niet ging over het ‘dichter tot de waarheid komen’, omdat waarheid een begrip is dat alleen betekenis heeft binnen een paradigma, maar onduidelijk wordt als het erbuiten wordt gebruikt. 18 We kunnen ons afvragen: is het effect van incommensurabiliteit echt zo extreem als Kuhn geloofd? Kon Newton niet effectief communiceren met Einstein over massa? Begrijpt een volgeling van Aristoteles niet heel goed wat er bedoeld wordt met ‘de aarde beweegt om de zon’? Zijn normale wetenschap en revolutie zo goed van elkaar te onderscheiden? Er zijn immers ook revoluties in de wetenschap geweest, zonder de aanwezigheid van een crisis en sommige revoluties lieten veel of alles van de oude theorie in tact! De theorie van het DNA was duidelijk een paradigma shift, maar zorgde niet voor een crises of een groot verzet . Dit geldt ook voor Hubble’s meting van het uitdijende heelal. De grootste kritiek op Kuhn is geuit over zijn geloof in de afhankelijkheid van theorie en observatie. In het voorbeeld van de opkomende zon ‘lijkt’ het nog steeds alsof de zon aan de hemel beweegt, stellen de critici. De observatie is strikt genomen hetzelfde voor Aristoteles en Copernicus, ook al kan de theorie verschillen. Interpretatie kan verschillen, maar niet onze zintuiglijke waarneming. In deze sterke zin kan observatie dus niet afhankelijk zijn van de theorie, stellen de critici. LAKATOS & FEYERABEND De keuze van een paradigma hangt volgens Kuhn af van de achtergrond, de psychologie en de vooroordelen van de wetenschappers en is dus vooral een sociaal fenomeen. De filosoof Imre Lakatos noemde Kuhn’s beschrijving daarom ‘mob psychology’[a, H14] (over het handelen van groepen mensen). De eerste grote theorie na Kuhn, over hoe wetenschap in zijn werk gaat, kwam van deze Lakatos. Lakatos was het met Kuhn eens dat een filosofie van de wetenschap gespiegeld moet worden aan de geschiedenis van de wetenschap, maar was het met Popper eens dat een rationele methode toch mogelijk was. Hacking schrijft over Lakatos[c, 14]: ‘He thought of himself as revising Popper in the face of Kuhn’. Hij wilde een nieuwe rationele theorie vinden, die ook rekening hield met de geschiedenis van de wetenschap. Popper had gezegd dat alle theorieën die inconsistent zijn met betrekking tot de observatie verworpen moeten worden. Lakatos dacht dat dit absurd was, zo schreef hij ‘all theories are born refuted’[c, 114]. Lakatos’ kritiek op Kuhn was dat hij de wetenschapsfilosofie geheel wilde reduceren tot wetenschapssociologie: ‘He thought that it left no place for the sacrosanct scientific values of truth, objectivity, rationality and reason’[c, 112]. Zijn theorie heet de ‘methodology of scientific research programs’[a, H16]. Een research program lijkt heel erg op wat Kuhn een paradigma noemde. Het had een harde kern van principes, die niet bekritiseerd mochten worden en daarom heen een ‘protective belt’ met theorie die wel veranderd mocht worden en diende om de kern van falsificatie te behoeden. Er doken constant anomalieën op, maar deze kunnen door de beschermende ring worden opgevangen. Lakatos dacht ook dat het mogelijk was, dat verschillende concurrerende research programma’s tegelijk konden bestaan en groeien. Lakatos onderscheidde een ‘progressive research program’ van een ‘stagnant or degenerating research program’. In een ‘progressive research program’ werd de ‘protective belt’ zo aangepast dat er nieuwe voorspellingen werden gegenereerd. De ‘stagnant or degenerating research program’ reageert slechts passief op de anomalieën en produceert geen nieuwe voorspellingen. Hij geloofde niet dat de stagnerende programma’s perse opgegeven moesten worden, want de mogelijkheid blijft bestaan dat deze programma’s uiteindelijk weer progressief worden. Op basis van dit verschil kozen 19 wetenschappers rationeel voor de theorie van Einstein boven die van Newton, omdat die van Einstein progressiever was. Paul Feyerabend daarentegen, denkt dat de enige mogelijke wetenschappelijke methode ‘anything goes’[a, H16] is. Feyerabend merkte op dat elke methode, die je bedenken kan, altijd wel goede wetenschap buitensluit en slechte wetenschap binnensluit. Feyerabend gebruikt vooral de aanpak van Galileo om zijn theorie te bekrachtigen. Zowel theorie als observatie stond Galileo tegen! Feyerabend beweerde dat Galileo propaganda en oneerlijke retoriek gebruikte om zijn wereldbeeld te verkondigen. De kerk was volgens Feyerabend veel rationeler dan Galileo zelf, maar dempte de verbeelding en de spirit. Hij geloofde dat de wetenschap van vandaag zich gedraagt als de kerk in de tijd van Galileo. Feyerabend verdedigde zelfs een kijk op de wetenschap, die de wetenschap elke speciale status ontnam! Hacking wat het standpunt van Feyerabend goed samen[c, 14]: Feyerabend geloofde ook in een zwakke versie van de incommensurabiliteit, hoewel voor Feyerabend de incommensurabiliteit een vrij zeldzaam fenomeen is. Hoewel hij toegeeft dat communicatie verstoord kan worden door het verschil in paradigma’s, kan met behulp van het schetsen van de context van een paradigma, een grote mate van begrip ontstaan. Het communicatie probleem, dat Kuhn wel aanhaalt, is dus voor Feyerabend geen probleem. Ook erkent hij dat twee paradigma’s, die incommensurabel zijn, heel veel overeenkomsten kunnen blijven hebben. De theorie van Newton en Einstein gebruikten allebei massa, ruimte, tijd, beweging en zwaartekracht. Deze begrippen zijn, in de twee verschillende paradigma’s, wel fundamenteel inconsistent. De relaties die men vindt zijn daarom niet van essentiële aard. Ik denk dat dit begrip van incommensurabiliteit heel dicht ligt bij het standpunt van de gemiddelde wetenschapper: Newton en Einstein zijn in hun fundamenten inconsistent, maar hebben desalniettemin nog een hoop overeenkomsten. Feyerabend, die vaak extreme standpunten had, is in dit geval dus zeer gematigd. VERKLARING De wetenschap als ‘verklarend’ is een moeilijk begrip voor de empirici. Hoewel veel mensen denken dat een wetenschap moet verklaren, hielden de empirici zich liever bij ‘wat er gebeurt’ en niet ‘hoe het gebeurt’. De ‘hoe’ vraag laat ons immers verder afdrijven van de observatie en kan tot metafysica leiden. Carl Hempel, die we eerder ook al zijn tegen gekomen, is de bedenker van de ‘covering-law model of explanation’ en probeert dit probleem aan te pakken. Hempel begon door te stellen dat we iets geheel begrijpen, als we door hebben waarom het verklaarde event ‘moest’ gebeuren. Hempel probeerde een verklaring te beschouwen als een logische relatie tussen statements, waardoor hij de 20 kritiek van Hume (dat een verklaring niet direct uit de data te vissen is) kon omzeilen. Er zijn voor Hempel twee dingen, die een verklaring nodig hebben: events en wetten. Om een wet te verklaren, kan men deze afleiden uit andere wetten, bijvoorbeeld op de manier waarop de wetten van Kepler af te leiden zijn uit die van Newton. Als we een event willen verklaren moeten we het afleiden uit de wetten en initiële condities. Zo kunnen chemische en natuurkundige wetten, met een aantal initiële condities (bijvoorbeeld een lucifer, zuurstof en een schurend oppervlak) verklaren waarom een lucifer gaat branden. Zolang de wetten testbaar zijn is de verklaring wetenschappelijk, volgens Hempel. We kunnen wel zeggen dat magnetisme verklaart waarom ijzer zich anders gedraagt dan hout, maar we mogen niet zeggen dat een ‘levenskracht’ verklaart waarom levende dingen zich anders gedragen dan de niet-levende dingen. Het verschil zit hem erin, dat de eerste onobserveerbare entiteit gebaseerd is op onafhankelijk testbare wetten over observeerbare entiteiten en de ander niet. Ook kan de ‘levenskracht’ geen voorspellingen maken en alleen ‘after the fact’ verklaren. De onafhankelijk testbare wetten brengen daarom de verklaring van een event heel dicht bij de voorspelling. Een goede verklaring brengt dus zeer waarschijnlijk een voorspelling. Ook maakt Hempel ruimte voor een partiële verklaring. In de biologie is het bijvoorbeeld mogelijk om het ontstaan van een soort te voorspellen in bepaalde omstandigheden. Maar een verklaring als deze is niet precies. Er kan bijvoorbeeld niet voorspelt worden dat er in een bepaalde situatie een wezel zal ontstaan, maar wel dat er bijvoorbeeld een klein roofdier zal ontstaan. Het model blijkt wel verklaringen toe te staan aan de hand van hun effecten of symptomen. Het is OK om het dalen van een barometer te verklaren, doordat er een storm aan komt, maar het gaat te ver om te stellen dat de storm eraan komt omdat de barometer daalt. Wij zien graag de storm als de oorzaak van de dalende barometer en niet andersom! Als we kunstmatig de barometer laten dalen, zorgen we er immers niet voor dat er een storm ontstaat! In het model van Hempel is het mogelijk om dit soort correlaties (tussen de storm en de barometer) beide kanten op te verklaren. Een ander voorbeeld is dat wij geloven, dat we de positie van een planeet in de toekomst kunnen voorspellen, met behulp van de tegenwoordige positie. We zullen niet zo gauw de tegenwoordige positie voorspellen aan de hand van de toekomstige positie! Ook laat de theorie irrelevante verklaringen toe. Beschouw bijvoorbeeld het volgende statement: Mr. X werd niet zwanger na het gebruik van een anticonceptiepil. In plaats van zich te richten op het feit dat Mr. X om te beginnen helemaal niet zwanger kan worden, richt het model van Hempel zich toch op de activiteit van de pillen. Dit is geheel overbodig, omdat zwangerschap sowieso niet mogelijk was! We willen in dit geval niet weten hoe de pil in het lichaam reageert! [a, H19] CAUSALITEIT De theorie werkt blijkbaar telkens beide kanten op, als er duidelijk spraken is van oorzaak en gevolg. Het ‘causal model of explanation’ probeert dit op te lossen. Causaliteit kan voor de asymmetrie zorgen, die nodig is in de theorie van Hempel. Maar empirici als Hume en Hempel hebben niet zo’n vertrouwen in het gebruik van causaliteit. Dit is dus niet een weg die Hempel zelf is ingeslagen. Deze theorie kan ook zorgen dat de overbodige verklaringen worden gefilterd, omdat deze ‘verklaringen’ ons wegleiden van de echte oorzaken. 21 Er bestaat echter een probleem. Als we het causal model eenmaal hebben geaccepteerd, hebben we heel het covering-law model niet meer nodig. Een event kan nu simpel weg verklaard worden door vast te stellen wat het veroorzaakt heeft. Het is ook problematisch dat het strikt mogelijk is om correcte oorzaken aan te wijzen, die onpraktisch zijn. Omdat alles is ontstaan uit de Big Bang, is het legitiem om als oorzaak voor een verkiezingsuitslag, de Big Bang aan te wijzen. Dit gaat natuurlijk weer veel te ver. Ook kan het causal model geen natuurwetten behandelen, omdat het problematisch is om te stellen dat de wetten van Newton, de wetten van Kepler ‘veroorzaken’. Ook kan het verklaringen van identificatie niet verklaren. Bij een statement als ‘de gemiddelde kinetische energie is de temperatuur van een systeem’, hebben we geen oorzaak of gevolg. Als wij over causaliteit nadenken als een soort fysische connectie, zoals veel mensen doen, heeft dit een aantal counterintuïtieve gevolgen. Het kan de afwezigheid van iets, niet als een oorzaak aanwijzen. Zo kan het ‘verdrinken’ niet als een doodsoorzaak aanwijzen, omdat het wordt verklaard door de afwezigheid van zuurstof. Er is nog een ander probleem: De dood van Socrates maakte zijn vrouw een weduwe, waar is hier de ‘fysische connectie’? Een ander mogelijkheid om de causaliteit te definiëren wordt gegeven door de ‘Regularity theories of causation’[a, H19]. Deze stellen dat een oorzaak een noodzakelijk onderdeel moet zijn van een set oorzaken, die tezamen genoeg zijn om het effect te veroorzaken. In het voorbeeld van de lucifer is de aanwezigheid van zuurstof een oorzaak, maar ook het wrijven van de lucifer langs een oppervlak. Maar ook hier hebben we het probleem dat dalende barometers stormen kunnen veroorzaken. Ook geldt dat als twee schutters tegelijkertijd een persoon neerschieten, beide schoten gelden als een noodzakelijke conditie, die genoeg is om het effect te veroorzaken. Dit lijkt redelijk. Een ander voorbeeld is echter problematisch: als Mr. X een dodelijk vergif inneemt en voor zijn dood door een bus wordt overreden worden zowel de bus als het gif als doodsoorzaak gerekend. Een andere mogelijkheid is de ‘Counterfactual approach’ van causaliteit, die causaliteit verklaart aan de hand van wat er gebeurd zou zijn, als dingen anders waren lopen. Bijvoorbeeld: omdat de lucifer niet aangegaan zou zijn, als er geen zuurstof was, is de zuurstof een oorzaak. In het geval van de twee schutters komen we hier tot de conclusie dat geen van beide de dood heeft veroorzaakt, omdat als we een van de twee schutters weghalen, het slachtoffer nog steeds gedood wordt. In het voorbeeld van het vergif en de bus is het weer het geval dat het model geen enkele doodsoorzaak aanwijst. Empirici spreken niet graag over dingen, die gebeurd zouden zijn, als de dingen anders waren verlopen. VERKLARING (VERVOLG) We hebben ook de ‘unificationist models of explanation’. In dit model wordt aangenomen dat we beter begrijpen als we het aantal onafhankelijk verklarende statements, waaruit we onze theorie kunnen afleiden, kunnen verlagen. Net als de covering-law model wordt er geprobeerd de logica het meeste werk te laten doen, maar ook deze methode kent soortgelijke problemen van oorzaak en gevolg. Bas van Fraassen (geboren 1941) denkt dat het helemaal niet mogelijk is om een correcte beschrijving te geven van ‘wetenschappelijke verklaringen’. Hij denkt dat een verklaring slechts een 22 antwoord op een ‘waarom’ vraag is en dat een juist antwoord afhangt van de context. Een correcte quantum mechanische verklaring over waarom een homp klei niet stuitert, is bijvoorbeeld geen goede verklaring als men spreekt tegen een klein kind. Professor Kasser geeft een ander voorbeeld: The bank robber Willy Sutton’s priest meant to ask him, “Why do you rob banks rather than have a job?” but Sutton took “Why do you rob banks?” to mean “Why do you rob banks rather than other places?” He replied: “Because that’s where the money is.” Sutton did not give a good explanation because he did not give a good answer to his interlocutor’s question. [a, H20] Van Fraassen gelooft zelfs dat verklaren geen onderdeel van de wetenschap is. We gebruiken wel wetenschap als we verklaren, maar we gebruiken ook wetenschap als we technologie maken. Dit wil nog niet zeggen dat technologie of verklaren bij wetenschap hoort. Van Fraassen denkt dit, omdat verklaren altijd metafysisch is. De ontologische claims (over wat echt bestaat en wat niet) voor theoretisch wetenschappelijke objecten dragen niets bij aan het beschrijvende of het voorspellende succes van een theorie en zijn dus leeg (vacuous). De kritiek op deze theorie was dat een ‘goede context’ een vaag begrip is. Ook was het opgeven van verklaringen natuurlijk niet voor iedereen aantrekkelijk. NATUURWETTEN Er bestaan ook een groot aantal theorien over wat natuurwetten zijn. De ‘Regularity accounts of laws of nature’ beschouwt deze wetten als statements over ‘what always happens’. Ze worden hier geïdentificeerd als patronen in de data en niet met ‘iets’ buiten deze data dat deze patronen veroorzaakt. Het is wel moeilijk voor dit model om onderscheid te maken tussen de ‘echte’ wetten en ‘accidental generalizations’. Een statement als ‘al hier bier in mijn koelkast komt uit Amerika’, voldoet aan de eisen van het model, maar is geen natuurwet. We kunnen niet zeggen dat dit soort statements niet gelden, omdat ze maar op een plek en tijdelijk geldig zijn, omdat we de mogelijkheid open willen houden dat sommige natuurwetten maar op één plaats werken (bijvoorbeeld in een zeldzaam zwart gat) of op een bepaalde tijd (bijvoorbeeld in het begin van het universum). Een ander probleem zijn de zogenaamde ‘Vacuous laws’. Dit zijn wetten over dingen, die niet gebeuren, zoals ‘alle deeltjes die sneller bewegen dan het licht zijn groen’. Een voor de hand liggende oplossing is het verbieden van deze wetten, maar Newton’s eerste wet (over hoe lichamen bewegen als er geen krachten op werken) gaat dan ook niet op. Nergens in het universum bevinden zich immers objecten waar geen krachten op werken! ‘Epistemic regularity models’ onderscheiden natuurwetten met behulp van de manier waarop we ze behandelen. Natuurwetten (als ‘koper geleidt elektriciteit’) krijgen door ons een speciale behandeling, in tegenstelling tot bijv. de Amerikaanse bier in de koelkast. We kunnen verklaren dat een object elektriciteit geleidt omdat het koper is, maar niet dat bier Amerikaans is, omdat het uit mijn koelkast komt. De ‘echte’ natuurwetten zijn ook niet zo snel te verwerpen met nieuwe informatie, zoals dit geldt voor de ‘accidental generalizations’. Ook zijn we van het bestaan van natuurwetten vrij snel overtuigd. Na het derde blok koper geloven wij vaak al dat koper elektriciteit geleidt, maar van het Amerikaanse bier in mijn koelkast raken we niet snel overtuigd, ook al komen er 60 Amerikaanse biertjes uit mijn koelkast. Het is duidelijk dat dit een hele praktische manier is om natuurwetten te beschrijven! We zijn volgens deze theorie als mensen blijkbaar in staat om natuurwetten van ‘accidental generalizations’ te onderscheiden. De moeilijkheid is dat deze theorie 23 niets vertelt over onontdekte wetten. Ook lijkt het menselijke aspect van deze theorie op een milde vorm van Cartesianisme, waarbij onze manier van denken voorschrijft hoe de werkelijkheid eruit ziet. De ‘systems theory’ stelt dat natuurwetten, diepe structurele patronen zijn in events. We identificeren dit patroon door de beste axioma’s te vinden, waaruit de patronen te deduceren zijn. Met ‘beste’ wordt in dit geval bedoeld: de meest informatieve en simpele axioma’s. Om dit te doen moeten we de volgende afweging maken: Een meest simpele theorie zou zijn: ‘alles gebeurd volgens de wil van Elvis’, maar dit is niet erg informatief. Als we elk event echter beschouwen als een apart statement, dan is dit heel informatief, maar zeker niet simpel. Deze twee begrippen werken dus tegen elkaar in en de afweging, die we moeten maken, is daarom vrij subjectief. In dit model worden de niet-voor-komende wetten wel toegelaten, hoewel ze wel moeten bijdragen aan de simpelheid en de informatie. Ook is het mogelijk om een wet te hebben, die alleen geldt in een bepaalde periode of plaats, maar wederom sluit de simpelheid en de informatie de gekke voorbeelden uit. Ook onontdekte wetten worden in dit systeem opgenomen. Om deze redenen is dit de meest geslaagde empirische theorie over de natuurwetten. De Necessitarians voelen zich niet gebonden door de empirische claims. Ze kunnen daarom ook aannemen dat natuurwetten krachten (powers) of neigingen (tendencies) zijn, die zelf niet direct te observeren zijn, maar wel de observeerbare fenomenen kunnen verklaren. Ze denken niet dat een wet een relatie is tussen verschillende objecten, maar dat het een relatie is tussen eigenschappen (properties). De eigenschap koper zorgt dat een materiaal elektriciteit geleidt. De wetten van de Necessitarians zijn niet slechts beschrijvingen van patronen, maar opererende krachten, die in de natuur werken. Ze stellen niet dat we geen niet-geleidend koper ‘zullen’ vinden, maar dat de wet een dergelijk event verbiedt! Ze stellen niet dat een dergelijk event niet voor komt, maar dat het absoluut niet kan gebeuren: ‘It is not just that won't find any non-conducting copper, you cannot find it’. De wetten van de Necessitarians beschrijven een fysische noodzakelijkheid. De theorie is ook bestand tegen ‘vacuous laws’. In ons voorbeeld (‘alle deeltjes, die sneller gaan dan het licht, zijn groen’) bestaat er geen noodzakelijke relatie tussen de eigenschap ‘snelheid’ en de eigenschap ‘groen’, waardoor het niet als een wet wordt erkend. Wetten, zoals de eerste wet van Newton, die strikt genomen nergens in het universum plaats vinden, kunnen wel toegestaan worden, omdat er een noodzakelijke relatie bestaat tussen de eigenschap ‘niet versnellen’ en de eigenschap ‘geen krachten ondervinden’. De ‘eigenschappen’ zijn duidelijk metafysische concepten. De wet van Newton gaat voorbij de data, omdat de wet in de data niet eens voor komt! Bier in de koelkast is echter niet noodzakelijk Amerikaans, want ik kan er ook een Duits biertje in zetten. Hoewel een Necessitarian gelooft dat wetten een noodzakelijkheid zijn en niet overtreden kunnen worden dacht Ayer juist dat niets in het heelal in staat is om verboden of verplichtingen op te leggen. Niets in het universum zegt tegen een elektron ‘nee, nee, niet sneller gaan dan het licht’. De wetten beschrijven niet wat moet of wat verboden wordt, maar simpelweg wat ‘gebeurd’ of wat objecten ‘doen’. Of zoals professor Kasser het zegt: you don’t see things ‘having’ to happen, you just see them happen’. Moet het behoud van energie opgevolgd worden of is dit gewoon wat deeltjes doen? De quantummechanica stelt dat deeltjes voor korte periodes het behoud van energie kunnen schenden. Dit lijkt er op te wijzen dat deeltjes tot anders in staat zijn. En ander voorbeeld is het principe van 24 Fermat, dat stelt dat licht altijd de snelste route door een materiaal kiest. Is dit een opgelegde wet van de kosmos of is het simpelweg een quantummechanisch effect, waarbij alle andere bewegingen wiskundig tegen elkaar wegvallen en dus niet mogelijk zijn. Maar wellicht verbiedt het universum wel om sneller te bewegen dan het licht, omdat we ons altijd binnen het kader van de ruimte en de tijd bevinden. Ook kunnen deze ideeën gebruikt worden voor de ‘verklaring’. Hoewel een patroon in de data (hetgeen de empirici gebruikten) geen verklaring is, zijn opererende wetten dat wel. De Necessitarians geloven zelfs dat er wetten kunnen bestaan, die opereren zonder dat de corresponderende eigenschappen aanwezig zijn. Stel dat we al het koper uit het universum zouden verwijderen, dan geldt toch: ‘al het koper geleidt elektriciteit’, alsof het dus echt een noodzaak van het universum zelf is. De empirici vragen zich natuurlijk af: Hoe kan je weten of iets een ‘noodzakelijke relatie’ is? Als twee werelden bijvoorbeeld verschillende natuurwetten zouden hebben, maar dezelfde feiten, dan zouden we niet in staat zijn deze wetten te kennen. Een goed voorbeeld is het verschil tussen twee universa, waarin alle wetten met observabele consequenties hetzelfde zijn, maar de andere wetten niet. Nancy Cartwright denkt als volgt over natuurwetten: of de wetten zijn fout, maar kunnen worden gebruikt in wetenschappelijke verklaringen of ze zijn juist maar nutteloos voor het verklaren. Ze merkt op dat onze meest fundamentele wetten niet beschrijven hoe objecten in werkelijkheid bewegen, maar altijd een benadering zijn. Als een wet goed is, stelt Cartwright, dan is de wet alleen te gebruiken in heel erg beperkte situaties, maar dit verpest de verklarende waarde van de wet. Cartwright denkt daarom dat de wetten niet beschrijven wat er in werkelijkheid gebeurd, maar slechts ‘powers’ of ‘tendencies’ zijn, die kunnen verklaren wat er gebeurd. Dit is dus grofweg het standpunt van de Necessitarians. Veel natuurkundigen denken dat de wetten ‘in principe’ wel precies werken en dat slechts onze benaderingen ervoor zorgen dat de wetten niet exact beschrijven. Omdat we nu eenmaal niet de zwaartekracht van elke atoom in het hele universum willen opmeten om te weten te komen hoe een steen valt, maken we benaderingen. REDUCTIE We spreken van de reductie van een theorie als de theorie een direct gevolg blijkt de zijn van een ‘fundamentelere’ theorie. We kunnen reductie toepassen op dingen (zoals water dat tot H2O gereduceerd kan worden) of op natuurwetten (zoals de wetten van Kepler die tot de wetten van Newton gereduceerd kunnen worden). In het geval van reductie wordt de oude theorie niet verworpen als onwaar, maar juist ondergebracht in een grotere theorie. Dit zorgt vaak voor een verhoging van de verklarende kracht van de theorie. De feiten en de wetten van de eerste theorie blijken nu verklaart te kunnen worden met diepere feiten en wetten! Een voorbeeld is de overstap van thermodynamica naar statistische mechanica. De vindingen van de thermodynamica bleven bestaan, maar begrippen als ‘temperatuur’ konden nu worden beschreven in termen van de beweging van moleculen. De klassieke positivistische versie van de reductie beschouwt het als een deductieve relatie, waarbij uit de nieuwe theorie de oude is af te leiden. 25 We kunnen twee soorten reductie onderscheiden: homogene en heterogene. De eerste gaat over reductie, waarbij de termen van de gereduceerde theorie blijven bestaan in de nieuwe theorie. Een klassiek voorbeeld is de ‘snelheid’ in de theorie van Kepler en Galileo en de snelheid in Newton. In al deze theorieën had ‘snelheid’ dezelfde betekenis. Heterogene reductie treedt op wanneer de termen veranderen. Warmte en temperatuur zijn fundamentele grootheden in de thermodynamica, maar werden vervangen door de beweging van moleculen in de statistische mechanica. Het gebruik van ‘bridge principles’ kan hierbij uitkomst bieden. Een ‘bridge principle’ kan de nieuwe termen in de oude termen uitdrukken. In dit geval: ‘temperatuur is de gemiddelde moleculaire kinetische energie’. De ‘bridge principles’ zijn niet simpelweg definities. Temperatuur ‘betekent’ niet hetzelfde als ‘gemiddelde moleculaire kinetische energie’. De bridge principles zijn empirische hypothesen, die objecten of processen van de oude en de nieuwe theorie identificeren. Uit de nieuwe theorie en de bridge principles tezamen kan de oude theorie weer gededuceerd worden. Het lijkt erop dat het een karakteristiek van de reductie is dat het over het algemeen verder afstand neemt van de observabele wereld. Het voorbeeld van temperatuur naar de beweging van moleculen illustreert dit, maar ook van moleculen naar atomen en uiteindelijk naar quarks is een goed voorbeeld. Noodzakelijk voor dit soort reductie is dat de oude en de nieuwe theorie logisch consistent zijn, maar zelfs in de minst problematische reducties, maakt de nieuwe theorie ook een correctie aan de oude theorie. Omdat Galileo in zijn theorie een constante valversnelling gebruikte, is dit niet logisch consistent met Newton die een variabele valversnelling gebruikte. Dus is de theorie van Galileo dan wel te reduceren tot die van Newton? De klassieke reactie hierop is dat Galileo’s theorie een benadering is van de theorie van Newton en dat uit de theorie van Newton, de wet van Galileo bij benadering volgt. Maar dan nog hebben we in principe niet gereduceerd. Als we dit wel als een reductie rekenen, dan moeten we ons afvragen in wat voor zin de reductie nog verschilt van het vervangen van de oude theorie door de nieuwe. Ook is het zo dat Newton niet simpelweg een benadering geeft van Galileo. In veel gevallen maakt het een heel groot verschil of je aanneemt dat de valsnelheid constant is of variabel! Dit geldt ook voor de ‘reductie’ van Newton naar Einstein. Uit de wetten van Einstein, zo zegt men, volgen bij benadering de wetten van Newton, maar wanneer de snelheden van objecten groot worden, wordt de wet van Einstein heel anders dan die van Newton. Kuhn en Feyerabend geloven dat de incommensurabiliteit tussen de twee theorieën het onmogelijk maakt om identificaties te maken tussen twee eigenschappen van twee theorieën. Het hele idee van massa, tijd en ruimte veranderd in Einstein. Dit alleen al maakt een één-op-één reductie onmogelijk. Misschien moeten we niet zo streng zijn als Kuhn, maar dan moeten we weer uitkijken, dat onze theorie niet toestaat dat demonische possessie opeens gereduceerd kan worden tot geestesziekten of Aristoteles tot Newton of de alchemie tot de chemie. In de natuurkunde wordt met een benadering van de oude theorie door een nieuwe theorie bedoeld, dat de oude theorie (plus bepaalde initiële condities) de nieuwe theorie reproduceert. Deze condities leggen de nieuwe theorie omstandigheden op, waarbij de oude theorie een benadering is. De wetten van Einstein kunnen bijvoorbeeld bij benadering worden herleid tot de wetten van Newton, mits de 26 snelheid van de objecten in kwestie, klein blijven ten opzichte van de lichtsnelheid. Newton en een initiële conditie (dat de zwaartekracht niet te veel mag veranderen over de afstand waarover een object valt) geeft bijvoorbeeld een keurige benadering van Galileo. Een extreme vorm van reductie is het ‘unity-of-science program’, waarin noodzakelijk wordt geacht dat alle wetenschappelijke theorieën uiteindelijk te reduceren zijn tot fundamentele natuurkunde. De natuur zorgt voor verassende dingen, zoals het menselijk brein of de vele verschillende eigenschappen van atomen en moleculen, maar uiteindelijk is alles terug te leiden tot fundamentele natuurkunde. Dit maakt de zogenaamde ‘functional properties’ problematisch. Een thermometer is bijvoorbeeld een object met een functionele eigenschap. Een object als een thermometer hoeft niet perse materiële overeenkomsten te hebben met andere thermometers. Een thermometer is in termen van materiaal op verschillende manieren te realiseren. Er lijken geen ‘noodzakelijke voorwaarden’ te bestaan, waaraan de materiële eigenschappen van een thermometer moeten voldoen. Het is ook een lastig probleem om bridge principles te gebruiken om gepraat over een thermometer uit te drukken in gepraat over materie. Een mogelijke reactie hierop is om niet één materiële eigenschap voor een thermometer te gebruiken, maar een hele lijst. Dus: kwik in een buisje wordt een thermometer, een bepaalde weerstand wordt een thermometer etc. In dit geval reduceert een lijst van materie-eigenschappen zich tot thermometers. Hetzelfde gaat op voor een begrip als geld, dat mogelijk uit te geven is in metalen, papieren en digitale vorm. Bridge properties, waarbij een hele lijst gegeven moet worden, zijn ook niet echt verklarend. Ze verklaren hoe elke individuele thermometer werkt, maar verklaren niets over de karakteristieken van een thermometer in het algemeen. Ook kan je nooit weten of de lijst met Bridge properties compleet is. We moeten dus niet zomaar aannemen dat een reductie alleen maar goeds brengt en dat we er nergens op achteruit gaan. We riskeren ook het verlies van een deel van de verklarende krachten van de oude theorie. Een bekend voorbeeld hiervan komt van Alan Garfinkel: Stel dat een bioloog een populatie konijnen bestudeert, die omgekeerd evenredig verandert ten opzichte van een vossenpopulatie. De verhoogde kans op de dood van een konijn kon hij verklaren door naar de hoge populatie vossen te wijzen. Een ‘fundamentelere’ theorie zou verklaren: een bepaald konijn gaat dood, omdat het een bepaalde vos op een bepaalde plaats en tijd tegen het lijf is gelopen. Maar dit zijn verschillende feiten! En soms is het precies het minder specifieke feit dat we willen verklaren. De eerste verklaring kan verklaren waarom een konijn waarschijnlijk ook dood was gegaan, als hij een heel andere route had genomen! Je wil soms niet weten welk konijn door welke vos is gedood, maar juist een minder gedetailleerd antwoord, bijvoorbeeld de kans dat ‘een’ konijn door ‘een’ vos wordt opgegeten. Garfinkel gelooft dat verklaringen hun eigen ‘level’ opzoeken en dat er niks incompleet is aan de verklaring op het ‘level’ van de bioloog. Weer komt de volgende vraag boven: wat kunnen we als een ‘real property’ beschouwen? De thermometer maakt vanuit het materiële oogpunt een ongeorganiseerde, ongeünificeerde indruk, bijna gelijk aan de 'brocosaxodillen’! Misschien dat dit soort begrippen alleen een ‘realiteit’ hebben 27 op de ‘level’ van de gereduceerde theorie. Ze hebben iets gemeen op het instrumentale level, maar niet op het materiële level. BETEKENIS We moeten betekenis onderscheiden van de referentie. ‘Einstein’ en ‘de ontdekker van de relativiteitstheorie’ refereren naar elkaar, maar hebben zeker niet dezelfde betekenis. Een ander voorbeeld is dat een ‘wezen met een hart’ refereert naar ‘een wezen met een nier’, maar toch bedoelen we met beide dingen iets anders. Kuhn dacht dat als genoeg statements in een theorie veranderen, dat dan ook de referentie verandert. Wederom het voorbeeld van de massa in Newton en Einstein: het begrip massa refereert naar iets heel anders in de verschillende theorieën. Einstein maakte niet een betere theorie over de massa van Newton, maar hij maakte een theorie over zijn eigen versie van het begrip massa. Voor Kuhn is de referentie niet problematisch. Phlogiston bijvoorbeeld refereert naar een oorzaak van verbranding en zuurstof ook. De meeste filosofen echter denken dat het natuurlijker is om te stellen dat phlogiston nooit heeft bestaan en dat het dus onmogelijk ergens naar heeft kunnen refereren. Maar ook hier zijn moeilijkheden. Omdat Franklin de elektriciteit verkeerd beschreef, zou hij nooit over elektriciteit gepraat kunnen hebben, omdat er niets in de wereld bestaat dat overeenkwam met zijn beschrijving! Wat we willen is een theorie, die deze voorbeelden wel toestaat. De theorie moet ons laten verwijzen naar iets ‘echts’, ook al geven wij een verkeerde beschrijving voor deze realiteit. Als we naar bepaalde dingen refereren, dan maken we volgens deze theorie gebruik van een stereotype van dit ding. Dit stereotype kan onjuist zijn en veranderen in de tijd, maar het object waar we naar verwijzen kan hetzelfde blijven[c, 81]: Dit kan worden gedaan door de referentie niet te laten afhangen van de beschrijving, maar van de ‘historical chain’ van een begrip. Als we het bijvoorbeeld hebben over ‘Buchanan, de 14de president van Amerika’ (terwijl hij de 15de is), refereren we nog steeds naar dezelfde persoon. De naam van Buchanan is niet afhankelijk van de beschrijving van zijn functie. Het gebruik van zijn naam wordt gelinkt aan de eerdere keren dat zijn naam gebruikt is, uiteindelijk tot aan het moment dat hij van zijn ouders zijn naam ontving. Hacking maakt duidelijk[c, 80]: 28 De ‘essentiële’ connectie tussen de naam van Buchanan en de persoon is zo sterk, dat het de vergissing over zijn presidentschap overleeft. Dit geldt ook voor biologische begrippen zoals de walvis. Iemand die naar een walvis wijst en zegt ‘kijk eens wat een grote vis (terwijl het geen vis is)’ refereert nog steeds naar een walvis. Dit maakt de incommensurabiliteit een stuk minder dreigend. Met deze methode kunnen mensen uit andere paradigma’s, nog steeds naar dezelfde fenomenen verwijzen! Ook kan men met deze theorie betekenisvol praten over de ongeobserveerde realiteit. Als we praten over de atoomstructuur van water gaat het nog steeds over hetzelfde water, waar ook Aristoteles naar refereerde. In dit voorbeeld refereren beide theorieën naar een bestaand fenomeen. Het model wordt alleen problematisch als een fenomeen, dat eerst werd gedacht te bestaan, uiteindelijk niet bestaat. Stel dat wij naar een detector kijken en een lijn laten refereren naar een elektron. Na verloop van tijd blijkt de lijn echter een defect van de detector te zijn. Waar hebben wij in dit geval naar verwezen? Ook maakt de theorie het gepraat over onobserveerbare realiteit soms te gemakkelijk. We willen bijvoorbeeld vermijden dat wanneer iemand phlogiston gebruikt, hij naar zuurstof refereert. We willen dat beide theorieën naar verbranding verwijzen, maar niet ook nog eens naar elkaar! In 1923 vond men dat het aantal zuren groter was dan gedacht. Deze extra zuren konden worden ingedeeld in twee natuurlijke groepen. Alle standaard zuren hoorden zowel bij de ene als bij de andere groep, maar de nieuwe zuren behoorde tot de een of tot de ander. Als Lavoisier sprak over zuren, welke van deze twee groepen bedoelde hij dan. Het antwoord is geen van beide. Men kan zeggen dat Lavoisier sprak over alles dat voor 1920 gezien werd als een zuur, maar dit lijkt niet echt een ‘natural kind’! We zouden ook de intersectie van de twee definities kunnen nemen, maar ook dit is zeker geen ‘natural kind’. Een ander tegenvoorbeeld is het begrip ‘caloric’. [c, 86] Omdat ‘caloric’ niet bestaat is de extensie van dit begrip een lege verzameling. Toch waren er destijds vele verschillende theorieën over ‘caloric’ en het lijkt erop dat deze theorieën over hetzelfde 29 fenomeen spraken. Maar dit ding bestond helemaal niet! Phlogiston bleek ook niet te bestaan en refereert dus ook naar ‘dezelfde’ lege verzameling, maar we kunnen hier toch niet uit concluderen dat beide theorieën naar dezelfde entiteit verwezen? [c, 87] Een ander probleem treedt op in de volgende situatie, die nu en dan in de wetenschap voor komt: [c, 87] REALISME De meeste filosofen hebben het zoeken naar een wetenschap, die niet naar een onobserveerbare realiteit refereert, opgegeven. ‘Scientific realism’ is een stroming, die gelooft dat wetenschap zowel observeerbare als onobserveerbare realiteit correct kan beschrijven. De ‘harde realisten’ geloven dat sommige ‘properties’ van onze theorieën echt in de externe wereld bestaan en andere niet. Goud bijvoorbeeld is een ‘real property’ van de natuur, terwijl jade dat niet is (jade is de gemeenschappelijke naam voor twee edelstenen: jadeïet en nefriet). De ene property komt echt ‘out there’ in de natuur voor en de ander niet. ‘Softe realisten’ geloven daarentegen dat de keuze van bepaalde ‘properties’ die we gebruiken, afhangt van onze interesses. De manier waarop wij categoriseren, is een manier die voor ons als mensen nuttig is. De manier waarop wij onderscheid maken, is niet perse de manier waarop ‘het universum’ onderscheid maakt (dit heet ook wel nominalisme). We beschrijven met onze theorieën wel de werkelijkheid, maar gebruiken daarbij termen, die overeenkomen met onze interesses. Net als in het concept jade, beschrijft dit iets over de wereld, maar wil dat niet zeggen dat de buitenwereld deze groepering van jade ook als essentieel kenmerkt. Een grote tegenstander van ‘scientific realism’ is natuurlijk de ‘underdetermination of theory by data’[a, H26]. Hoe kan men beweren dat een theorie echt iets vertelt over de werkelijkheid als er ook een andere theorie mogelijk is, die dezelfde data verklaart? Een andere is de ‘pessimistic induction’. Omdat we eerder goede theorieën hebben gehad, die uiteindelijk fout bleken te zijn, kunnen onze huidige theorieën ook fout zijn. De geschiedenis wijst uit dat de beste standaarden van wetenschap foute theorieën hebben toegelaten. Succes is dus geen garantie. Maar wat zegt succes dan wel? Hoe kan een theorie met succes voorspellen, als het niet tenminste een beetje ‘waar’ is? VAN FRAASSEN De ‘constructive empiricism’ van Van Fraassen geeft toe dat we in onze theorieën het bestaan van bijvoorbeeld elektronen moeten aannemen voor onze theorie, maar dat dit nog niet hoeft te betekenen dat wij als mensen dit ook moeten aannemen. Wij zijn niet in de positie om kennis te 30 verwerven over onobserveerbare realiteit. Op zijn best kunnen we geloven dat onze theorieën empirisch adequaat zijn, dat wil zeggen, correct zijn in alles wat ze te zeggen hebben over observeerbare realiteit. Van Fraassen staat het toe om inductie te gebruiken van observabele naar andere observabele fenomenen en te verklaren in termen van observabele entiteiten. Een realist kan hier tegenoverstellen, dat we wel technieken kunnen toepassen op de onobservabele realiteit, als deze geldig zijn voor de observabele realiteit. Maar dit is problematisch. Omdat de klassieke mechanica werkt voor de macroscopische wereld, betekent dit nog niet dat we het ook kunnen gebruiken voor het beschrijven van een elektron. Ook denkt een realist dat een instrument als een microscoop gewoon de reikwijdte van onze zintuigen verlengt, maar Van Fraassen stelt dat zulke instrumenten met theorie en gepraat over onobservabele realiteit doordrongen zijn. Ook kan een tegenstander zich afvragen waarom Van Fraassen niet naar onobserveerbere, maar wel naar observeerbare termen verwijst in een verklaring. Een verklaring met observeerbare termen gaat immers ook voorbij de data. NATURALISME Naturalisme is een stroming die het geheel heeft opgegeven om de wetenschap te rechtvaardigen met behulp van filosofie. Het geeft ook het idee van ‘a priori’ kennis op. In plaats van met een filosofisch oog, kijkt het op een wetenschappelijke manier naar de wetenschap. Quine verdedigde eerst een sterke vorm van het naturalisme. Als we willen weten hoe de wetenschap redeneert en hoe we kennis verwerven, dan moeten we geen filosofie doen, maar dan moeten we neurologie doen. Als we willen weten hoe wij redeneren, dan moeten we uitvinden hoe de hersenen werken, als ze wetenschappelijk redeneren. Niet alle naturalisten waren echter zo reductionistisch als Quine was. SOCIALE FACTOREN Volgens onder andere de logisch positivisten zijn sociale fenomenen in de wetenschap verstorende fenomenen, die de objectiviteit in de weg staan. Voor veel sociologen zijn sociologische fenomenen veel dieper in het wetenschappelijke werk verborgen dan een wetenschapper zou toegeven. Sociologen denken dat het vaak gebeurd dat ‘logica’ en ‘bewijzen’ een masker zijn voor ‘onwetenschappelijke’ bias en interesses. Kuhn dacht, zoals we hebben gezien, dat de sociale aspecten niet perse slecht waren, maar juist ook goed konden zijn voor de ontwikkeling van de wetenschap. ‘Naturalized epistemology’ gelooft ook dat de sociologische aspecten een positief effect hebben op de ontwikkeling van de wetenschap, maar denken ook dat dit niet betekent dat de wetenschap zijn speciale status kwijtraakt. Het systeem waarin wetenschappers geprezen worden voor goede onderzoeksresultaten, is een goed voorbeeld hiervan. Omdat wetenschappers op elkanders ideeën teren lokt dit ook het testen en herhalen van experimenten van anderen uit. In de 1970’s ontstond er de zogenaamde ‘strong program’ in de sociologie van de wetenschap. Een belangrijk principe van deze stroming was het symmetrie principe, dat stelde dat een onredelijk of onwaar geloof in deze stroming dezelfde behandeling krijgt als een redelijk en waar geloof. Deze stroming probeert de wetenschap niet uit te leggen aan de hand van wat waar is en wat niet, maar door middel van locale sociale omstandigheden, praktijken en normen. Net als Quine geloven de sociologen dat ‘bewijzen’ min of meer krachteloos zijn en de keuzes worden gedetermineerd door 31 sociale omstandigheden. Hoewel de wetenschappers misschien zelf denken dat ze rationeel bezig zijn, werpen de sociologen tegen dat wel meer groepen dit van zichzelf denken. Net als een antropoloog, die een stam onderzoekt, neemt de socioloog niet aan dat de wetenschap enige waarheid bezit, maar proberen ze de handelingen van de stam sociologisch te begrijpen. CONCLUSIE Waarschijnlijk kan de wetenschap niet bestaan zonder dat er metafysica meespeelt. Omdat we deze metafysische concepten niet kunnen testen moeten we er dus heel voorzichtig, flexibel en zelfbewust mee omgaan. Hoewel wetenschappers vaak denken niet aan filosofie te doen, is dit slechts schijn. ‘Scientists tend to commit philosophy when they explain what they do’, zegt professor Kasser [a, H36]. De zoektocht naar een oplossing voor het demarcatie probleem lijkt niet veelbelovend. Het lijkt erop alsof de echt diepe problemen in de filosofie een oplossing schuwen. De speciale status van de wetenschap kunnen we niet vangen in een enkele methode. Ook is het de filosofie niet gelukt om ook maar een beetje objectieve kennis te vinden, ondanks een intensief zoeken van langer dan 2000 jaar. We hebben gezien dat er zelfs filosofen waren, zoals Feyerabend in de 20ste eeuw en Nietzsche in de 19de, die niet eens meer geloofde in de mogelijkheid tot het vinden van zekere kennis. Toch gingen anderen stug door in hun zoektocht, zoals Einstein bijvoorbeeld. Maar dit ‘negatieve’ resultaat van de filosofie is ook een resultaat. We zijn er in ieder geval achter dat de meest voor de handliggende oplossingen niet blijken te werken en dat de wetenschappelijke theorieën, wetten en verklaringen complexer zijn dan we tot dusver hebben gedacht. Dit is in strijd met de overheersende gedachte in de wetenschap zelfs, dat deze concepten onproblematisch zijn. De lijkt me daarom een zeer interessant resultaat! 32 DESCARTES: DE ANALYTISCHE MEETKUNDE In 1591 schreef de wetenschapper Viète zijn ‘Introduction to the Analytic Art’[a, 143], waarin hij voor het eerst een algemene vergelijking opstelde, zonder geneigd te zijn de variabelen tot bepaalde getallen te reduceren. Zelfs nummers konden in de algebra worden beschouwd als puur wiskundige entiteiten, onafhankelijk van een fysische context. Voor de Grieken was dit een probleem. De bedoeling van de Grieken was vooral om de eigenschappen van geometrische figuren te ontdekken en vanwege deze fysische of geometrische afhankelijkheid was bijvoorbeeld het vermenigvuldigen van meer dan drie lijnen onmogelijk (omdat er maar drie dimensies waren). Een aantal wiskundigen had al gemerkt dat met de algebra meer mogelijk was dan met de geometrie van de Oude Grieken. De algebra kon hele complexe situaties nog steeds duidelijk en overzichtelijk beschrijven. Descartes ging veel verder door de analytische meetkunde uit te vinden. Zelfs wiskundestudenten verbaast het als ze horen dat de analytische meetkunde pas in de 17de eeuw is komen te ontstaan. De analytische meetkunde wordt gebruikt om krommen te beschrijven met behulp van de algebra. Deze uitvinding, die nu van alle dag is, was destijds een grote vernieuwing. De weg naar deze ontdekking is een uniek verhaal, dat we hier heel kort schetsen, gebruikmakend van materiaal rechtstreeks uit ‘La Geometrie’[b] van Descartes. Van filosofisch belang is in dit stuk vooral de grotere reikwijdte van een vakgebied, door simpelweg in een andere (symbolen-)taal te gaan schrijven. In een zekere zin is de algebra een omschrijving van geometrische patronen in algebraïsche vergelijkingen, toch kan men met de algebra veel ingewikkeldere constructies analyseren dan het geval is met de geometrie. Een ander punt is de late ontdekking van de grafiek. Dit zegt mij dat een dergelijk mathematisch object helemaal niet zo voor de hand ligt als we tegenwoordig denken (een nog sterker voorbeeld is het behoud van energie als een optelsom van de kinetische en de potentiële energie. Dat nu klinkt als gesneden koek, maar eigenlijk is het pas in de tweede helft van de 19de eeuw met veel moeite is geformuleerd[d. H29]. Nog geen 50 jaar later werd het al weer gegeneraliseerd in het werk van Einstein, die vond dat ook de massa een rol speelde in het behoud van energie. Later vond men in de quantummechanica dat ook energie aan de onzekerheidsrelaties moet voldoen en daardoor het energiebehoud tijdelijk geschonden kan worden). INSTRUMENTALE WISKUNDE Descartes maakte in 1619 een interessante keuze in zijn studie in de wiskunde. Hij focuste zich niet alleen op geometrie of alleen algebra, maar op een meer instrumentale techniek[a, 49]. Hij probeerde met passer en liniaal geometrische en algebraïsche problemen op te lossen. Zijn methode is enorm interessant en de resultaten ervan zullen doorklinken in zijn volwassen wiskunde. 33 Descartes kruiste de twee lijnen XY en YZ onder een verstelbare hoek. Daarna koos hij een willekeurige plek waar hij een lijn loodrecht op XY zette, die hij BC noemde. Vanuit het punt C maakte hij een loodrechte lijn op de lijn YZ etc. U kunt zich wellicht voorstellen dat wanneer het punt B zich op een vaste plek op de lijn XY bevindt en de hoek tussen de twee lijnen XY en YZ wordt veranderd, de andere punten een nieuwe, maar unieke, positie innemen. Een belangrijk punt van deze geometrische beschrijving is dat Descartes het beschouwde als een fysische opstelling, die met simpele materialen te maken was. Descartes definieerde dat de lijn BY lengte ‘1’ had en opende daarna de lijnen XY en YZ, zodat de lijn CE een willekeurig te kiezen waarde ‘a’ aannam. Hij noemde CY ‘x’. Daarna maakte Descartes gebruik van de verhoudingen tussen de rechte driehoeken BCY, CDY en DEY. Omdat alle driehoeken zowel een rechte hoek en de hoek XYZ hebben, zijn al deze driehoeken congruent. Dit betekent dat ze, hoewel van verschillende grote, exact gelijke verhoudingen hebben. Er geldt[a, 49-50,85]: We kunnen dan invullen: YD moet dus gelijk zijn aan x2 en YE aan x3. Ook weten we dat EY gelijk is aan CY + CE. We vinden: 34 Hieruit kunnen we concluderen dat, wanneer we CE vrij kiezen, de lengte van het lijnstuk CY van ons geometrisch instrument het antwoord geeft van de vergelijking x3 = x + CE! Dus Descartes heeft een simpel geometrisch instrument gebouwd, waarmee men vrij gemakkelijk het antwoord van een bepaald type derdegraads-vergelijking kan aflezen. Het is apart om op te merken dat een instrumentele aanpak van algebra geen negatieve antwoorden toelaat, omdat negatieve lengtes niet bestaan, hoewel de algebra wel negatieve antwoorden toelaat. Ook is het belangrijk om het volgende op te merken: hoewel zijn aanpak wiskundig solide is en de lengte van het lijnstuk CY werkelijk gelijk is aan de ‘x’, moeten we uiteindelijk toch de (in principe onnauwkeurige) fysische liniaal gebruiken, om de grootte van het lijnstuk CY te meten. Toch moet u het met me eens zijn dat zijn methode ingenieus, origineel en ook best handig is. DE ANALYTISCHE GEOMETRIE Ook maakte Descartes in zijn ‘de Geometrie’[b] van 1637 een ‘algebra van lijnstukken’. Hij liet daarin zien dat optellen, aftrekken, vermenigvuldigen, delen, worteltrekken en kwadrateren allemaal te representeren waren in lijnlengtes. Laten we als voorbeeld de wortel nemen[b, 316]: Hij construeerde een halve cirkel en doorkruiste deze met een verticale lijn, zoals weergegeven in de eerste van de volgende afbeeldingen. Hij stelde het horizontale lijnstuk links van de verticale lijn gelijk aan de eenheidslengte. En de lijn aan de andere kant gelijk aan ‘x’. Met behulp van de stelling van Pythagoras en de kennis over de straal van de cirkel kan dan bepaald worden (zoals in het tweede figuur is uitgewerkt) dat het verticale lijnstuk tussen de twee snijpunten met de halve cirkel exact gelijk is aan ‘√x’! Wederom geeft deze methode geen exacte antwoorden. Ook al is de procedure wiskundig solide, uiteindelijk moet toch de meetlat erbij gepakt worden om de wortel van ‘x’ daadwerkelijk te meten. LA GEOMETRIE Het werk La Géométrie van René Descartes is een van de belangrijkste werken in de wiskunde en hoewel geschreven in de 17de eeuw is het erg goed leesbaar voor de moderne lezer, omdat Descartes bijna alleen notatie gebruikt, die wij ook gebruiken. De geometrie van Descartes was niet systematisch. Hij gaf voorbeelden en maakte suggesties over wat zijn theorie allemaal zou kunnen bewerkstelligen. Toch waren deze voorbeelden zeer krachtig en legde hij de basis voor de analytische meetkunde en daarmee het begin van de grafiek, hetgeen vanzelfsprekend gigantisch belangrijk is voor de wiskunde. 35 We hebben al gezien hoe Descartes de basisoperaties van de algebra kon representeren in lijnstukken met behulp van geometrische figuren. Laten we nu naar een paar andere voorbeelden kijken, waarbij hij instrumenten construeerde om algebraïsche vergelijkingen mee op te lossen. Aanschouw het volgende figuur[b, 320]. De straal van een cirkel (lengte ‘0.5a’) is hier tevens een van de rechte zijden van een rechte driehoek en de andere rechte zijde heeft een lengt ‘b’. De schuine zijde is een optelsom van de lengtes ‘0.5a’ en ‘y’. Wanneer wij ‘y’ willen uitdrukken in ‘a’ en ‘b’, doen we dat met de stelling van Pythagoras: Dit is precies de vergelijking die wij de ABC-formule noemen voor de volgende vergelijking: Met dus simpelweg een driehoek en een cirkel, waarbij we de parameters ‘a’ en ‘b’ vrij kunnen kiezen, kunnen we direct de oplossing van deze vergelijking aflezen! Dit is wat Descartes bedoelde wanneer hij de directheid en simpelheid van de analyse boven de deductie stelde! Let wel: de lengtes ‘a’ en ‘b’ zijn altijd positief in de geometrische constructies van Descartes. En nog briljantere constructie is zijn behandeling van de vergelijking z2 - az + b2 = 0 [b, 320]. Het lastige van deze vergelijking is dat het twee oplossingen kan bevatten. Descartes pakte het als volgt aan. Hij gebruikte een halve cirkel en een lijn ‘b’ die loodrecht op het snijvlak van de cirkel staat, aan een van de eindpunten van de halve cirkelboog. Aan het eind van lijn ‘b’ wordt een loodrechte lijn getrokken die mogelijkerwijs (afhankelijk van de lengte van ‘b’) met de cirkel snijdt. 36 Door gebruik te maken van de straal van de cirkel (wederom ‘0.5a’), de stelling van Pythagoras en de hulplijnen die in de tweede afbeelding zijn weergegeven, kan worden afgeleid dat de afstanden ‘z1’ en ‘z2’ de oplossingen zijn van de vergelijking! Men vindt de relatie: Dit is de oplossing voor de ABC formule van de formule die Descartes probeerde op te lossen. Merk op: als ‘b’ in verhouding tot de straal van de cirkel te groot wordt, verdwijnen de snijpunten. Dit valt precies samen met het wegvallen van (reële) oplossingen in vergelijking. Ook zien we mooi weergegeven dat wanneer ‘b’ even groot is als ‘0.5a’ er maar een snijpunt, corresponderend met een oplossing van de vergelijking, is. Kent u een betere representatie van dit principe! Het is Descartes gelukt om met een halve cirkel en slechts twee lijnen direct de (positieve, reële) oplossingen van de vergelijking z2 - az + b2 = 0 op te meten! Descartes geeft ook expliciete constructies voor het oplossen van vergelijkingen van de derde tot en met zesde graad. Bij de derde- en vierdegraadsvergelijkingen maakt hij gebruik van het snijden van een cirkel met een parabool. Hij gebruikt de ligging en afmeting van deze figuren om de coëfficiënten van de vergelijking uit te drukken. Voor de vijfde- en zesdegraadsvergelijking snijdt Descartes een hulpkromme, die gegenereerd is door een mechaniek van een draaiende lijn met een verschuivende parabool[b, 408]. DE GRAFIEK We zijn nog nergens een assenstelsel tegengekomen en zullen nu Descartes dichtste benadering tot een assenstelsel bespreken. Ik denk dat zijn gebruik ervan veel zegt over de ontwikkeling van het assenstelsel, maar het kan wellicht ook een licht werpen op ons moderne idee van een star assenstelsel, dat aan het bestaan van een grafiek voorafgaat. Later meer over dit laatste punt. We richten ons nu op de volgende afbeelding[b, 334]. Een driehoek KLN kan bewegen langs de verticale lijn AK. Een lijn GL zit gefixeerd in G, maar beweegt met L mee. De lijn KN kon doorgetrokken worden naar het snijpunt C met de lijn GL, zoals in het volgende figuur is samengevat. 37 In het rechter figuur staat de versie die Descartes gebruikte in ‘La Geometrie’. In zijn afbeelding is te zien dat wanneer de driehoek KLN naar boven en beneden beweegt het punt C een curve beschrijft. Descartes gebruikt dus wederom een ‘instrumentale’ methode, dit keer om een curve te tekenen. Het verschil met de eerdere voorbeelden is dat Descartes hier geïnteresseerd was in een wiskundige beschrijving van een curve, terwijl de eerdere voorbeelden lijken op wat ik ‘oplossingsmachines’ voor algebraïsche vergelijkingen heb genoemd. De machines waren geen directe representatie van de vergelijking in kwestie, maar slechts een representatie van de oplossingen. Omdat we GA, KL en NL straks veelvuldig nodig hebben, korte hij dit af tot resp. a, b en c (zie bovenstaande figuur). Daarna trok Descartes een extra horizontale hulplijn CB. Deze CB noemde hij ‘y’ en de afstand BA noemde hij ‘x’. Met behulp van deze hulplijnen kon hij de positie van het punt C beschrijven in termen van ‘x’ en ‘y’. Dit lijkt heel sterk op de assenstelsels die wij gebruiken! Wellicht is dit de eerste grafiek! Maar Descartes gaat verder met behulp van zijn ‘ouderwetse’ geometrische relaties: Omdat BL = KB – b en AL = BL + x vinden we: Omdat geldt: 38 Kunnen we invullen: Oftewel Oftewel Dit is het eindresultaat! Descartes merkte op dat zijn (instrumentale) constructie van deze curve een tweedegraads vergelijking is. Hij heeft daarmee zijn curve kunnen categoriseren. Descartes doet geen moeite om de grote van de driehoek vast te stellen of de positie van het punt G en verkrijgt daarom een algemeen antwoord, met ongespecificeerde parameters. Om nog even terug te komen op het assenstelsel, wij beschouwen de aanwezigheid van een assenstelsel bijna als een vereiste voor het bestaan van een grafiek. Het stelsel wordt vaak direct vereenzelvigd met ‘ruimte’. Dit is niet het geval bij Descartes, zoals we hebben gezien. Descartes maakte eerst zijn ‘grafiek’. Daarna besloot hij pas om twee hulplijnen in te schakelen, die hij willekeurig, maar tactisch, plaatste om zo de grafiek te beschrijven in termen van ‘x’ en ‘y’. Er is geen sprake van ‘ruimte’, maar eerder gewoon weer een locale ‘instrumentale’ constructie om de relatie tussen de lijnen aan te tonen. 39 NEWTON: DE ZWAARTEKRACHT SYNTHESE VAN HEMEL EN AARDE Na Isaac Newton (1642-1727) was het niet meer nodig dat studenten in de kosmologie moesten kiezen tussen de verschillende, maar vrijwel empirisch equivalente, hypotheses van Ptolemeaus, Copernicus en Tycho Brahe, die allemaal is staat waren een model van het zonnestelsel te maken dat redelijk tot goed met de feiten in overeenstemming was te brengen. Omdat zijn theorie van de zwaartekracht zijn belangrijkste werk is, zullen we ons hier op richten. Newton staat vooral bekend omdat vanwege zijn geweldige synthese van de theorie van Kepler en Copernicus (over de bewegingen van de hemellichamen) en die van Galileo en Descartes (over de beweging van objecten op aarde). Hij combineerde deze theorieën over respectievelijk hemel en aarde tot een consistent ‘Wereld Systeem’[a, 33]. Ook bedacht hij verschillende nieuwe wiskundige methoden om zijn theorie te construeren en herdefinieerde hij veel van de fundamentele concepten in de natuurkunde, zoals kracht, inertia en massa. Tevens corrigeerde hij de theorieën van zijn voorgangers. Zo had Kepler nog gedacht dat de ‘anima motrix’ direct afnam met de afstand van de zon, terwijl Newton van mening was dat de kracht af nam met het kwadraat van de afstand. Ook had Kepler nog gedacht dat de kracht in de bewegingsrichting van de planeet moest staan, terwijl Newton van mening was dat de kracht naar de zon moest wijzen. Descartes had zijn kracht gelijk gesteld aan ‘mv’, terwijl Newton realiseerde dat ‘ma’ een betere formule was. Hij associeerde ‘mv’ met de impuls. DE PRINCIPIA Zijn belangrijkste werk, de ‘Philosophiae Naturalis Principia Mathematica’[a] (de wiskundige beginselen van de natuurfilosofie, of kortweg de Principia), is gemodelleerd op het werk van Euclides in de zin dat hij begon met een zo gering mogelijke hoeveelheid definities en axioma’s (waaronder de bekende drie wetten van Newton), waarbij uit hij vervolgens zijn theorie probeerde af te leiden, door een voor een theorema’s te bewijzen. Een ander overeenkomst is de nadruk op de geometrie in plaats de algebra, die dankzij het werk van Descartes en anderen (inclusief Newton zelf) al flink ontwikkeld was. Hoewel Newton zijn algebraïsche wiskunde wel heeft gebruikt om tot veel van de bewijzen te komen (bijvoorbeeld met zijn nieuwe calculus en de algebraïsche versie van zijn wiskunde van ‘vanishingly small quantities’) heeft hij ervoor gekozen om zijn bewijzen te herschrijven in de geometrische vorm. Hoewel het soms wat onnatuurlijk aandoet, lukte het Newton om de geometrie te gebruiken voor zijn ingewikkelde mechanica. De moderne wetenschapper Roche schrijft hierover ‘Newton’s mastery of his chosen mathematical idiom I find breath taking’[c, 50]. Hij representeerde in zijn geometrische figuren zowel kracht, snelheid, versnelling, tijd, afstand en dichtheid in de vorm van lijnen. Hij construeerde zijn geometrie zo dat het zijn natuurkunde degelijk kon beschrijven. Hij gebruikte soms zelfs hetzelfde diagram voor meerdere fysische interpretaties. In het volgende stukje uit de Principia illustreerde Newton kwalitatief hoe de zwaartekracht van de aarde met behulp van de centripetale kracht in evenwicht kan worden gebracht en kon hiermee verklaren dat de planeten in een banen rond de aarde konden bewegen zonder weer neer te storten op de aarde[a, 75]: 40 Het boek bestaat uit een introductie, waarin de axioma’s en definities worden geformuleerd, en nog drie hoofddelen. In het eerste deel gebruikt hij onder andere zijn wiskunde van de ‘vanishingly small quantities’, die hij veelvuldig geometrisch toepast. Hij gebruikt dit bijvoorbeeld in een bewijs, waarin hij aantoont dat wanneer een kracht vanaf een object naar een vast punt blijft wijzen (zoals bij de zwaartekracht van de zon), een imaginaire lijn vanaf dit punt naar het object in gelijke tijden gelijke oppervlaktes beslaat[a, 104]. Dit is een van de wetten van Kepler Het bewijs hiervoor staat op de volgende bladzijde. Ook laat Newton later in zijn werk zien dat de andere twee wetten van Kepler ook uit zijn aannames te reproduceren zijn. 41 Om aan te geven hoe ingewikkeld zijn werk is, kijken we vlug naar het zogenaamde ‘zesde probleem van de elfde propositie’ van de Principia. Newton toonde hier aan dat: ‘als een deeltje dan in een ellips ronddraait, dan is het noodzakelijk dat de centripetale kracht naar de focus van de ellips wijst’[a, 116] . Hij gebruikte hiervoor de volgende geometrische constructie: 42 In een eerder bewijs vond Newton een geometrische representatie van de centripetale kracht en met behulp van die relatie en deze geometrische constructie, kon hij uiteindelijk vinden dat deze kracht rechtevenredig is aan de inverse van het kwadraat van de afstand van het deeltje tot de focus van de ellips waar zich de andere massa bevindt. In het bewijs maakt hij onder andere gebruik van limieten door het punt P op de ellips langzaam naar het punt R te laten bewegen. Nu kort iets over het tweede boek. Dit gaat voornamelijk over hypothetische gevallen van de beweging van objecten in weerstandbiedende media, zoals het bewegen van een pendulum in een medium. Aan het einde van het boek verwierp hij de theorie van Descartes, die zoals dacht dat de planeten rond werden gesleurd in de ether as een kurken in een draaikolk. Newton hield vol dat de planeten in een vacuüm moesten bewegen. Het zal pas in het derde en laatste boek zijn dat hij de algemene theorie van de zwaartekracht voorstelt. Hij toonde daar aan dat de acceleratie van de maan gelijk was aan die van een appel, die men onder de kracht van de zwaartekracht tot de hoogte van de maan zou optillen. De maan moest voldoen aan de 1/r2 wet[c, 56]: The force by which the Moon is retained in its orbit is that very same force which we commonly call gravity, for were gravity another force differing from that, then bodies falling to the Earth with the joint impulse of both forces would fall with double that velocity which we actually experience. Dit was een goede aanwijzing voor de gelijkstelling van de zwaartekracht op aarde en die vreemde kracht die de planeten bij elkaar hield. Newton beweerde in zijn derde boek dat de zwaartekracht op alle objecten in het hele universum werkt. Hij schreef[a, 385]: Lastly, if it universally appears, by experiments and astronomical observations, that all bodies about the earth gravitate towards the earth, and that in proportion to the quantity of matter which they severally contain; that the moon likewise, according to the quantity of its matter, gravitates towards the earth; that, on the other hand, our sea gravitates towards the moon ; and all the planets mutually one towards another ; and the comets in like manner towards the sun ; we must, in consequence of this rule, universally allow that all bodies whatsoever are endowed with a principle of mutual gravitation. In het derde boek beschrijft Newton ook hoe eb en vloed werkt, hoe kometen bewegen, de precessie van de equinoxen, het afplatten van de aarde door rotatie en verklaart hij het verschil van de 43 verschillende metingen van de valversnelling door de zwaartekracht op verschillende plaatsen op aarde. Ook leidde hij af dat de zwaartekracht binnen een dunne sferische schil op elk punt nul is en dat de zwaartekracht van een volle bol gelijk was aan de kracht van een punt in het midden van de bol met dezelfde massa. ABSOLUTE EN RELATIEVE RUIMTE Hoewel bewegingen met een constante snelheid altijd relatief zijn (dat wil zeggen afhankelijk van de plaats van de waarnemer), geldt dit niet voor de versnelling. Bij de versnelling treden dynamische effecten op en het was daarom te onderscheiden van de niet-versnelde beweging. Versnelling was dus niet relatief en Newton voelde zich daarom genoodzaakt om een absoluut stelsel te definiëren, ten opzichte waarvan deze effecten plaatsvonden. Hij kwam als volgt tot deze conclusie: Newton gebruikte zijn bekende ‘rotating bucket’ argument om aan te tonen dat roterende beweging niet relatief is (in tegenstelling tot de lineaire beweging). Hij hing een emmer met water via een touw aan het plafond. Wanneer hij de emmer een aantal slagen draaide en het dan losliet, draaide de emmer snel terug. Het water dat eerst een vlak oppervlak had, steeg nu naar de zijkanten van de emmer en daalde in het midden, vanwege de centripetale kracht. Het water is in rust ten opzichte van de bak met water, maar toch ondervindt het water een kracht van de rotatie! Het relativiteitprincipe van Galileo gaat hier dus niet op. Newton dacht dat dit betekende dat de emmer moest roteren ten opzichte van de absolute ruimte[d]. Newton wist dat we absolute ruimte niet direct kunnen waarnemen. Om te achterhalen of iets roteert, moeten we de krachten die er op werken analyseren. Wanneer twee objecten, gebonden door een touw, zich ergens in de ruimte bevinden, weten we niet direct of deze objecten stil staan of roteren. Newton dacht dat we hier achter konden komen door de spanning in het touw te meten. Als we weten hoeveel de objecten aan elkaar trekken kunnen we uitrekenen hoe hard ze roteren. Om er ook achter te komen in welke richting ze bewegen kan men een van de objecten een duw geven en kijken of de spanning in het touw af- of toeneemt, resp. of de objecten langzamer of sneller roteren. We kunnen natuurlijk ook objecten gebruiken waarvan we weten dat ze stil staan (voor Newton de sterren) en de beweging daarmee vergelijken. Ernst Mach, waar we het later nog over gaan hebben, bedacht een andere oplossing voor Newton’s ‘bucket argument’. Mach stelde dat we niet roteren ten opzichte van de absolute ruimte, maar ten opzichte van de andere materie in het heelal. Dit wordt Mach’s principe genoemd[e]. Ik ga dit uitleggen aan de hand van de onderstaande afbeelding. Twee emmers worden opgehangen aan een lat, rondgedraaid en daarna los gelaten. De eerste is klein en bevindt zich dicht bij een veel zwaardere aardbol. De tweede is groot en bevindt zich dicht bij een kleine aardbol. Volgens Mach roteert een object als het zich dicht bij een ander object bevindt dat veel zwaarder is. Dus in het linker geval ondervindt de emmer rotatie, hetgeen weerspiegeld is in de parabool-vormige stand van het water. In het rechter geval heeft de emmer geen groot object in de buurt ten opzichte waarvan het kan roteren. Het water blijft hier daarom vlak. Ook al draait de bak vanaf de planeet gezien, het water in de bak voelt geen enkel effect van deze draaiing en denkt dus stil te staan. Een ander voorbeeld dat Mach gebruikte om dit principe aan te geven ging als volgt: stel dat we de wanden van de emmer in Newton’s lab zo zwaar maken dat de massa groot is ten opzichte van de aarde, zal het water dan niet stil blijven staan ten opzichte van de draaiende emmer? Dit idee werd later door Einstein opgepakt om de generale relativiteitstheorie te ontwikkelen. Hij gaf Mach hiervoor geregeld complimenten. 44 MODERNE ANALYSE De wetten van Newton werkten zo goed, dat het niet lang duurde voordat er niemand meer aan zou twijfelen. Vooral in de 18de eeuw waren de wetten van Newton gelijk aan waarheden over de natuur. Nu weten we dat geen van de drie wetten van Newton deductief in een experiment gevonden kunnen worden. Het was een creatieve collectie van aannames, die op de natuur geprojecteerd werden als principes van de natuur. Men kan denken dat dit filosofisch gezever is, maar in de 19de eeuw vond men dat deze wet in het elektromagnetisme geschonden werd. Voor zijn definities van ruimte en tijd geldt hetzelfde, ook deze gelden niet meer in de theorie die Einstein in het begin van de 20ste eeuw opstelde. De principes van Newton waren dus duidelijk ‘bedacht’ door Newton en waren niet inductief en niet deductief uit de natuur te extraheren. Maar de theorie werkte! Een interessante vraag is hoe het mogelijk is, dat een theorie zo goed werkte en toch gededuceerd is uit een stel verzonnen en incorrecte aannames. HYPOTHESES Een ander karakteristiek van de Principia was dat Newton zich niet waagde aan een oorzaak van de zwaartekracht. Hij beperkte zich tot de logische conclusies uit zijn aannames en de astronomische gegevens. Descartes was nog een mechaniek willen bedenken voor de krachten in het universum, maar Newton zag in dat uitspraken over een dergelijke werking slechts berust was op speculatie. De kritiek van de wetenschap van de verlichting was vaak dat de scholastici van de middeleeuwen vaak zogenaamde ‘occulte krachten’ toeschreven aan fenomenen om ze te verklaren. Het probleem was alleen dat deze verklaringen vaak als volgt op te sommen waren: dit object vertoont magnetische verschijnselen, omdat het een magnetische kwaliteit heeft. Dit is natuurlijk een lege verklaring. Descartes had hiervan afgestapt en een mechaniek bedacht voor bijvoorbeeld de zwaartekracht en het magnetisme. Ook wilde hij zijn mechaniek zo construeren dat de krachten verklaart konden worden met slechts het bewegen en botsen van deeltjes en niets meer. De zwaartekracht van Newton werkte echter op afstand en kende geen mechanische verklaring. Dit zou Descartes een occult effect hebben genoemd. Newton schreef hierover[c, 141]: 45 MAXWELL: HET ETHER-MODEL Veel theorieën leken in hun tijd voorbelovend en naderhand absurd. Omdat zulke theorieën van alle tijden blijken te zijn, kunnen we hier een belangrijke les uit leren: wij hebben waarschijnlijk ook dit soort theorieën, die nu heel zeker lijken, maar later toch totaal fictief blijken te zijn. Een van de grootste voorbeelden van een dergelijke theorie is het ethermodel van Maxwell. Hieronder lezen we hoe dit werkte. DE ETHER Om de ether mechanisch te beschrijven gebruikte Maxwell zijn ‘Vortical theory of magnetism & electricity’ ofwel zijn ‘theorie van moleculaire vortices’[a, 98]. Hij zocht een mechaniek om zijn geometrische model van veldlijnen te verklaren. Maxwell dacht dat de magnetische veldlijnen, die vaak cirkels beschrijven, te verklaren waren met kleine roterende bewegingen in de ether. Maxwell ontwierp zelfs een apparaat om deze vortices te meten, door het effect van het moment van de vortices op een vrij roterende magneet te meten[a, 101]. Maxwell vond geen bewijs voor de vortices en concludeerde dat het effect zo klein moest zijn dat het apparaat het niet meten kon. De draaisnelheid van de vortices, zo dacht Maxwell, correspondeerde met de intensiteit van het magnetische veld. Als twee vortices langs elkaar in dezelfde richting roteren, dan heffen deze bewegingen elkaar op, zoals hieronder is weergegeven. Daarom bedacht Maxwell dat tussen deze vortices ‘idle wheels’ zaten (zoals hieronder weergegeven), die ervoor zorgen dat de rotatie van de vortices elkaar niet afremt[a, 104]: Maxwell merkte op dat de ‘idle wheels’ ook nog translatie ondergaan als de twee vortices waarmee ze in contact staan met verschillende snelheid bewegen. Anderzijds kan een translatie van de ‘idle wheels’ ervoor zorgen dat de rotatiesnelheid van de vortices verandert[c, 104]. De Fransen vonden dit model maar niks, omdat het ze herinnerden aan de Engelse fabrieken, maar in Engeland werd het heel serieus genomen. 46 Maxwell identificeerde de translatie van de ‘idle wheels’ met het voortbewegen van een elektrische stroom. Hij kon hiermee verklaren dat als er een stroom loopt, er een magnetisch veld ontstaat. De beweging van de ‘idle wheels’ zorgt er namelijk voor dat de vortices gaan roteren. Als deze roterende vortices bij een stroomdraad terecht komt, zorgen deze vortices er voor dat ook in die stroomkring voor een korte tijd een stroom gaat lopen. Met deze constructie kon Maxwell de inductie verklaren, hetgeen veroorzaakt wordt door een veranderend magneetveld. Ook in het mechanische ethermodel is het zo dat een verandering van de rotatiesnelheid van de vortices zorgt voor elektriciteit (het bewegen van ‘idle wheels’). Als het magnetische veld eenmaal constant blijft en de vortices met een constante snelheid gaan roteren, dan kunnen de ‘idle wheels’ ook weer gewoon meeroteren, zonder zich te verplaatsen. Dus alleen een verandering van het magneetveld zorgt voor stroom, net als in het geval van de inductie! Maxwell illustreerde dit met het volgende figuur[a, 104] (voor de duidelijkheid: Maxwell maakte hierin een klein foutje. Hij liet sommige van de zeshoeken onder de lijn AB tegen de klok in draaien (+), in plaats ven met de klok mee (-) ). Een stroom wordt aangezet die (in de bovenstaande afbeelding) van A naar B loopt. De rij vortices ‘gh’ wordt tegen de klok in, in beweging gezet (zoals aangegeven met de ‘+’) en laat tijdelijk een stroom lopen van rechts naar links (van q naar p). Dit is de inductiestroom. Deze stroom zet de vortices ‘kl’ weer in beweging. Als ‘AB’ zou stoppen, stoppen ook de vortices ‘gh’, maar de impuls van de vortices ‘kl’ houdt dan nog even vol en beweegt de deeltjes ‘pq’ naar rechts. Wat dacht Maxwell zelf van deze hypothese? Hij beschouwde zijn ‘hypothesis of vortices’ als ‘probable’, maar wel ‘provisional and temporary’[a, 105]. Hij schreef ‘I do not bring it forward as a mode of connexion existing in nature, or even as that which I would willingly assent to as an electrical hypothesis’[a, 105]. Maar de theorie is wel ‘mechanically conceivable’[a, 105], want het demonstreert de mogelijkheid om het elektromagnetische veld te verklaren met de mechanica. De ether van Maxwell bevatte ook een elastische eigenschap. Elasticiteit was al eerder het kenmerk geweest van de optische ether (een ether voor licht). Maxwell schrijft deze eigenschap nu ook toe aan de elektromagnetische ether[a, 105]: 47 Maxwell dacht ook dat energie een medium nodig had[a, 168]: Ook probeerde Maxwell zijn theorie te laten gelden voor de elektrostatica[a, 107]. Hij probeerde het ophopen van statische lading te verklaren door een vervorming van de vortexcellen, hetgeen voor polarisatie zorgt. Zoals in de afbeelding van Maxwell[a, 107] zorgt de vervorming van het medium voor de polarisatie. Doordat de ether elastisch is, zal de cel zich proberen in zijn oorspronkelijke staat te herstellen en dit levert de bijbehorende krachten op. Door de koppeling van de optica en het elektromagnetisme vond Maxwell een relatie tussen de brekingsindex en de dielektische constante. Het verklaarde ook het Faraday effect, het effect van magnetisme op de polarisatie van licht. Hij ‘ontdekte’ dat de polarisatie in dezelfde richting roteerde als de rotatie van de magnetische vortices. Ook vond hij dat de rotatie van de polarisatie proportioneel was aan de dikte van het medium en de intensiteit van het magneetveld. Deze relaties kwamen overeen met experimentele vondsten. De hypothese van de vortices bleek dus heel productief. In 1865 besluit Maxwell toch van het ethermodel af te stappen. Hij verlangt naar een ‘exact mathematical expression for all that is known about electromagnetism without the aid of hypothesis’[a, 113]. [a, 113] William Thomson (die ook wel Lord Kelvin werd genoemd) beschouwde Maxwells afstandname als een achteruitgang van de elektromagnetische theorie van Maxwell. Hij schreef ‘as long as I cannot 48 make a mechanical model all the way through I cannot understand; and that is why I cannot get the electromagnetic theory’[a, 9]. Net als Fourier zag ook Maxwell van zijn mechanische model af en gebruikte hij slechts een wiskundig model. Uit zijn wiskundige overwegingen vond Maxwell dat[a, 114]: Licht is een elektromagnetisch verschijnsel, waarbij het magnetische veld loodrecht staat op het elektrische veld en beide loodrecht staan op de bewegingsrichting. Hoewel Maxwell van zijn ethermodel afstapte, bleef hij geloven dat er een ether bestond waardoor het licht en het elektromagnetisme bewegen. Ook stapte hij niet af van de mogelijkheid om een correct mechanisch model te vinden. Vanwege het hypothetische karakter beschouwde hij zijn model als onaantrekkelijk. Hij merkte op dat er in principe wel een oneindige hoeveelheid mogelijke mechanische modellen voor het elektromagnetisch veld bedacht kunnen worden. ‘The problem of determining the mechanism required to establish a given species of connexion between the motions of the parts of a system always admits of an infinite number of solutions. Of these, some may be more clumsy or more complex than others, but all must satisfy the conditions of mechanism in general’[a, 118]. Wel denkt hij nog steeds dat er goede reden is om aan te nemen dat de ether bestaat[a, 119]: De theorie van Maxwell gaf hem een ‘a conviction of the reality of the medium’[a, 162]. Ook deed Maxwell de suggestie om de ether te detecteren door het verschil in de snelheid van het licht ten opzichte van de aarde te meten. Omdat de aarde om de zon draait, beweegt hij dus door de ether heen. Dit zou moeten betekenen dat licht, gemeten vanaf de aarde, in de ene richting (met de aarde mee) langzamer gaat dan licht in de andere richting (tegen de aarde in). Michelson en Morley (1887) lieten in een experiment zien dat licht in de richting van de beweging van de aarde even snel voortbewoog als licht loodrecht op deze beweging. Dit werd later geïnterpreteerd als het bewijs voor de afwezigheid van een ether. 49 HERTZ: SCIENTIFIC IMAGES FUNDAMENTAL CONCEPTIONS Een theorie zoals de mechanica van Newton, is gebaseerd op aannames. Omdat deze theorie zo’n succes werd in het beschrijven en voorspellen van nieuwe fenomenen, werd lange tijd aangenomen dat deze aannames dan ook juist moesten zijn. In de 19de eeuw ging men hier echter aan twijfelen. Men ging zich afvragen: zijn deze aannames uit de ervaring te extraheren? Zijn deze aannames uniek? In dezelfde eeuw ontstonden er een aantal aanwijzingen dat dit niet het geval was. Er werd een nieuwe mechanica ontwikkeld, die alle wetten van Newton precies kon reproduceren, maar met andere aannames. Newton had zijn theorie opgebouwd uit 4 principes (of ‘fundamental conceptions’ zoals Hertz ze noemde). Dit waren: Tijd, Ruimte, Massa en Kracht De nieuwe mechanica ging niet uit van Kracht, maar van Energie: Tijd, Ruimte, Massa en Energie Omdat we niet én kracht én energie nodig hebben, maar óf kracht óf energie, bracht dit wat vragen aan het oppervlakte over het werkelijk bestaan van deze entiteiten. Er was nog een andere en vreemdere mechanica ontstaan in de 19de eeuw. In de laatste jaren van zijn korte leven werkte Hertz (1857–1894) aan een boek genaamd ‘Die Prinzipien der Mechanik’. Ook Hertz was van plan de Newtoniaanse mechanica af te leiden met behulp van andere aannames. Hij baseerde zijn werk op een aantal ongewone principes, die hij onder het mom van filosofische elegantie rechtvaardigde. Hij postuleerde namelijk onzichtbare materie als de oorzaak van wat wij krachten noemen. Omdat hij onzichtbare massa onder het kopje ‘massa’ kon zetten, had hij uiteindelijk maar drie principes nodig: Ruimte, Tijd en Massa Dit is een principe minder dan Newton en de energietheorie nodig hadden! SCIENTIFIC IMAGES Hertz claimde dat zijn theorie empirisch niet te onderscheiden was van die van Newton. Dit is daarom wederom een voorbeeld van twee wiskundige theorieën die beide de ervaring beschrijven, hetgeen impliceert dat minstens een van de twee theorieën niet correspondeert met de werkelijkheid. In een bepaald opzicht was de twijfel van Hertz radicaler dan de gebruikelijke herschrijvingen van theorieën. Hertz wilde aantonen dat men met verschillende aannames dezelfde theorie kon afleiden, terwijl men normaal gesproken de aannames verandert om nieuwe gegevens te kunnen verklaren. Hertz onderzoek had een filosofisch karakter. Hij was niet van plan om nieuwe fysische feiten te voorspellen of te verklaren, maar was van plan de ambiguïteit van de aannames aan te tonen. Als deze aannames echt ambigu zijn, dan is de keuze van een bepaalde set aannames in zekere zin een menselijke (in tegenstelling tot een fysisch gedetermineerde) aangelegenheid. 50 Professor Goldman verwoordde het als volgt: ‘Scientific knowledge is […] irreducibly subjective to the extent that it is dependent on freely chosen assumptions’ [g, H12]. De theorie van Hertz wordt meestal te kort samengevat om het belang van de theorie goed te kunnen inschatten. Hertz schrijft over zijn aannames bijvoorbeeld: ‘It differs from [the force and the energy theorie] in this important respect, that it only starts with three independent fundamental conceptions, namely those of time, space and mass’ [a, 24]. Maar een dergelijke samenvatting is veel te kort door de bocht en roept daarom al snel vragen op. De aanname van onzichtbare materie is bijvoorbeeld nog erg vaag. Waar was deze materie verspreid om precies de krachten te kunnen nabootsen? En, nog dringender, hoe kan deze onzichtbare massa de krachten nabootsen als Hertz geen principe van interactie toevoegt aan zijn theorie? Krachten en energie hadden ervoor gezorgd dat deeltjes invloeden op elkaar konden uitwisselen, maar zonder een dergelijk postulaat hebben de massa’s geen invloed op elkaar. Om een antwoord op deze vragen te vinden zullen we diep in de theorie van Hertz moeten duiken. Nadat we dit hebben gedaan stel ik een nieuwe ‘samenvatting’ voor, die de theorie beter vertegenwoordigt. In de inleiding van zijn boek schrijft Hertz dat een verschillende set van aannames in principe in staat kan zijn om dezelfde fenomenen te beschrijven. Deze set van aannames noemt hij een ‘image’. Hij zegt: ‘Various images of the same objects are possible’[a, 2]. Hij schrijft ook: ‘But two permissible and correct images of the same external objects may yet differ in respect of appropriateness’[a, 2]. En zijn dus verschillende ‘images’ mogelijk, maar niet elke daarvan heeft dezelfde logische voorkeur. Hertz gelooft dat zijn mechanica een aantal logische voordelen heeft op zijn concurrenten. Toch blijft er, volgens Hertz, in principe altijd een ambiguïteit over welke ‘image’ de voorkeur zou moeten krijgen. Hertz stelt dat de theorie van krachten een groot nadeel heeft. Deze theorie is namelijk inconsistent. Als wij een steen aan een touw rondslingeren en daardoor een kracht uitoefenen op de steen, zou men volgens de 3de wet van Newton verwachten dat er een even grote tegengestelde kracht terug zou moeten werken. Maar deze ‘kracht’ van de steen op de hand, de centrifugale kracht, wordt veroorzaakt door de inertia van de steen? Hertz stelt: ‘Can we, without destroying the clearness of our conceptions, take the effect of inertia twice into account, - firstly as mass, secondly as force? [Since] force was a cause of motion […], can we, without confusing our ideas suddenly begin to speak of forces which arise through motion, which are the consequence of motion? […] Properly speaking, centrifugal force is not a force at all. […] But what [then] becomes of the demands of the 3rd law, which requires a force exerted by inert stone upon the hand’[a, 6]. Wat kracht precies is weten we niet en als de wetten van kracht ook nog inconsistent zijn, wat moeten we dan wel niet denken van dit concept? Hertz merkt op we in principe ook niet weten wat ‘goud’ of ‘snelheid’ is, maar er is een groot verschil tussen deze concepten en kracht: 51 [a, 7] Hertz geeft wel toe dat deze onzekerheden over het begrip kracht niet of nauwelijks in de weg hebben gestaan bij het ontwikkelen van de mechanica: ‘[they] have not prevented a single one of the numerous triumphs which mechanics has won in its application. Hence, [the logical inconsistencies] cannot consist of contradictions between essential characteristics of our image […]. They must rather lie in the unessential characteristics which we have ourselves arbitrarily worked into the essential content’[a, 8]. Toch kunnen we onze ‘images’ van de mechanica niet construeren zonder referentie naar onobserveerbare fenomenen. Als we kracht willen verwijderen uit de mechanica, dan moet er een ander onzichtbaar principe voor in de plaats komen. Hertz schrijft: ‘[if we pay] attention only to what can be directly observed, our attempt will in general fail. We soon become aware that the totality of things visible and tangible do not form an universe conformable to law. […] We may admit that there is a hidden something at work’[a, 25]. Dit ‘hidden something’ is in de traditionele theorieën van de mechanica de kracht of de energie. Omdat we niks weten over deze concepten, kunnen we beter een concept gebruiken, dat we directer kennen. In plaats van de ‘mysterieuze’ kracht of de ‘mysterieuze’ energie te gebruiken, kunnen we dit ‘hidden something’ misschien beter beschrijven in de bekende termen van massa. Hij vervolgt: We may admit that there is a hidden something at work, and yet deny that this something belongs to a special category. We are free to assume that this hidden something is nought else than motion and mass again. […] We assume that it is possible to conjoin with the visible masses of the universe other masses obeying the same laws, and of such a kind that the whole thereby becomes intelligible and conformable to law. […] What we are accustomed to denote as force and as energy now becomes nothing more than an action of mass and motion, but not necessarily of mass and motion recognizable by our senses[a, 25]. Naast de gebruikelijke massa is dan ‘concealed mass’ of ‘hidden mass’ nodig. Het enige verschil tussen deze onzichtbare materie en de gewone materie is dat de eerste niet waargenomen kan worden en de tweede wel. Voor de rest zijn alle eigenschappen van de twee gelijk. 52 EEN FUNDAMENTELE WET Maar dit is niet het enige logische voordeel. Hertz beweerde dat hij maar één fundamentele wet nodig had, terwijl Newton er wel drie nodig had. De wet die Hertz gebruikte was een modificatie van de eerste wet van Newton: Fundamental Law. Every free system persists in its state of rest or of uniform motion in a straightest path [a, 144]. Een vrij systeem is een systeem waarop geen externe krachten, maar wel interne krachten mogen opereren. Laten zullen we uitgebreid stilstaan bij de wiskundige formulering van deze wet. NORMAL CONNECTIONS Hertz gebruikt dus maar één wet en drie ‘fundamental conceptions’! Dit lijkt een grote logische vooruitgang. Maar er is een adder onder het gras. Tussen neus en lippen door vertelt Hertz in zijn inleiding dat hij toch een extra aanname moet maken om de interactie tussen deeltjes te kunnen verklaren. Hij maakt hiervoor gebruik van zogenaamde ‘normal connections’ of ‘rigid constraints’. Dit zijn geometrische constructies, die de zichtbare met de onzichtbare massa verbinden (een simpel voorbeeld is een touw of een stok tussen de twee massa’s). Met deze concepten op zak concludeert Hertz: From it, together with the admitted hypothesis of concealed masses and the normal connections, we can derive all the rest of mechanics by purely deductive reasoning. [From these axioms] the general properties of force must clearly follow as a necessary consequence of thought from the fundamental law’[a, 28]. In de rest van het boek probeert Hertz deze deductie tot stand te brengen. Dit onderdeel is zeer abstract en Hertz geeft geen enkel praktisch voorbeeld. Na een nauwkeurige bestudering blijft de volgende vraag bestaan: hoe weet men waar je de onzichtbare massa moet plaatsen om een bepaalde kracht te kunnen nabootsen? Toch maakt een nadere beschouwing ook veel duidelijk. Ik zal de inhoud in grote lijnen schetsen aan de hand van een boek genaamd ‘Mechanistic Images in Geometric Form’[b], vrij recent geschreven door professor Lützen, te Kopenhagen. Lützen vat de theorie als volgt samen: The most distinguishing feature of Hertz’s Mechanics is that it only operates with three fundamental concepts, namely time, space and mass. The concept of force (or energy) that is assumed as a fourth independent fundamental concept in other contemporary treatises of mechanics is defined a posteriori by Hertz. However, in order to eliminate force as a fundamental concept Hertz had to introduce two kinds of mass: ordinary of tangible (visible) mass and hidden or concealed mass. The first kind of mass is the one we can observe directly with our sensort apparatus. The aim of mechanics is to describe its motion. The concealed mass, on the other hand, is only felt through its interaction with ordinary mass. The material points of the system (visible as well as concealed) are allowed to interact through so-called rigid constraints. […] This includes connections through imaginary rods and rolling but also many other types of constraints [b, 3]. Lützen bevestigt dat deze connecties de interactie tussen de materie veroorzaken. Hij vervolgt: 53 [b, 4] Het was Hertz dus blijkbaar gelukt om de potentiële energie te schrappen en deze te vervangen door kinetische energie van de onzichtbare massa. Aangezien Hertz elk deeltje (zichtbaar en onzichtbaar) een massa en een snelheid had gegeven, kon hij de kinetische energie (0.5mv2) probleemloos posteriori berekenen. De potentiële energie, die de veroorzaker is van krachten, hebben we nu echter niet meer nodig. KRACHTEN Het is pas op bladzijde 116 dat Lützen antwoord geeft op de vraag hoe het mogelijk is om krachten na te bootsen en waar men de onzichtbare massa’s moet plaatsen. Verwacht er niet te veel van: [b, 116] Hertz had beweerd dat zijn theorie gelijkwaardig was aan die van Newton, maar de theorie van Newton heeft weinig moeite met het opstellen van bijvoorbeeld een zwaartekracht of een elektromagnetische kracht. In de theorie van Hertz moeten we echter nog maar zien of deze krachten wel in zijn systeem uit te drukken zijn. Lützen schrijft: ‘Hertz did not solve the crucial problem of constructing a concealed system that would account for the empirically known forces of nature such as gravitation and electromagnetic forces. [He] had argued that both types of forces could be described in terms of field theories […]. However, the question still remained, how to construct a hidden mechanical system (the ether) that could carry these fields’[b, 266] De theorie van Hertz is hierdoor van weinig praktisch nut. Hij verdedigde zich hiertegen door te stellen dat zijn werk puur theoretisch is en nooit bedoeld is om van praktisch nut te zijn. Als hij alleen al kon laten zien dat de mechanica van Newton in principe ook in zijn elegantere aannames was te schrijven had hij zijn doel bereikt. Hij heeft dan laten zien dat de keuze van aannames in principe een creatieve aangelegenheid is en dat inderdaad meerdere sets van aannames (‘images’) aangewend kunnen worden voor het beschrijven van een set fenomenen. 54 Lützen geeft ons ook toelichting op de keuze van de ‘constraints’ in plaats van de gebruikelijke kracht. Het begrip kracht in de theorie van Newton was een differentiaalvergelijking, F = m d2x/ dt2, hetgeen afhangt van de tijd. De ‘constraints’ zijn daarentegen alleen afhankelijk van een geometrische connectie tussen de massa’s en niet van de tijd. Ook dit was een voordeel van de mechanica van Hertz. Krachten zijn dynamisch (van de tijd afhankelijk), terwijl deze ‘connecties’ geometrisch zijn (niet van de tijd afhankelijk)[b, 118]. DE ETHER Zoals we in het vorige hoofdstuk hebben gezien was de ether voor de meeste fysici in de 19de eeuw een essentieel ingrediënt voor het beschrijven en begrijpen van de natuurlijke fenomenen. Hertz was geen uitzondering en zag het probleem van de ether zelfs als het belangrijkste onopgeloste probleem van de natuurkunde van zijn tijd. Hij schreef: ‘Take away from the world electricity, and light disappears; remove from the world the luminiferous aether, and electric and magnetic actions can no longer traverse space. It is therefore certain that all space known to us is not empty, but is filled with a substance, the aether, which is able to support waves’ [h, 144]. Ergens anders schreef hij ‘Is space really empty? Do not the phenomena of light compel us to regard it as filled with something?’ [h, 144] . Hertz geloofde dat de zee van onzichtbare massa in zijn theorie hem wellicht een mechanisch ethermodel kon leveren. In 2001 schreef Mulligan hierover: ‘The added complications introduced by these hidden masses seem to have been outweighed, in Hertz’s view, by the need to construct a mechanical model of the ether, which could then be used to explain electromagnetic and other physical phenomena’ [h, 151]. FitzGerald (1851–1901) had dit al veel eerder door: ‘Hertz sees in all actions the working of an underlying structure whose masses and motions are producing the effects on matter that we perceive, and what we call force and energy are due to the actions of these invisible structures, which he implicitly identifies with the ether’ [h, 152]. Toch gaf Hertz aan dat zijn identificatie van de onzichtbare massa en de ether niet een noodzakelijkheid was voor de geldigheid van zijn theorie. Ook zonder de ether blijft zijn theorie in tact en dit was de reden dat hij in de formele uiteenzetting van zijn theorie niet verwijst naar de ether, maar alleen in de interpretatie van zijn mechanica. Er waren nog twee andere filosofische voorkeuren die Hertz wilde koppelen aan zijn theorie. Het eerste was het verdrijven van de ‘action-at-a-distance’ uit de natuurkunde. De geometrische mechaniek van de connecties vervingen de ‘mysterieuze’ krachten die op een afstand werkte. Maar omdat men ook connecties kon construeren tussen heel ver gelegen objecten (bijvoorbeeld twee sterren) kon de actie-op-een-afstand niet helemaal uit zijn theorie verdreven worden. Boltzmann merkte op dat in zijn poging de krachten op afstand te verwijderen, hij ‘connections acting at a distance’ [b, 284] toevoegde. Een tweede voorkeur was de volledige mechanisatie van de natuurkunde, hetgeen hij als het hoofddoel van de natuurkundige zag. Dit idee is nauw verbonden met zijn idee om de ether aan zijn theorie te koppelen. Als men namelijk een mechaniek van de ether kon vinden, dan had men ook een mechaniek voor de voortplanting van elektromagnetische golven en wellicht ook voor de zwaartekracht. Verder dan dit kan ik niet gaan zonder gebruik te maken van de formelere eigenschappen van de theorie. Deze zullen we dan ook gaan behandelen. 55 EEN MEER FORMELE AANPAK Het begrip ‘constraint’ of ‘connection’ dat Hertz gebruikte stamt uit de 18de eeuw. Destijds probeerde men een mechanica te creëren voor systemen die bepaalde beperkingen opgelegd kregen. De volgende formules komen uit het werk van Lützen [b]. Als we een verzameling van n deeltjes beschouwen in drie dimensionale ruimte, dan hebben we 3n vrijheidsgraden en deze kunnen bijvoorbeeld beperkt worden met behulp van een dergelijke formule: ‘Constraints’ die aan deze vergelijking voldoen werden door Hertz ‘holonomic constraints’ genoemd. Niet alle vormen van ‘constraint’ kunnen hier echter mee uitgedrukt worden. Een generalisatie hiervan kan dit echter wel. Deze wordt gegeven met behulp van een homogene eerste orde differentiaal vergelijking: We kunnen beide ‘constaints’ natuurlijk ook schrijven met behulp van gegeneraliseerde coördinaten: Een ander begrip dat we nodig zullen hebben is de zogenaamde ‘Principle of Virtual Work’. Dit principe vertelt ons dat een systeem in equilibrium is, als de totale arbeid van de krachten P, virtueel verplaatst in de richting van P, gelijk is aan nul: Ook moeten we u attenderen op ‘d’Alembert’s Principe’. Een systeem zonder ‘constraints’, onder invloed van verschillende krachten P, wordt als volgt beschreven: Als er echter wel ‘constraints’ zijn, dan vinden we een andere versnelling, maar toch zullen de krachten ‘P – ma’ in het systeem in equilibrium blijven. Gecombineerd met het ‘Principle of Virtual Work’ vinden we dan ‘d’Alembert’s Principe’: Een andere benodigdheid zijn de ‘Lagrange Multipliers’. Lagrange vermenigvuldigde elk van de vergelijkingen in de som van de gegeneraliseerde ‘constraint’ met een tweede som werkend op een 56 arbitrair getal Qk. Qk wordt een zogenaamde Langrange Multiplier genoemd. De formule die dan ontstond telde hij op bij de formule voor de ‘Principle of Virtual Work’: Hieruit vinden we dat: Uit deze formules vinden we dat de som in de bovenstaande formule gelijk is aan min de ρde component van de kracht. Het is dus een reactiekracht, veroorzaakt door de ‘constraint’. Hiermee had Lagrange vanuit het concept kracht een manier gevonden om deze krachten uit te drukken met behulp van ‘constraints’. Volgens deze redenering zijn de ‘constraints’ dus het resultaat van krachten die het systeem beperking in hun bewegingen. Lützen vertelt dat Hertz de omgekeerde route volgde: ‘Hertz conversely used the method of multipliers to introduce the concept of forces. In his image of mechanics there are a-priori no forces, but there are constraints’. Gauss gaf een re-interpretatie van d’Alembert’s Principle [e, H2.4]. Stel dat op tijdstip t de posities en de snelheden, maar niet de versnellingen gegeven zijn voor alle deeltjes in het systeem. Met behulp van de Taylor benadering, vinden we dan de positie op een tijdstap τ later: Omdat de eerste twee termen al vast stonden, kunnen we de positie op tijdstip t+τ variëren door de versnelling te variëren: Nu gebruiken we d’Alembert’s principe met een virtuele verplaatsing van de posities r(t+τ). Omdat we weten dat: vinden we dat: Als de krachten ook al gegeven zijn (en we deze dus niet kunnen variëren), vinden we 57 Dit kunnen we ook schrijven als: Als we aannemen dat de massa van alle deeltjes gelijk is, dan kunnen we de vrijheid in deze formule gebruiken om de term ½ te verruilen voor de term 1/mυ, waarbij mυ een derde van deze constante massa is (een derde, omdat elk van de drie ruimtelijke dimensies deze term krijgt aangewezen): Dit is het zogenaamde ‘Principle of least constraint’ dat Gauss in 1829 formuleerde. Het principe vertelt ons dat een systeem met ‘constraints’ zo beweegt dat het zo min mogelijk afwijkt van de vrije beweging van het systeem. Hertz gebruikte een speciaal geval van het ‘Principle of least constraint’ van Gauss in zijn ‘Principle of least curvature’. In dit geval werken er geen externe krachten op het systeem en zijn alle massa’s gelijk. We kunnen Z dan schrijven als: Zoals we straks zullen zien is een lijn element ds in de mechanica van Hertz te schrijven als: Tevens geldt: Als we d2x/ds2 schrijven als x’’, dan ziet de definitie van kromming c er als volgt uit (zoals we ook straks zullen beargumenteren): We kunnen x’’ als volgt uitschrijven: 58 We kunnen dan mc2 als volgt opschrijven: Met behulp van de eerder genoemde formules voor het lijnelement vinden we dan: Dit kunnen we verder versimpelen tot: Gebruikmakend van het speciale geval van de ‘Principle of least constraint’, vinden we uiteindelijk: Een minimalisering van c, met behulp van het variatieprincipe, geeft ons ‘the trajectory of least curvature’ : Dit is het ‘minst gekromde’ of het ‘rechtste’ (straightest) pad, dat recht doet aan de opgelegde ‘constraints’. De fundamentele wet van Hertz vertelt ons dat een systeem waar geen externe krachten op werken de baan van de minste kromming zal aannemen. Het zegt echter niks over het geval waarin er wel externe krachten werken en het blijkt dat dit principe dan niet geldig is. Hertz laat wel zien dat het principe van Gauss en die van d’Alembert wel geldig blijven. Ook zullen we vaak gebruik maken van Langrange’s ‘Equation of Motion’: Voor L = T – U en met de extra conditie dat de afgeleide van U naar q gelijk is aan P en U zelf onafhankelijk is van de afgeleide van q, wordt deze formule vaak omgeschreven tot: 59 LIJN ELEMENT Als we een collectie van deeltjes hebben met elk een begin en een eindpositie (resp. x en x’), dan zouden we de afstand tussen de twee configuraties kunnen definiëren als [b, 147]: Dit was echter niet wat Hertz deed. Hij koos voor: Het lijkt vreemd om de massa te verwerken in een afstandsbegrip, maar Hertz had goede redenen. Als we twee punten nemen en deze op dezelfde coördinaat plaatsen, dan kunnen we het totaal opvatten als twee punten of als één punt. Als we de gebruikelijke ‘s’ nemen, dan vinden we een verschillend resultaat als we kiezen voor de een of de andere situatie. De ‘s’ van Hertz heeft hier geen last van. Een ander voordeel is dat we met deze keuze de kinetische energie op dezelfde wijze kunnen schrijven als in het gebruikelijke geval (dit zullen we later zien). Een oneindig kleine verplaatsing geven we weer met: Dit is het ‘fundamentele lijn element’ dat Hertz gebruikte in zijn theorie. Hij definieerde ook een versie voor gegeneraliseerde coördinaten: VECTOREN Hertz introduceerde ook vectoren in zijn mechanica. Lützen merkt op: ‘Ultimately, mechanics is not only about geometric displacements, but about kinematic concepts involving time, such as velocity, momentum, and acceleration’ [b, 173]. Om deze termen toch in een geometrische manier te kunnen beschrijven maakte hij gebruik van zijn originele vector definitie. Een vector is een verplaatsing van het systeem in een bepaalde richting. De richting van een vector stelde hij zich voor als een oneindig kleine verplaatsing in de desbetreffende richting. Hertz schreef [a, 121]: Every vector quantity with regard to a system can be represented geometrically by a conceivable displacement of the system. The direction of the displacement representing it is called the direction of the vector quantity. Hertz introduceerde ook de zogenaamde ‘reduced components’. Lützen schrijft: ‘In an ordinary rectangular coordinate system the coordinates of a vector can be found by projecting the vector orthogonally onto the coordinate axes. However, when the coordinate system is not rectangular, this 60 no longer holds true. This is the background for Hertz’s introduction of the reduced components’[b, 173] . Als we de gewone componenten dq noemen en de gereduceerde componenten noteren met een streep boven de q, dan vinden we de volgende relaties tussen de twee: De matrix bρσ is de inverse van de matrix aρσ. Een coördinatentransformatie van q naar q’ kunnen we noteren als: Voor de gereduceerde componenten vinden we dat de vectoren transformeren als covariante vectoren: Een afgeleide waarbij een coördinaat q gevarieerd wordt noemde Hertz ∂q en de afgeleide naar de gereduceerde coördinaat noemde hij ∂p. KROMMING Hiervan uitgaande construeerde Hertz begrippen als hoek, kromming en ‘straightest path’. Met deze begrippen kon hij namelijk op een wiskundige manier zijn enige fundamentele wet uitdrukken. Om de hoek uit te drukken tussen twee paden maakte Hertz gebruik van de volgende oude wijsheid: Proposition. The distance between two positions of a system is always smaller than the sum of the distances of the two positions from a third [a, 55]. Hij kon hiermee een driehoek ABC construeren. De hoek A van de driehoek definieerde Hertz als de hoek tussen de verplaatsing van een punt van A naar B en de verplaatsing van een punt van A naar C. Hij noemde dit ook wel de ‘difference in direction’ van de twee paden. De hoek tussen twee verplaatsingen s’ en s’’ noemde hij (s’s’’). We vinden: x is de beginpositie en x’ en x’’ de respectievelijke eindposities. Om ook de situatie te kunnen beschrijven waarbij de beginposities van elkaar verschillen, gebruikte Hertz het begrip ‘parallel transport’. Hij vond hiermee: 61 , waarbij x0 een ander beginpunt is. Voor een oneindig kleine verplaatsing vinden we: Voor het begrip ‘kromming’ was ook het begrip ‘pad’ nodig. Hertz beschreef een pad als ‘the simultaneously considered aggregate of positions which a system occupies in its passage from one point to another’ [a, 164]. Deze definitie in opmerkelijk in de zin dat het wederom een referentie naar de tijd vermijdt. Hertz wilde zijn mechanica geheel geometrisch houden. Met behulp van een pad element, kunnen we de kromming kwantificeren. Lützen schrijft: An element of a path is a portion of a path limited by two infinitely near positions, and the direction of a path in a given position is defined as the direction of a path element at this position. The path is called straight if it has the same direction in all its positions. If it is not straight, the direction will change and its rate of change with regard to the length of the path is what Hertz called the curvature[b, 165]. Zoals we al eerder hebben opgemerkt, noteren we deze kromming met de letter c. ε is een vector die zich bevindt op het pad s en in de richting van dit pad wijst. Als dε de hoek is tussen de richting van het pad aan het begin van het element en de richting aan het eind, dan vinden we: Omdat de elementen van ε bestaan uit xυ’=dxυ/ds, vinden we dat de elementen van c gelijk zijn aan xυ’’. De elementen van een vector X zijn op de volgende wijze gerelateerd aan de waarde van een vector S [c]: Een inprodukt van c met zichzelf kan geschreven worden als de waarde van c in het kwadraat. Daarom geeft deze formule ons de formule die we al eerder zijn tegengekomen voor de kromming [b]: In gegeneraliseerde coördinaten vinden we: 62 KINEMATISCHE CONCEPTEN Hertz beschouwde de waarde van de snelheid van een systeem, v = ds/dt, als de ‘instantaneous rate of motion’. In snelheidsvector wordt geschreven met de gotische letter v. Om dit te vinden moeten we de waarde van v vermenigvuldigen met de eenheidsvector in de richting van de snelheid, genoteerd met de gotische letter D [c]: Voor v2 vinden we dat [b]: Energie en impuls zijn dan als volgt te vinden: We zien hier dat de energie gegeven wordt door de gebruikelijke formule en dit is een direct gevolg van de keuze van het lijnelement. In gegeneraliseerde coördinaten vinden we: De gewone en de gereduceerde afgeleiden leveren ons het volgende: Omdat er geen kinetische energie is in de mechanica van Hertz kunnen we de E vervangen door L. De eerste term is dan gelijk aan de gegeneraliseerde impuls in de traditionele mechanica. De versnellingsvector wordt geschreven als de tijdsafgeleide naar de versnellingsvector [c, 47]: We kunnen dit als volgt opdelen in een tweetal termen: Dit zijn de component in de richting van het pad en de component loodrecht op het pad. In gegeneraliseerde coördinaten vinden we: 63 Dit is ook te schrijven als: In dit geval geldt dat als E=T en mf = P, we de Lagrangiaan vinden uit de traditionele mechanica. EEN VRIJ SYSTEEM Laten we nu een vrij systeem bestuderen (een systeem met alleen interne en geen externe krachten). Volgens tweede soort ‘constraints’ geldt dat de afgeleiden x’ moeten voldoen aan: Hieruit vinden we dat x’’ aan de volgende vergelijking moet voldoen: Laten we x en x’ (het beginpunt en de richting) constant houden en x’’ variëren om zo de minimale kromming c vinden. Als we de vergelijkingen in de voorgaande formule allemaal vermenigvuldigen met de Lagrange multiplier Ξ en dit toevoegen aan de formule van de kromming, dan vinden we: In het gegeneraliseerde geval vinden we: Als Π Lagrange multipliers zijn, dan schrijven we de bijbehorende krommingformule als volgt: 64 Hertz merkt op dat de totale massa en de totale snelheid van het gehele vrije systeem constant blijft. Dit betekent dat de kinetische energie behouden is. Ook kon Hertz de bewegingsvergelijkingen voor dit systeem opstellen. Voor het gemak maakt Hertz daarvoor even gebruik van de tijd als een onafhankelijke variabele. Met v = ds/dt, vinden we dat: Als we X schrijven in plaats van en Q in plaats van vergelijkingen vermenigvuldigen met mv2, dan vinden we: en de bovenstaande De laatste formule kunnen we echter veel compacter schrijven met behulp van de formule voor f, die we eerder zijn tegengekomen: Uit deze formule kunnen we de ‘equations of motion’ vinden: Dit is wederom gelijk aan Lagrange’s vergelijking in het traditionele geval, maar in plaats van de kracht zien we een negatieve ‘constraint’! Een systeem dat niet vrij is, wordt door Hertz beschreven met de aanname dat elk onvrij systeem een deel is van een groter vrij systeem. Dit systeem zullen we hier niet verder behandelen. MODIFIED LAGRANGIAN Nu zijn we toe aan het idee van Thomson en Helmholtz om de potentiële energie van een systeem onder te brengen als de kinetische energie van een onzichtbaar systeem dat met dit systeem in contact staat. Dit kan met behulp van de zogenaamde ‘cyclische coördinaten’. Dit zijn coördinaten die niet expliciet in de energie vergelijking van een systeem voorkomen en dus ook niet in de Lagrangiaan. In 1877 werden deze coördinaten gebruikt door Routh om een zogenaamde ‘modified lagrangian’[b, 208-210] te construeren. Routh beschouwde een r aantal coördinaten: 65 Routh koos ervoor om de coördinaten q van k+1 tot r cyclisch te maken, maar hun tijdafgeleiden niet. Dit betekende dat: En hieruit concluderen we dat: Met deze formule kon hij de afgeleide van q schrijven in termen van c (waarbij c een constante is en niet de kromming). De nieuwe Lagrangiaan, waarbij q te schrijven is in termen van c, noemde hij L2. Voor de partiële afgeleiden van de coördinaten 1 tot k geldt dan: We moeten nu een manier vinden om de functie L2 om te schrijven in een functie die afhankelijk is van ck voor alle cyclische variabelen. Dit kan gedaan worden met de zogenaamde Legendre transformatie. Een Legendre transformatie gaat uit van een functie f(x). De infinitesimale versie hiervan definiëren we als volgt: We definiëren ook een functie g(u), het eindproduct van de Legendre transformatie: De infinitesimale versie schrijven we als: Uit deze vergelijkingen vinden we: 66 In ons geval kiezen we x en u als volgt: Voor de functie f vullen wij L2 in en voor de nieuwe functie g gebruiken we de zogenaamde ‘modified Lagrangian’ L’: Gebruikmakend van de ‘equations of motion’ en de bovenstaande formules voor L’, en de afgeleiden van L2 vinden we dat voldaan moet worden aan: De structuur van deze vergelijkingen zijn gelijk aan die van de bewegingsvergelijkingen van Lagrange. Twee inhoudelijke verschillen zijn echter dat L hier vervangen is door L’ en dat ρ alleen loopt van 1 tot k en niet tot r. We hebben dus een Lagrangiaan L’ gevonden die onafhankelijk is van de cyclische variabelen q en hun afgeleiden! Het is deze Lagrangiaan die door Helmholtz en Thomson gebruikt werd om de kinetische energie van de verborgen materie uit te drukken als de potentiële energie V’. Stel dat we een systeem hebben met de variabelen q1 tot en met qr en hun afgeleiden, maar we geen weet hebben van de cyclische coördinaten qk+1 tot qr. Wij kunnen dan de kinetische energie bepalen van het zichtbare deel. Dit is echter niet de kinetische energie van het totale systeem. We noemen deze kinetische energie T’. Als we ook een Lagrangiaan L’ kunnen vinden voor dit subsysteem, vinden we ook potentiële energie: T’ – L’ = V’. Lützen schrijft: ‘However, we may have been deceived by our lack of knowledge of a certain number of hidden cyclic coordinates so that what we believed was the Lagrangian, was in fact only the modified Lagrangian. What we mistook for potential energy may therefore have been the result of kinetic energy due to the hidden coordinates’[b, 210]. We zullen Thomson’s uitwerking van dit idee bestuderen. Thomson bestudeerde een systeem met alleen kinetische energie. Er geldt dan dat L = T. Hij verdeelde T in twee componenten: Het eerste component is de kinetische energie van het zichtbare deel en het tweede van het cyclische deel. Omdat geldt dat: vinden we uit de definitie van L’ dat: 67 De afgeleiden van de cyclische coördinaten worden op de volgende manier uitgedrukt als functie van c: Dankzij de gemodificeerde bewegingsvergelijkingen vinden we: Dit staat geschreven in dezelfde vorm als een bewegingsvergelijking met kinetische energie T1 en potentiële energie Tcycl, terwijl in werkelijkheid het systeem slechts kinetische energie bevat! EEN VOORBEELD Dan zijn we eindelijk toe aan een voorbeeld. We bekijken de volgende situatie [b, 211]: Het kan bewezen worden dat de relatie tussen de lengte van de stok en de hoek ‘ω’ gegeven wordt door: De totale energie bedraagt dan: 68 De energie is ook te schrijven als: De hoek ф is in ons geval de cyclische variabele, omdat het niet in de energie vergelijking terugkomt. Omdat de afgeleide van ω behoort tot het zichtbare systeem en die van ф tot het onzichtbare systeem, kunnen we de kinetische energie van het hele systeem in tweeën opsplitsen. De eerste twee termen behoren dat tot T1 en de derde tot Tcycl. We kunnen de laatste term ook als volgt uit drukken, met behulp van de gegeneraliseerde impuls: We vinden dan dat: T is gelijk aan L, maar wij zijn echter geïnteresseerd in het vinden van de gemodificeerde Lagrangiaan L’ van het zichtbare subsysteem. We hadden eerder gevonden dat: We vinden dus: We hebben dus een systeem L’, waarbij de kinetische energie gelijk is aan: En de potentiële energie aan: Het blijkt dus echt mogelijk om potentiële energie te schrijven als de kinetische energie van onzichtbare materie! Hertz zag in dat er in dit voorbeeld toch een addertje onder het gras zat. Zowel Thomson als hijzelf beschouwde de eerste term als de kinetische energie van de zichtbare stok en de derde term als de potentiële energie[b, 232]. Zoals we hebben gezien groepeerde Thomson de tweede term ook bij de kinetische energie van het zichtbare systeem. Hertz had echter aangenomen dat het mogelijk was 69 om de totale massa van het zichtbare systeem te kunnen bepalen en we dus in dit geval ook de kinetische energie van het zichtbare deel van het systeem kunnen bepalen: Omdat deze ‘echte’ kinetische energie van het zichtbare systeem afwijkt van de ‘schijnbare’ kinetische energie T’, kunnen we afleiden dat er een onzichtbaar systeem moet bestaan dat deze extra kinetische energie veroorzaakt. In dat geval laat het onzichtbare systeem zich niet alleen zien als potentiële energie, maar ook als een extra term in de kinetische energie. Dit kunnen we verhelpen door aan te nemen dat de tweede term verwaarloosbaar klein is in vergelijking met de andere twee termen. Dit kunnen we doen door de massa van het onzichtbare systeem klein te maken, maar dit vermindert het effect van deze massa op het zichtbare systeem. Dit kan weer verholpen worden door de snelheid van de onzichtbare massa’s erg groot te maken. Dit is dus een duidelijk gebruik van een benadering in de theorie van Hertz. Sommige commentatoren, die de connectie met de ether-theorie met de mechanica van Hertz behandelden, interpreteerde dit als eigenschappen van de ether. De ether bestond volgens deze theorie dus uit heel kleine massa’s, die enorm snel rondbewogen en zo de waargenomen krachten veroorzaakten. LIOUVILLE EN DE CYCLISCHE COORDINATEN In de 19de eeuw beschouwde Liouville[b, 217-18] een conservatief systeem S, dat beschreven kon worden met de coördinaten q1, . . . , qk. Het systeem had een kinetische energie T en een potentiële energie U. Daarna construeerde hij een nieuw systeem S’, beschreven met q1, . . . , qk en een cyclische coördinaat qr. Het nieuwe systeem had alleen kinetische energie T’, gegeven door: De bewegingsvergelijkingen voor S’ werden: en Uit de laatste formule blijkt dat de afgeleide van q gedeeld door U gelijk is aan een constante. Als we deze constante gelijk aan 1 zetten, dan vinden we: Dit is exact gelijk aan de Lagrange vergelijkingen voor S. Dit is een omgekeerde versie van de theorie van Thomson. Deze theorie is toegepast in een voorbeeld uit 1916 gemaakt door ene Paulus. (We zullen straks de constante gelijk zetten aan C en dit levert dus een term C2U in de bovenstaande vergelijking). 70 PAULUS EN KRACHTEN-SIMULATIE Paulus beschouwde een massa m, die langs een z-as kon bewegen en zich op hoogte z bevond [b, 27476] . Vanaf deze massa loopt een massaloos koord via de katrol naar de massa op afstand van de z-as. Het katrol bevindt zich altijd op dezelfde hoogte als de massa . De massa roteert om de z-as en met deze massa roteert een kromme = f( ) mee. De hoek, gemeten vanaf de x-as, wordt genoteerd met de letter ф. Als 0 en 0 de coördinaten zijn van en als z = 0, dan vinden we: Met de eis dat op de functie f blijft wordt dit: Paulus gebruikte de hoek ф en de afstand kinetische energie wordt gegeven door: als de gegeneraliseerde coördinaten van . De Met: In plaats van de afgeleide van vinden we in de derde term eigenlijk de afgeleide van - 0, maar omdat 0 constant is, wordt deze afgeleide nul. Omdat klein is en de rotatiesnelheid van de onzichtbare massa groot (vanwege de benadering van Hertz), kunnen we de eerste term verwaarlozen. De tweede term gebruiken we voor de potentiële energie en de derde voor de kinetische energie van de zichtbare massa. We houden over: Paulus maakte gebruik van de theorie van Liouville. Alleen stelt hij de constante nu niet op één maar op C. In de Lagrange vergelijking van Liouville vinden we dan de term C2V. In het geval van Liouville 71 hadden we een potentiële energie V, maar in dit geval wordt de potentiële energie dus gegeven door C2V = U(z). Er geldt dat: U correspondeert met de potentiële energie, werkend op de zichtbare massa m, gegeven door: Omdat afhankelijk is van z, bestaat er ook een getransformeerde functie U-1, die afhankelijk is van U(z), oftewel: Hiermee vinden we een nieuwe uitdrukking voor f: Als we bijvoorbeeld kiezen dat: Dan kunnen we U-1 vinden en dit invullen voor z: Als γ gelijk is aan GMm, dan is U de zogenaamde zwaartekrachtspotentiaal. We kunnen echter niet elke U kiezen. We moeten ervoor zorgen dat de rechterkant van de potentiaalvergelijking altijd positief is. Maar Lützen merkt op: ‘To be sure, one can always add or subtract an arbitrary constant from the function U so that one can reproduce negative potentials as well, but only if they remain bounded from below. […] k […] may be chosen arbitrarily large, but once it has been chosen z cannot obtain values less than γ/k’[b, 276]. Dit en het vorige voorbeeld hebben een groot nadeel, dat voor veel kritiek heeft gezorgd. De mechanismes die gebouwd worden om te krachten te simuleren zijn ad hoc en elke interactie vereist een eigen set van mechanismen. De theorie heeft duidelijk behoefte aan een natuurlijke manier om de mechanismes te construeren, maar deze is tot dusver nog niet gevonden. ONTVANGST VAN DE MECHANICA VAN HERTZ De theorie van Hertz kreeg veel aandacht onder de filosofen, maar ook onder vooraanstaande fysici. Velen prezen het systeem van Hertz, maar er waren ook veel nadelen. Fitzgerald schreef 72 bijvoorbeeld: ‘Among the merits they counted its philosophical sophistication, the rigorous and elegant mathematical structure, and the avoidance of forces acting at a distance. As its main weakness they mentioned its complete neglect of the question of how to construct the hidden systems that would account for the observed motions in the physical world’ [b, 278]. Helmholtz schreef: ‘Unfortunately he has not given examples illustrating the manner in which he supposed such hypothetical mechanism to act; to explain even the simplest cases of physical forces on these lines will clearly require much scientific insight and imaginative power’ [b, 278]. Boltzmann was ook een voorstander, maar zag ook in dat er nog veel problemen aanwezig waren. Hij schreef daarom: ‘The Hertzian mechanics seems to me to be more like a program for a far future’[b, 285]. VOORZETTING VAN DE MECHANICA VAN HERTZ Naast het werk van Paulus, waren het vooral Lorentz, Ehrenfest en de wiskundige Brill, die een poging waagde om de theorie van Hertz te bevorderen. De contributie van Ehrenfest [d] en Lorentz [c] staan hieronder beschreven. LORENTZ Een verdere uitwerking of liever een alternatief op de theorie van Hertz, werd geformuleerd door Lorentz. Lorentz was van mening dat Hertz een heel elegante grondslag van de mechanica had bedacht, maar met de onzichtbare massa kon Lorentz niet overweg. Hij onderzocht in een artikel genaamd ‘Some considerations on the principles of dynamics, in connexion with Hertz’s Principien der mechanik’[c] in hoe verre deze elegantie zou verdwijnen als men vasthield aan het gebruikelijke krachtsprincipe. Hij schreef: [b, 286][c, 36] Uitgaan de van de beginselen van Hertz (minus de onzichtbare materie) vond Lorentz een vergelijking die afhankelijk was van de gebruikelijke externe kracht. Als deze kracht in zijn vergelijking op nul werd gezet, dan reduceert deze formule weer tot de fundamentele wet van Hertz. Het is dus een generalisatie van deze wet voor externe krachten. Ook laat hij zien dat hij ‘Hamilton’s Principle’ en de ‘Principle of Least Action’ kan afleiden uit zijn generalisatie. Hieruit concludeert Lorentz dat er geen noodzaak is om in het systeem van Hertz de kracht te vervangen voor onzichtbare massa. Het systeem werkt ook goed met krachten [f, 177-78]. EHRENFEST In 1904 schreef Ehrenfest zijn dissertatie [d]. Hij liet daarin zien dat hij de methode van Hertz kon gebruiken om de ‘equations of motion’ te vinden voor een ‘incompressible fluid’ en ook de vergelijkingen waarin een object in deze vloeistof beweegt. Om dit te doen moesten de systemen van punten die Hertz gebruikte gegeneraliseerd worden naar een continue massaverdeling. 73 Het belangrijkste dat Ehrenfest moest doen was het vinden van een manier om het begrip druk uit te kunnen drukken zonder het begrip kracht te gebruiken. Hij moest in plaats daarvan een ‘constraint’ vinden die deze druk kan representeren. De ‘constraint’ die hij gebruikte is de zogenaamde ‘equation of incompressibility’: Met behulp van Lagrange multipliers vond hij uiteindelijk de volgende vergelijking: Ehrenfest toonde aan dat λ de eigenschappen had die we associëren met het begrip druk. Zo voldoet λ aan de conditie ‘ρa = - λ’ en op zogenaamde ‘free surfaces’ (oppervlakken waar geen kracht wordt uitgeoefend) gaat λ naar nul, zoals ook van de druk verwacht wordt. VIJF PRINCIPES Hertz beweerde dat hij maar drie ‘fundamental conceptions’ (tijd, ruimte en massa) nodig had. Maar in feite verplaatste hij de dynamische kracht door zowel de geometrische ‘connecties’ als de onzichtbare massa. Beiden horen dus in zijn lijst van ‘fundamental conceptions’ te staan. Ik schreef professor Lützen het volgende: When in Hertz’s mechanics forces are replaced by 'rigid connections' and the effect of 'hidden masses', isn't this multiplying instead of reducing entities? Hij schreef terug: Of course this criticism was raised against Hertz. However, to Hertz the important thing is that the hidden masses are of the same kind as ordinary masses. Thus he did not have to introduce a new mysterious kind of entity (forces). In the introduction he did not comment on the introduction of connections at all. Lützen beschrijft hier de redenering van Hertz, maar deze redenering is niet vol te houden. De toevoeging van de ‘constraints’ is ook ‘mysterieus’ en wellicht nog wel mysterieuzer dan kracht. In een tweede mail probeerde ik de theorie als volgt samen te vatten: Although Hertz uses only one law, he extended his mass concept with hidden masses and replaced his force concept with constraints. The constraints are, just like force, mysterious (or metaphysical; they cannot be observed), although they reduce the dynamic aspect of force to geometry. The theoretical power lies primarily in the generalization of Helmholtz’s and Thomson’s inclusion of potential energy into the domain of kinetic energy. Lützen reageert kort maar krachtig: ‘Your ultra short characterization of Hertz's mechanics is fine’. 74 Hieruit kan ik niets anders concluderen dan dat Hertz vier ‘fundamental conceptions’ gebruikte, mits we accepteren dat onzichtbare massa geen nieuwe entiteit is. Als we dit niet accepteren worden het er maar liefst vijf. Mijn versie van de opsomming van de ‘fundamental conceptions’ van Hertz is als volgt: Ruimte, Tijd, Zichtbare Massa, Onzichtbare Massa en Rigid Constraints Dit commentaar staat echter niet het belangrijkste filosofische punt van de theorie van Hertz in de weg, namelijk dat van het ‘scientific image’. Dat nu blijkt dat Hertz niet 1 maar 2 ongebruikelijke entiteiten nodig had is filosofisch misschien zelfs wel gewenst (hoewel het een deel van de logische elegantie te niet doet, hetgeen zeker niet Hertz’s eigen voorkeur zou hebben). Twee bizarre entiteiten stellen de wispelturigheid van de menselijke beschrijvingen van systemen op een nog scherpere manier aan de kaak. Ook praktische nutteloosheid en het onvermogen om nieuwe voorspellingen te kunnen doen kunnen we Hertz vergeven, omdat zijn theorie slechts een filosofisch belang diende. Als we het over het simplificeren van de ‘fundamental conceptions’ hebben, wil ik graag nog even wijzen op Einstein die er maar twee nodig had: Ruimte-Tijd en Massa-Energie 75 DUHEM: HET KARAKTER VAN DE WETENSCHAP In 1906 schreef de wetenschapper en wetenschapsfilosoof Pierre Duhem een belangrijk boek over de filosofische kant van de natuurkunde en de wetenschap in het algemeen. Het werk heette: ‘The Aim and Structure of Physical Theory’[a]. Hij betoogde in dit werk dat een wetenschappelijke theorie niet in de eerste plaats ‘verklaart’, maar ‘classificeert’ of ‘ordent’. Een wetenschapper probeert een theorie zo simpel mogelijk te maken door het te baseren op een klein aantal aannames, waaruit de rest af te leiden is. Soms echter is de structuur die hierdoor ontstaat zo uniek dat de wetenschapper gaat geloven dat de classificatie een zogenaamde ‘natuurlijke classificatie’ is. Hiermee bedoelde hij dat de classificatie niet arbitrair is, maar een werkelijke relatie tussen werkelijke fenomenen beschrijft. De wetenschapper heeft echter geen logische argumenten om dit geloof te kunnen bevestigen. Hij hamert ook op het verschil tussen de vaak simplistische modellen en theorieën en de veel complexere realiteit en concludeert dat de eerste een benadering is van de laatste. Duhem ziet een historische benadering als de beste wijze om een wetenschap te begrijpen, omdat men dan in aanraking komt met de vaak niet triviale of vanzelfsprekende keuzes die in het verleden gemaakt zijn en nog steeds dominant zijn in de huidige theorieën. Het logische karakter van de theorieën kan dit volledigere begrip niet dekken. In dit werk geeft Duhem ook nog een serie interessante filosofische opmerkingen over wetenschappelijke vraagstukken. Een aantal zullen we hier kort de revue laten passeren. THEORETISCH Er zijn theoretische vraagstukken, die zich helemaal niet lenen voor de praktijk. Als we willen weten of een deeltje een cirkelbaan op het oppervlak van een kegel uitvoert, dan hoeven we theoretisch alleen maar te weten of het deeltje beweegt binnen een vlak parallel op de basis van de kegel (een voorbeeld is het rode pad in de onderstaande tekening). Praktisch gezien is dit echter niet te controleren. Een deeltje kan altijd een dergelijke kleine component hebben in de richting loodrecht op de parallelle vlakken, die niet meetbaar is, waardoor het deeltje langzaam maar zeker langs de kegel omhoog of naar beneden klimt. Duhem schrijft[a, 141]: Als voorbeeld geeft hij de poging van Laplace om aan te tonen dat het zonnestelsel stabiel is. 76 THEORIE EN EXPERIMENT ZIJN NIET TE ONDERSCHEIDEN Duhem schreef ook over het volgende belangrijke punt: ‘it is impossible to leave outside the laboratory door the theory that we wish to test, for without theory it is impossible to regulate a single instrument or to interpret a single reading’[a, 182]. Het is onmogelijk om de theorie te scheiden van het experiment: ‘the result of an experiment implies, in general, an act of faith in a whole group of theories’[a, 183]. GEDACHTE-EXPERIMENTEN Ook het gebruik van gedachte-experimenten kan wat subtiliteiten gebruiken. Een dergelijk experiment maakt niet gebruik van gevonden feiten om de geldigheid van een bepaald principe aan te duiden, maar een voorspelling van hoe het experiment zal aflopen en deze voorspelling is vaak op niets anders gebaseerd dan op het geloof in het principe zelf. Dit is dus een vicieuze cirkel. Om deze stelling op de proef te nemen heb ik de twee gedachte-experimenten die het eerst bij me opkwamen geanalyseerd. De eerste was het gedachte-experiment van Schrödinger’s kat. Schrödinger’s experiment, waarin een quantummechanisch effect gerelateerd wordt aan een macroscopisch effect, is juist gebaseerd op zijn idee over hoe quantummechanische effecten gerelateerd wordt aan macroscopische effecten. Men kan namelijk ook aannemen dat een quantummechanisch effect verdwijnt als hij in contact komt met de macroscopische wereld en dan treedt Schrödingers voorspelling helemaal niet op. Het is dus Schrödinger’s dat er macroscopische quantumeffecten bestaan, dat hem uiteindelijk doet concluderen dat er macroscopische quantumeffecten bestaan., Het tweede voorbeeld was de valproef van Galileo. Hij beschreef het zelf als volgt in zijn ‘Dialogue Concerning the Two Chief World System’[b, 63-64]: Salviati. If then we take two bodies whose natural speeds are different, it is clear that on uniting the two, the more rapid one will be partly retarded by the slower, and the slower will be somewhat hastened by the swifter. Do you not agree with me in this opinion? Simplicio. You are unquestionably right. Salviati. But if this is true, and if a large stone moves with a speed of, say, eight while a smaller moves with a speed of four, then when they are united, the system will move with a speed less than eight; but the two stones when tied together make a stone larger than that which before moved with a speed of eight. Hence the heavier body moves with less speed than the lighter; an effect which is contrary to your supposition. Thus you see how, from your assumption that the heavier body moves more rapidly than ' the lighter one, I infer that the heavier body moves more slowly. [...] One always feels the pressure upon his shoulders when he prevents the motion of a load resting upon him; but if one descends just as rapidly as the load would fall how can it gravitate or press upon him? Do you not see that this would be the same as trying to strike a man with a lance when he is running away from you with a speed which is equal to, or even greater, than that with which you are 77 following him? You must therefore conclude that, during free and natural fall, the small stone does not press upon the larger and consequently does not increase its weight as it does when at rest. Laten we nu Duhem’s hypothese checken. De algemene relativiteitstheorie van Einstein maakt gebruik van het empirische feit dat gravitationele massa gelijk is aan inertiële massa om de karakteristieke eigenschap van de zwaartekracht te benoemen (namelijk dat deeltjes van verschillende massa’s dezelfde valversnelling kennen). Waarom zou Einstein echter niet gewoon gestart zijn met Galileo, die hier uit logische overwegingen bewijst dat dit zo moet zijn? Is het hier niet gewoon onomstotelijk bewezen en hebben we het empirische bewijs nog wel nodig? We kunnen het logische bewijs niet gebruiken, omdat er een denkfout in zit. We zouden immers precies dezelfde argumenten kunnen ophouden als we de massa’s een negatieve lading geven en ze naar een positieve lading toe zouden laten vallen. In dat geval zouden we moeten concluderen dat alle ladingen even snel versnellen in een constant elektrisch veld, maar dat is onjuist. Galileo heeft dus ergens in zijn beredenering aangenomen dat massa een speciale eigenschap heeft waardoor het gelijk versnelt. Maar dit is nu net wat hij wilde aantonen! Stel dat we het combineren van de twee stenen voorstellen door een massaloos touw te binden tussen de twee stenen. In dat geval geldt inderdaad dat de kleine steen de grote steen zou afremmen, als de grote steen sneller zou vallen. Als we echter het hele systeem bekijken, dan kunnen we niet zomaar de massa’s bij elkaar optellen, omdat de situatie met het touw niet equivalent is aan de situatie waarbij we een grote steen hebben gecombineerd uit beide massa’s. Als we de krachten op de deeltjes nauwkeurig uitrekenen vinden we dat de kracht van de gecombineerde massa niet gelijk is aan die van de twee massa’s met een touw in het midden. Het is wel equivalent aan een situatie waarbij twee massa’s worden verbonden met een rigide stok. Ook in dat geval van verliest de grote massa inderdaad snelheid, doordat hij de kleine massa moet meetrekken, maar precies deze snelheid wint hij weer doordat de kleine massa zelf ook bijdraagt aan de beweging (hetgeen niet het geval is met een touw). Deze twee situaties zijn equivalent, los van het feit of de valversnelling afhankelijk is van de massa of niet. Vanwege dit laatste kunnen we ons ook voorstellen dat deze equivalentie ook geldt in het geval waarbij we ladingen beschouwen. Duhem beschrijft ook nog een ander soort gedachte-experiment: ‘there remains to be pointed out a form more illogical than all the others, namely, the absurd experiment. The latter claims to prove a proposition which is contradictory if regarded as the statement of an experimental fact’[a, 202]. Een absurde situatie ontstaat bijvoorbeeld als we het statement ‘er is geen elektriciteit in het binnenste van een geleidend lichaam in equilibrium’ beschouwen. We kunnen dit echter nooit testen, omdat we in de dat geval een testlichaam moeten inbrengen in het materiaal en hiervoor moeten we eerst een stuk materiaal weghalen om het lichaam te kunnen plaatsen, maar in dat geval meten we niet de elektriciteit in het materiaal, maar weer de lading aan het oppervlak. ONVERWERPBARE STATEMENTS Dan vraagt Duhem zich af: ‘are certain postulates of physical theory incapable of being refuted by experiment’[a, 208]. Zijn antwoord is positief. Sommige fundamentele hypotheses lijken in werkelijkheid meer op definities. We bekijken bijvoorbeeld het volgende statement: ‘een vrij vallend zwaar lichaam ondergaat een constante versnelling’[a, 209]: 78 Een ander voorbeeld is het principe van inertia. Dit begrip heeft geen betekenis als we geen reverentiepunt vaststellen, maar omdat we alleen in staat om relatieve beweging te zien, zijn we niet in staat dit punt te vinden. Zonder een dergelijk punt raakt het principe zijn betekenis kwijt. Ook kunnen we altijd een referentiepunt kiezen waarvoor geldt dat de beweging in kwestie uniform is. Een ander voorbeeld[a, 214] komt uit de scheikunde. Stel dat we een stof M onderzoeken. Tijdens de analyse wordt M opgesplitst in stoffen, wiens massaverhouding gegeven wordt door a : b. We zouden kunnen kijken of de verhoudingen tussen de twee massa’s gehele getallen opleveren (zoals Dalton deed). We kunnen echter altijd een getal x vinden waarbij de verhouding xa : xb een verhouding van gehele getallen oplevert. Als a : b gegeven is door bijvoorbeeld 1 : 1,25, dan vinden we 4 : 5. Als a : b gegeven wordt door 1 : 1,00001, dan vinden we 10.000 : 10.001. Deze vraag kan dus niet opgelost worden. 79 EINSTEIN: HET FOTON In dit stuk zullen we het ontstaan van het foton illustreren. HET ONTSTAAN VAN DE QUANTUM THEORIE In 1896 schreef Wilhelm Wien een formule op, die de energiedichtheid u van black-body straling op een bepaalde temperatuur en frequentierange kon vaststellen (de formules komen uit [a]): , waarbij α en β constant zijn. Zijn wet werkte alleen niet voor de lage frequenties en het was Planck die zijn formule dan ook aanpaste om ook de hoge frequenties te kunnen beschrijven: Nu had Planck de formule die overeenkwam met de data, maar kon hij deze formule ook afleiden vanuit fysische principes? Dit was de taak die Planck op zich nam. In zijn afleiding van Wiens vergelijking had Planck de aanname gemaakt, dat een zwart lichaam behandeld kan worden alsof het een collectie van lineaire, harmonische oscillatoren was. Met de elektrodynamica kon hij laten zien dat de energiedichtheid op een bepaalde frequentie proportioneel was aan de gemiddelde energie van de resonatoren. Hij had toen de gemiddelde energie bepaald met de thermodynamica, door de energie van een resonator te schrijven in termen van entropie. Maar als hij deze methode voor zijn eigen vergelijking gebruikte, kwam hij er niet uit. Hij besloot aan te nemen, dat de entropie voor een bepaalde staat proportioneel was aan de kans op die bepaalde staat (de hypothese van Boltzmann): met Sn als de entropie van een set van N resonatoren met totale energie En. Het aantal manieren, waarop de totale energie verdeeld kan worden over deze oscillatoren, was gelijk aan W. Planck merkte op dat als En een oneindig deelbare grootheid was, er een oneindige hoeveelheid verdelingen mogelijk waren. Planck volgde Boltzmann dan ook door aan te nemen dat En eindig deelbaar was. Het bestond uit een eindig aantal ‘energie elementen’, die hij ε noemde. Met deze aanname kwam hij verder. Hij kwam uit op de volgende formule: Dit wordt ‘Planck’s energy distribution law’ genoemd. Deze formule presenteerde hij in het jaar 1900. Zijn energie element ε was gelijk aan: Boltzmann had er altijd voor gekozen, om op een bepaald moment in zijn berekeningen, ε gelijk aan nul te zetten, maar dit was voor Planck in dit geval niet mogelijk; zijn energie bleef gequantiseerd. In 80 zijn artikelen van 1900 en 1901, is nergens op te merken, dat Planck ervan bewust was, dat zijn theorie het einde van de klassieke natuurkunde zou inleiden. De mogelijkheid was voor hem nog open om te geloven dat de energie van de individuele resonatoren, maar niet de energie van de straling, gequantiseerd was. Of dat ook de energie van de individuele resonatoren niet gequantiseerd was, maar alleen het totaal van de resonatoren en wederom niet de straling. Energie-quanta werden dus toegeschreven aan de resonatoren en niet aan de radiatie! Het was Einstein (en onafhankelijk ook Jeans) die de niet-klassieke natuur van de aanname van Planck benadrukte in 1905. In 1906 merkte Einstein ook op dat de resonatoren alleen gehele veelvouden van ‘hν’ aan energie mochten bezitten en dat de energie discontinu veranderde bij absorptie en emissie. In 1905 stelde Einstein de hypothese van het ‘licht-quantum’ voor (hetgeen later fotonen werden genoemd). Einstein dacht dat hij licht geheel kon beschrijven als een deeltje. En niet alleen dat. De theorie van Einstein was realistisch, het was een theorie over wat licht is en niet alleen een theorie over hoe licht zich gedraagt. Omdat een theorie over wat licht is, niet inconsistent kan zijn (want hoe kan het anders de waarheid beschrijven), deed Einstein er alles aan (maar tevergeefs) om zijn ‘lichtquantum’ hypothese af te leiden in een consistente manier, waarbij hij geen golf-aspecten meer nodig zou hebben. Einstein dacht een analogie te hebben gevonden tussen karakteristieken van een ideaal gas en de zwarte straling. Voor een ideaal gas geldt, dat bij een verandering van het volume, de entropie als volgt verandert: Dit was analoog aan de verandering van de entropie van een zwart lichaam in het domein van Wien: Ook merkte hij op dat in een ideaal gas de kans dat een N aantal moleculen in een bepaald subvolume van dit volume zitten, gelijk is aan: Dit was weer analoog aan het geval van de straling van een bepaalde frequentie in een bepaald volume om een zwarte straler: Einstein concludeerde[a, 5]: 81 Einstein dacht dat deze gelijkheid niet slechts formeel was, maar dat het hier om een echte fysische relatie ging. De energie-distributie van deze straling verspreidde zich niet continu, maar discontinu binnen het volume, in de vorm van onafhankelijke, gelokaliseerde quanta. Einstein kon ook nog een voorbeeld noemen, waarin deze discontinuïteit duidelijk meetbaar was: het foto-elektrische effect. Omdat Einstein dankzij zijn relativiteitstheorie geloofde dat er geen ether bestond voor licht, was het ook niet nodig om licht als een golf te beschouwen. In 1906 schreef Einstein, dat de afleiding van Planck inconsistent was geweest. Einstein beargumenteerde dit, door erop te wijzen dat Planck twee verschillende uitdrukkingen voor de gemiddelde energie van een resonator had gebruikt, waarbij ‘u’ wederom de energiedichtheid is, namelijk: en De eerste van de twee formules kwam uit de klassieke elektrodynamica en ging uit van een continue energie-verdeling, terwijl de tweede formule uit de statistische mechanica kwam en een discontinue energie-verdeling nodig had. Einstein meende, dat als we de tweede formule gebruiken, we de eerste formule niet kunnen gebruiken, zonder inconsistent te zijn. Er waren in het begin maar weinig natuurkundigen die Einstein’s quantum-hypothese serieus namen. Hieronder waren wel een aantal belangrijke namen: Stark, Wien, Ehrenfest, Lorentz en Planck. De hypothese kreeg pas in 1911 een bredere aanhang, hoewel de meeste natuurkundigen het met Planck eens waren, dat de hypothese alleen zou gelden voor de resonatoren en niet voor de radiatie zelf[a, 8]. Einstein wees erop, dat als licht een golf was, we de absorptie van licht niet kunnen verklaren. Om de energie, verspreid over de golf, te absorberen, moest het atoom de energie instantaan absorberen. Dit, zei Einstein, is in tegenspraak met de eindige signaalsnelheid van de relativiteitstheorie. In 1909 liet Einstein zien dat ‘het gemiddelde van het kwadraat van de energiefluctuaties’ uit te drukken was in twee termen: De eerste term kon verklaard worden als men de quantum-hypothese aannam, terwijl de tweede term de interferentie van golven leek te beschrijven. Einstein merkte ook op dat de constante ‘h’ van Planck dimensionaal gelijk was aan e2/c, waarbij ‘e’ een discrete elektrische lading was. Dit was onbekend in de klassieke elektrodynamica. Nu leek het dat behalve licht, ook elektriciteit een quantum-structuur had, met een quantum van de elektriciteit (het elektron) en een quantum voor het licht (het foton). Einstein poogde de golf en deeltjes-aspecten te verenigen. Zijn theorie leek erg op wat we gezien hebben bij Newton. Hij dacht dat het elektromagnetische veld gebonden is aan 82 licht-quanta, zoals het elektrostatische veld gebonden is aan elektronen, maar maakte het mogelijk dat de licht-quanta (net als de elektronen) bronnen waren van velden met de karakteristieken van golven. Net als Newton dacht Einstein dus dat licht uit deeltjes bestond, maar dat deze deeltjes de bron waren van golfverschijnselen! Dit maakte de continue en discontinue aspecten van de straling verenigbaar. Interferentie kon verklaard worden door de interactie tussen de velden van de lichtquanta. Lorentz liet echter zien dat twee ver verwijderde lichtbronnen ook interferentie konden veroorzaken en dit bleek alleen consistent met de licht-quanta, als deze enorm groot zouden zijn (soms groter dan 80 cm). Dus dit sprak Einstein tegen. Tussen 1909 en 1918 had Einstein enorm veel tijd besteed om zijn theorie kloppend te maken, maar zoals hij zelf toegaf, zonder succes. In 1916 beschreef Einstein de kanswetten voor de emissie en absorptie van stralingen van een atoom. Hij baseerde zijn theorie op de gequantiseerde staten van het atoom van Bohr en vond dat hij ‘in an astonishingly simple and general way’[a, 11] hieruit de wet van Planck had kunnen afleiden. Einstein bedacht dat in een substantie in equilibrium, de emissie van fotonen gelijk was aan de absorptie van fotonen. Er was één absorptie-proces bekend (B1u) en twee emissie-processen (A2 en B2u), waarvan de eerste spontaan gebeurde en de tweede gebeurde, wanneer een foton in botsing kwam met een atoom. De absorptie en de gedwongen emissie zijn dus (begrijpelijkerwijs) afhankelijk van de energiedichtheid van de straling (u), maar de spontane emissie niet. Het aantal deeltjes dat geen foton had geabsorbeerd, noemde hij n1 en het aantal deeltjes dat dit wel had gedaan, noemde hij n2. Einstein schreef: Dit kan herschreven worden als: Met behulp van de Boltzmann distributie: Vindt men: Deze formule heeft al de vorm van de wet van Planck! Als men nu kiest: 83 Dan vindt men: Dit is de wet van Planck. Einstein beschreef tevens, dat naast ε = hν voor de energie, ook de impuls discontinu veranderde: p = hν/c. Dit was eveneens onmogelijk in de elektrodynamica. In de klassieke theorie veranderde de impuls niet, omdat werd gedacht dat de straling in de vorm van sferische golven werd uitgezonden. Het probleem was wel dat in het geval van Einstein, de spontane emissie van een atoom een op kans gebaseerde verandering van de impuls voorspelde (terwijl dit met sferische golven niet het geval is). Maar Einstein was ervan overtuigd, dat er een onderliggend mechanisme te vinden moest zijn, dat het kansaspect in deze spontane emissie causaal kon verklaren. Dit zou Einstein uiteindelijk niet lukken. Planck geloofde echter dat de quantizatie in zijn theorie niet veroorzaakt werd door de straling, maar juist door de materie. Ook Bohr was het met Planck eens: de discontinuïteit zat in de materie en niet in de straling. Hij stelde dat het probleem van de klassieke natuurkunde hem niet zat in de stralingsvergelijkingen van Maxwell, maar in de mechanica. Na 1923 werd dit dan ook zijn belangrijkste probleem, het verenigen van het discontinue atoom met de continue straling. Dit was dus een geheel andere aanpak dan Einstein! Alleen met behulp van golven kon men interferentie verklaren, dacht Bohr, en hoewel hij toegaf dat de licht-quanta wel grote heuristische voordelen hadden, had het voor Bohr geen realistische waarde. HET EPR-EXPERIMENT Van 1927 tot 1936 had niemand een grotere invloed op de gedachten van Bohr, dan Einstein. De sterke kritieken van Einstein op zijn theorie, forceerde Bohr om zijn theorie verder uit te werken. Als reactie op de theorie van de complementariteit, die Bohr in 1927 presenteerde, bedacht Einstein een gedachte-experiment. Wanneer een elektron een dunne spleet doorgaat en daarna op een scherm landt, laat het een enkel punt achter. Dit kon, volgens Einstein, maar op twee manieren geïnterpreteerd worden: Het ene elektron was een golf en wanneer de uitgebreide golf het scherm bereikte, klapte hij instantaan in elkaar tot een punt De golfvergelijking beschrijft alleen een groep elektronen en niet de individuele elektronen Einstein merkte op dat het eerste standpunt problematisch was, omdat er dan een ‘curious action at a distance’ nodig was, die de verspreide golf plots tot een punt zou verkleinen. Einstein’s voorkeur ging daarom uit naar het tweede standpunt. De golfvergelijking representeert voor Einstein, een staat van een statistische verzameling van objecten en niet echt ‘matter-waves’. Einstein hield met deze keuze de mogelijkheid open, dat de quantummechanica niet in zijn essentie een probabilistische theorie was, maar dat het weldegelijk een deterministische basis heeft. Met een collectie van elektronen is het mogelijk om de geobserveerde statistiek op een deterministische wijze te verklaren. Op gelijke wijze is de statistische mechanica deterministisch, omdat het uiteindelijk geheel te beschrijven is met de klassieke mechanica. 84 Ook geloofde Einstein dat het mogelijk moest zijn om de onzekerheidsrelatie te omzeilen. In 1930 bedacht Einstein een gedachte-experiment, waarin hij een doos met een klein gat voorstelt, met een deurtje om het gat te openen en te dichten. Er zat straling in de doos en het deurtje kon heel even open worden gemaakt, om één enkel foton eruit te laten. De doos werd voor en na de meting gewogen, waardoor met het verschil de energie van het foton berekend kon worden. Einstein dacht dat hij hiermee zowel de tijd, als de energie, exact had gemeten en dus de onzekerheidsrelatie had omzeild. [a, 158] Bohr’s antwoord was als volgt. Hij hing de doos aan een veer, waardoor hij de massa van de doos kon meten, aan de hand van de uitrekking van de veer. Het meetresultaat, met een onzekerheid Δm, kon dus ook geschreven worden als een onzekerheid Δy van de uitrekking van de veer. Omdat ΔyΔp ≥ h, betekent dit dat er ook een onnauwkeurigheid is in de impuls van de doos. In de berekeningen is nodig dat de doos zwaar genoeg is. De onzekerheid in de impuls is daardoor kleiner dan de impuls die de zwaartekracht, tijdens de meettijd T, op de doos uitoefent. We vinden hieruit de vergelijking[a, 159] : en dit is ook te schrijven als, Of Bohr plaatst ook een klok in de doos. De doos, met daarin de klok, stijgt een klein stukje Δy, tijdens het verlaten van het foton. De klok heeft ook een onzekerheid in het aflezen van zijn tijd Δt en via de algemene relativiteitstheorie zijn deze Δy en Δt te relateren, met behulp van de zogenaamde ‘redshift’ formule: Als we dit combineren met de formule die we eerder vonden, krijgen we: 85 En met behulp van E = mc2 wordt dit gelijk aan: Einstein accepteerde het antwoord van Bohr. Maar Einstein gaf niet op. Hij probeerde het op een andere manier. Einstein schreef dat we, nadat het foton de doos had verlaten, konden kiezen tussen het herwegen van de doos of het aflezen van de klok, maar niet allebei. Einstein nam ook aan dat we deze handelingen kunnen verrichten zonder het foton te verstoren. Het foton kan immers al willekeurig ver weg zijn, als wij een van deze twee handelingen willen verrichten. Als het mogelijk is om ‘de energie te meten zonder het foton te verstoren’ of ‘de tijd te meten zonder het foton te verstoren’, heeft het foton dan niet gewoon een exacte energie en een exacte tijd, ook al kunnen wij maar één van beide meten!? Einstein denkt dat de quantummechanica, die maar een van deze twee dingen boven water kan halen, daarom een incomplete beschrijving geeft van de natuur. Dit gedachte-experiment wordt een ‘delayed choice’-experiment genoemd, om de voor de hand liggende reden, namelijk dat de keuze over wat we van het foton kunnen weten, pas na het event kan worden gekozen. Dit experiment van Einstein was ook het begin van een argument dat hij in 1935 zou uitwerken in het zogenaamde EPR argument. Bohr vulde Einstein’s experiment aan met een ander voorbeeld. Als een foton een dubbele spleet gepasseerd is, kan nog steeds worden besloten of de positie of de impuls gemeten wordt en dus ook of we een interferentiepatroon waarnemen of niet! Het lijkt dus mogelijk dat de uitkomst van een experiment afhangt van wat we doen met de apparatuur, nadat de relevante interactie tussen het object en het instrument heeft plaatsgevonden. Bohr reageert door te stellen dat het meten van de energie een compleet ander experiment was, dan het meten van de tijd. Hoewel de interactie al heeft plaatsgevonden blijft Bohr volhouden dat beide keuzes niet dezelfde ‘fysische realiteit’ beschrijven, zoals Einstein denkt, maar twee totaal verschillende fenomenen. Hoewel Einstein het belachelijk vond dat deze ‘delayed choices’ het eindresultaat van het experiment konden beïnvloeden, concludeerde Bohr dat het toch mogelijk is. In het EPR-argument stellen Einstein, Podolsky en Rosen zich een systeem voor, dat zich in een ‘singlet-staat’ bevindt (hetgeen betekent dat de totale spin van de twee deeltjes in totaal nul is). Men kan deeltjes, die in deze staat terecht zijn gekomen, zo ver van elkaar af laten bewegen, dat ze geen interactie meer met elkaar kunnen hebben. Als men nu besluit het eerste deeltje te meten en bijvoorbeeld het resultaat ½ħ vindt (waar men 50% kans op heeft), dan moet het andere deeltje zich per direct in de staat -½ħ bevinden. Wanneer de quantummechanica dus inherent probabilistisch is, heeft de meting van het ene deeltje invloed op de staat van het andere deeltje, ook al kunnen deze deeltjes zo ver van elkaar af staan, dat zelfs de lichtsnelheid deze informatie niet had kunnen overbrengen. Einstein vond dit absurd en dacht daarom dat de quantummechanica incompleet was. Dit kan alleen door de quantummechanica verklaard worden, als er ‘curious action at a distance’ mogelijk zou zijn. Einstein heeft hier een enorm sterk punt! 86 Bohr bleef echter volhouden. Als de quantumtheorie deze ‘curious action at a distance’ moet accepteren om compleet te blijven, dan accepteert de quantummechanica van Bohr dat! Men kan zich afvragen welke redenen Bohr kon hebben om deze ‘absurditeit’ in zijn theorie te laten bestaan! Later werd Bohr’s gelijk aangetoond, maar destijds was het een hele grote (onlogische) stap om te geloven dat ‘curious action at a distance’ zou bestaan! Bohr reageert[a, 169]: Murdoch citeert Bohr over hetzelfde onderwerp[a, 170]: Bohr geeft toe dat een meting van het ene deeltje, het andere deeltje niet fysisch kan verstoren, maar toch blijft hij denken dat de experimentele meting van één deeltje, voor zowel het ene als het andere deeltje, de staat kan bepalen. [a, 170] De conditie waarover gesproken wordt, wordt bepaald door de experimentele set-up, en moet zich noodzakelijk houden aan de onzekerheidsrelatie. Dus zelfs in dit geval offert Bohr de onzekerheidsrelatie niet op! Murdoch merkt op: ‘Einstein, understandably, was never able to grasp Bohr’s point here’. Het EPR-argument en Bohr’s reactie maakte een eind aan het debat tussen Einstein en Bohr. Einstein bleef geloven dat de quantummechanica incompleet was en dat er ‘hidden states’ bestonden, die de mechaniek achter de statistische fenomenen konden verklaren. In 1964 toonde Bell echter aan dat deze ‘hidden states’ niet konden bestaan. Ook werd het bestaan van ‘delayed choice’ aangetoond. 87 EPILOOG FILOSOFIE IN DE WETENSCHAP We hebben gezien dat de filosofie geen bevredigend antwoord kan geven op vragen als: Wat is wetenschap? Wat is een natuurwet? Wanneer is een theorie bewezen of verklaard? Wat zegt dit over de wetenschap? Volgens Feyerabend betekent dit niets minder dan dat de enige wetenschappelijke methode ‘anything goes’[f, H16] is. Filosofen en wetenschappers (zoals Quine, Duhem en Mach) hebben kritische vragen gesteld over de aannames en de onzekerheid van wetenschappelijke theorieën. Ook Einstein, die vaak als een extreme realist wordt afgeschilderd, geloofde dat er geen logische methoden bestaan om achter de axioma’s van een theorie te komen. Einstein geloofde wel dat de mens in staat is om een theorie te bedenken, die de wereld juist beschrijft, maar hij gaf wel toe, dat dit idee eerder was gebaseerd was op ‘faith’, dan op rationaliteit. Ook Penrose geeft toe, dat zijn extreme realisme een voorkeur was en niet zozeer een logische deductie[d]. Wigner had echter de problemen van een dergelijk standpunt als te groot ervaren, om dezelfde conclusie te kunnen trekken[e]. Ook Hertz liet zien, in zijn gewaagde poging om de theorie van Newton op een geheel ander fundament te zetten, dat aannames onzeker waren. De ontwikkeling waarbij zelfs axioma’s van grote succesvolle theorieën bekritiseerd werden, stamt voornamelijk uit de filosofie van de 19de eeuw. Het heeft uiteindelijk de consequentie gehad, dat veel wetenschappers in de 20ste eeuw heel flexibel omgingen met hun axioma’s. Men deinsde er niet eens meer voor terug om belangrijke axioma’s te verwerpen, die ooit beschouwd werden als ‘self-evident truths’. Met deze mogelijkheid kon men de theorie die de voorkeur had, van de ondergang behoeden. Ook Quine bevestigde dit, toen hij beschreef dat het filosofisch altijd mogelijk is, om een alternatieve theorie te bedenken, die dezelfde data kan verklaren[f, 26]. Nietzsche dacht dat er zelfs in de logica vooroordelen huisden. Niet alleen de axioma’s zijn dus onzeker, maar ook de logische redeneringen, waarmee we onze theorie uit deze axioma’s opbouwen[g]. Dit werd fenomenaal bewezen in het werk van Bohr, die liet zien dat zelfs onze logische concepten niet altijd geldig waren. Einstein had laten zien, dat veel van onze concepten (die eerst ‘self-evident’ leken) toch onwaar waren, maar zijn theorie bleef wel deterministisch en logisch consistent. Bohr blies ook deze fundamenten van de oude natuurkunde omver. WETENSCHAPPELIJKE VOOROORDELEN Veel wetenschappers geloven dat de filosofie niets te bieden heeft en dat het bestuderen ervan een tijdsverspilling is. Er heerst de gedachte dat de filosofie in de twintigste eeuw zo goed als niets heeft geleverd, dat interessant is voor een fysicus. De natuurkunde daarentegen, heeft heel veel bijgedragen aan de filosofie. Ik wil betogen dat de werken van o.a. Quine, Kuhn en Feyerabend, maar ook Nietzsche, Maxwell en Hertz, wel degelijk iets interessants te vertellen hebben aan fysici. We hebben bijvoorbeeld gezien dat de starheid en dogmatiek van sommige naïeve vormen van realisme (die in de wetenschap veel 88 invloed hebben) met een korrel zout genomen kunnen worden. De opvatting van Maxwell en Whewell over dit onderwerp vind ik erg duidelijk: de wetenschap is gebaseerd op metafysische aannames en deze praktische metafysica moet dus door de wetenschappers beheerst worden[j, 189]. De aannames, de logica en de wetenschappelijke theorieën bevinden zich voor een deel op erg glad ijs. In plaats van hier over in te zitten, kan dit juist weg vrijmaken voor creativiteit, verbeelding, flexibiliteit en een openheid voor verschillende ideeën, zoals ook Feyerabend beweert. Ook in de 17de en 18de eeuw is er veel input geweest van de filosofie in de wetenschap. Zo maakte Hobbes ons bewust van onzekerheden in de experimenten van zijn tijd[i, H5]. Hij vroeg zich af: hoe weten wij wanneer een instrument werkt? Misschien concluderen we wel dat het werkt wanneer het apparaat het gewenste antwoord geeft! Ook is de welbekende stroming genaamd het empirisme van onschatbare waarde geweest voor de natuurkunde. Hume and Berkeley bijvoorbeeld maakten ons bewust van de limieten van onze kennis. Hume stelde dat wij alleen in staat zijn om patronen te herkennen in hoe de natuur opereert, maar dat we niet in staat zijn om oorzaak en gevolg te ‘zien’. Dit is slechts onze een interpretatie van een correlatie. De logisch positivisten hebben ons erop geattendeerd dat onze theorieën elementen kunnen bevatten, die niets van de natuur weerspiegelen, maar juist van de specifieke manier waarop wij theorieën construeren. Veel metafysische statements werden daarom door Russell en de logisch positivisten omgeschreven tot slechts ‘taalkundige’ constructies, die de metafysische entiteiten konden terugleiden tot ‘gepraat’ over observeerbare entiteiten. Hoewel het niet lukte om alle metafysica op deze wijze uit de theorie te verwijderen, zijn er voorbeelden te bedenken waarin dit wenselijk is. Een ander vooroordeel van moderne wetenschappers is het geloof dat de wetenschapper ‘door heeft’, wanneer hij een stukje ‘Zekere Kennis’ ontdekt. Hoewel vaak erkent wordt dat de wetenschap inderdaad door sociologische factoren beïnvloed wordt, is het eindproduct onafhankelijk van deze factoren. Wij hebben echter genoeg ‘aha-momenten’ gezien (zoals de ether-theorie), die uiteindelijk verworpen werden. Er zijn vele voorbeelden, zoals de zogenaamde phlogiston-theorie waarbij het bestaan van phlogiston werd gepostuleerd, waar een hele goede theorie wordt gecreëerd, die grote voorspellende waarde heeft, veel aha-momenten kent en dan uiteindelijk toch blijkt te gaan over een substantie die niet bestaat. Pickering in zijn analyse van het ontstaan van de quarktheorie, merkte op dat er vaak meerdere modellen zijn (waaronder de zogenaamde theorie van Regge, die van Zweig en Gell-mann en die van Feynman), die juiste voorspellingen maken, maar uiteindelijk blijft alleen de meest succesvolle bestaan (in dit geval een combinatie van de laatste twee). Pickering heeft laten zien, dat het vrij gemakkelijk is om data te fitten met behulp van de veelheid van wiskunde, die we tegenwoordig tot onze beschikking hebben. Het is dus veel te gemakkelijk is om ‘aha-momenten’ te krijgen, waarin een theorie precies lijkt te kloppen met een observatie. We hebben een soortgelijke conclusie ook gezien in het werk van N. Goodman[f, H11]. Een veel gebruikte metafoor die vaak door wetenschappers gebruikt wordt, is de metafoor van een berg, waarbij er meerdere routes naar de top bestaan, maar waarbij deze top een stukje zekere kennis bevat. Vanuit deze top, zijn er echter altijd weer hogere bergen te zien, waar een volgende groep klimmers naartoe zou kunnen klimmen. 89 Maar dan vraag ik mij af: wat heeft het te betekenen, als men boven op een de berg de wetten van Newton vindt en op een andere berg de wetten van Einstein en op een andere de Regge theorie, als deze theorieën uiteindelijk allemaal onjuist blijken te zijn. Wat men vindt op de top van de berg heeft dus weinig met de realiteit te maken, want hoe kan anders later blijken, dat wat men vond verkeerd was. De situatie doet me denken aan een verhaal van Alphonse Allais, dat hieronder wordt verteld door Jean Baudrillard[b, 209]: ‘Twee jonge mensen, twee jonge minnaars, ontvangen elk een anonieme brief waarin ze worden gewezen op de ontrouw van de ander: als de vrouw zich ervan wil overtuigen hoeft ze slechts naar een bepaald gemaskerd bal te gaan – haar minnaar zal er zijn, vermomd als Harlekijn. De ander ontvangt dezelfde geheime raad: ga naar dat bal, je vrouw zal er zijn, vermomd als een Congolese Kano. Die betreffende avond, als het gemaskerde bal in volle gang is, zitten twee personen zich in een hoekje te vervelen: een Harlekijn en een Congolese Kano. Tenslotte benadert hij haar en nodigt haar uit. Het eindigt in een privévertrek waar ze op elkaar afstormen en elkaar het masker afrukken. En dan – toppint van consternatie – constateert het verhaal: ZE WAREN HET GEEN VAN BEIDEN!’ Zo ook liepen Zweig en Gell-Mann tegen dezelfde berg der wetenschap, hadden hun ‘ahamomenten’ en bereikten de top en concludeerde beide ‘gelukkig, de ander is er nog niet’. Feynman klimt ook naar boven en vind ‘ze zijn er geen van beiden’! Een ander bekend voorbeeld zijn de drie verschillende oplossingen, die Bohr, Heisenberg en Pauli voorstelden om een quantummechanisch probleem op te lossen. Bohr geloofde dat het behoud van energie geschonden werd, Heisenberg dat de ruimtetijd niet continu was en Pauli dat er een ander deeltje bestond, waarvan wij hij bestaan nog niet kende (Pauli kreeg uiteindelijk gelijk). Wat is dit voor een berg, die dit soort situaties toelaat? En waarom zou dit resultaat los staan van sociale factoren? We hebben gezien dat wetenschappelijke feiten soms later onwaar bleken te zijn, omdat de standaarden van de tijd veranderden. Als het paradigma verandert, dan verandert ook de berg. Zo kan men denken jaren lang een berg te hebben beklommen, die uiteindelijk plots in rook op gaat! Wat is dit voor een berg? In de 17de eeuw was de wetenschap gevuld met mechanistische denkbeelden over magnetisme en zwaartekracht. Hoe ingenieus het magnetisme ook door Descartes beschreven was, het heeft het niet gehaald. Deze nadruk op de mechanistische wetenschap was duidelijk een vooroordeel van de tijd, maar ook deze vooroordelen vond men op de top van de berg. Ik noem dit sociologische invloeden! In de 19de eeuw was de ethertheorie een vereiste van elke zichzelf respecterende theorie over het elektromagnetisme. De theorieën, zelfs die van Maxwell, leken allemaal te wijzen op het bestaan ervan. We hebben keer op keer gezien, dat wetenschappers nieuwe deeltjes en alomtegenwoordige velden postuleerden om fenomenen met hun theorieën in overeenstemming te brengen. Vaak bleken deze voorspellingen later onwaar te zijn, ook al waren ze in overeenstemming te brengen met de data. Wat zegt dit over de moderne theorie van de donkere materie? Waarom wordt aanvaard dat ons universum vol zit met materie, die we niet kunnen waarnemen, terwijl er een scala van andere, minder extreme alternatieven te bedenken zijn, die dezelfde data kunnen verklaren, met andere aannames! 90 Als laatste beweren wetenschappers ook geregeld, dat ze op de vragen van de filosofen (bijvoorbeeld ‘wat is wetenschap?’) gemakkelijk een voor de hand liggend antwoord kunnen vinden. Hiermee wordt de diepte van een dergelijk probleem onderschat. Men denkt vaak dat men met simpelweg ‘common sense’ antwoorden kan geven op al deze vragen! Wij hebben nu gezien, dat al deze vragen na een eeuw van studie nog geen oplossingen hebben gevonden. Ik snap dat sommige wetenschappers zich op hun teentjes getrapt voelden, doordat sommige filosofen en sociologen vaak schaamteloos kritisch zijn op de wetenschappelijke praktijk en mogelijke onzekerheden zo uit het verband halen, dat de suggestie wordt gewekt dat het de sterke kanten van veel belangrijke technieken te niet zou kunnen doen. Toch denk ik dat een te grote focus op de objectiviteit ook niet goed is. Een middenweg (zoals Ian Hacking dat ook betoogt) lijkt de juiste oplossing. Het is voor mij een filosofisch vraagstuk, wanneer wij ons afvragen wat de waarde is van onze wetenschappelijke theorieën, aannames, methoden en technieken. Duhem onderzocht bijvoorbeeld de overeenkomsten van verschillende gedachte-experimenten. Dit is duidelijk een filosofisch vraagstuk, omdat het een nauwkeurige vergelijking van bewijs-structuren (ofwel ‘rational reconstructions’) vereist en niet gaat over het bestuderen van natuurlijke fenomenen. Men zou ook een nauwkeurig onderzoek kunnen doen naar de bewijsstructuur van bijvoorbeeld de algemene relativiteitstheorie. Wellicht vindt men dan dat alle succesvolle testen van deze theorie niet zijn gebaseerd op voorspellingen die gebruik maken van de meest algemene theorie, maar slechts op het equivalentie principe en de daaraan nauw verwante wiskunde. Een ander voorbeeld van een filosofische vraag vindt men in de mechanica van Hertz. Ook Hertz stelde een vraag die niet specifiek verwees naar het beschrijven van een natuurlijk fenomeen, maar naar een filosofische probleem. Het was niet perse zijn doel om een correcte mechanica te maken, maar eerder om aan te tonen dat een theorie van een dergelijk kaliber (de mechanica) meerdere representaties kende (meerdere ‘scientific images’) en dat zijn representatie beter was omdat het filosofisch correcter was. Een ander vraag, die Wigner onder andere heeft gesteld, is het onderzoeken in de verschillende wetenschappelijke theorieën, naar aanwijzingen over de natuur van de wiskunde. Men kan zich bijvoorbeeld afvragen af het altijd mogelijk is om een representatie van een theorie te vinden zonder bijvoorbeeld imaginaire of Grassmann-getallen. Als blijkt dat dit soms onmogelijk is of juist altijd mogelijk is, dan kunnen we daaruit leren over de connectie tussen onze wiskundige methode en de natuur. Wellicht had Nietzsche gelijk had toen hij zei dat we onze waarden (in ons geval de wetenschappelijke gebruiken en methoden) niet alleen moeten gebruiken om externe statements te beoordelen, maar dat we ook de waarden zelf moeten bestuderen. Hij schreef: We have taken the worth of these “values” as something given, as self-evident, as beyond all dispute[o, 6]. We zijn in een bepaalde mate onzeker over ‘the value of our values’[o, 6]. Dit leert ons om niets voor vanzelfsprekend aan te nemen, zelfs niet onze best onderbouwde of meest voor de hand liggende theorieën en axioma’s en onze wetenschappelijke gebruiken en methoden. Aan de andere kant moeten we het ook niet overdrijven. Hacking heeft betoogd dat in een hele hoop situaties geen grote twijfel bestaat en dat we er in deze situaties met een redelijke zekerheid voor kunnen kiezen om een fenomeen als realistisch aan te duiden[n]. Dank voor uw aandacht. 91 Referenties Inleiding [a] [b] [c] De Stelling van Gödel Newman & Nagel Het Spectrum 1986 Gödel’s Incompleteness Theorems R. Smullyan Oxford University Press US 1992 Brouwer’s Cambridge lectures on intuitionism L. Brouwer Cambridge University Press 1981 (oorspronkelijk 1951) [d] [e] [f] [g] Representing and Intervening I. Hacking Cambridge University Press 1983 Two Dogma’s of Empiricism W. Quine The Philosophical Review 60: 20-43 1951 Constructing Quarks A. Pickering University of Chicago Press 1984 Against Method P. Feyerabend Verso 1993 (oorspronkelijk 1975) [h] [i] Philosophy of Science J. Kasser The Teaching Company 2006 Aim & Structure of Physical Theory P. Duhem Princeton University Press 1991 (oorspronkelijk 1906) Descartes: De Analytische Meetkunde [a] [b] Descartes: Philosophy, Mathematics & Physics S. Gaukroger (ed.) Harvester 1980 La Geometrie R. Descartes 92 Digitale versie van de nederlandse vertaling: http://digbijzcoll.library.uu.nl/metadata.php?lang=nl&W=On&BoekID=338 (oorspronkelijk 1659) [c] [d] The Originality of Descartes Conception of Analysis B. Timmermans Journal of the History of Ideas. Vol. 60, Nr. 3 1999 History of Science: 1700 – 1900 F. Gregory The Teaching Company 2003 Newton: De Zwaartekracht [a] Philosophiae Naturalis Principia Mathematica I. Newton Daniel Adee 1846 (oorspronkelijk 1687) [b] Newton's Principia for the common reader S. Chandrasekhar Oxford University Press 1995 Let Newton Be! Roche (ed.) Oxford University Press 1989 [d] http://en.wikipedia.org/wiki/Bucket_argument - [e] http://en.wikipedia.org/wiki/Mach's_principle - [c] Maxwell: Het Ether-model [a] [b] [c] The Natural Philosophy of J. C. Maxwell P. Harman Cambridge University Press 2001 On the Notation of Maxwell’s Field Equations A. Waser rexresearch.com/maxwell1/20equations.pdf 2000 History of Science: 1700 – 1900 F. Gregory The Teaching Company 2003 Hertz: Scientific Images [a] Principles of Mechanics H. Hertz Cosimo, Inc. 2007 93 [b] [c] [d] [e] [f] [g] [h] Mechanistic Images in Geometric Form J. Lützen Oxford University Press 2005 Some considerations on the principles of dynamics H. Lorentz Te vinden in: Collected papers Zeeman & Fokker ???? volume 1934-39 Paul Ehrenfest M. Klein American Elsevier Pub. Co 1970 Variational Methods B. Tabarrok (ed.) Springer 1994 Hertz: Classical Physicist, Modern Philosopher D. Baird (ed.) Springer 1998 Science Wars S. Goldman The Teaching Company 2006 The Aether and Hertz’s Principles of Mech. J. Mulligan Physics in Perspective. Vol. 3 Nr. 2 2001 Overizcht: Wetenschapsfilosofie [a] [b] [c] [d] Philosophy of Science J. Kasser The Teaching Company 2006 Wetenschapsfilosfie voor geesteswetenschappen Leezenberg (ed.) Amsterdam University Press 2003 Representing and Intervening I. Hacking Cambridge University Press 1983 Paradigm_shift Wikipedia Duhem: Het Karakter van de Wetenschap [a] Aim & Structure of Physical Theory P. Duhem Princeton University Press 1991 (oorspronkelijk 1906) 94 [b] Dialogue Concerning Two New Sciences G. Galilei Vertaling 1914 op pagina 63-64: http://galileoandeinstein.physics.virginia.edu/tns_draft/tns_061to108.html (oorspronkelijk 1638) Einstein: Het Foton en het EPR-experiment [a] [b] Bohr’s Philosophy of Physics D. Murdoch Cambridge University Press 1989 What Was Born's Statistical Interpretation? L. Wessels Philosophy of Science association. Vol. 2, pp. 187-200 1980 [c] [d] Condensed Matter Field Theory Altland (ed.) Cambridge University Press 2006 Ideas & Opinions A. Einstein Crown Publishers 1954 Against Method P. Feyerabend Verso 1993 Epiloog [a] (oorspronkelijk 1975) [b] [c] [d] [e] [f] Fatal Strategies J. Baudrillard Pluto 1999 Ideas & Opinions A. Einstein Crown Publishers 1954 What is Reality? R. Penrose New Scientist magazine, Nov. 18-24 2006 The Unreasonable Effectiveness of Mathematics E. Wigner Pure and Applied Mathematics. Vol. 13, No. I 1960 Philosophy of Science J. Kasser The Teaching Company 2006 95 [g] De Vrolijke Wetenschap F. Nietzsche Arbeiderspers 1980 (oorspronkelijk 1882) [h] [i] [j] [k] [l] [m] [n] [o] Laboratory Life Woolgar & Latour Princeton University Press 1986 Science Wars S. Goldman The Teaching Company 2006 The Natural Philosophy of J. C. Maxwell P. Harman Cambridge University Press 2001 History of Science: Antiquity to 1700 L. Principe The Teaching Company 2002 Constructing Quarks A. Pickering University of Chicago Press 1984 Will to Power Solomon & Higgins The Teaching Company 1999 Representing and Intervening I. Hacking Cambridge University Press 1983 On the Genealogy of Morals F. Nietzsche Courier Dover Publications 2003 (oorspronkelijk 1887) 96