Sterrenkunde Practicum 2 Proef 2: De exoplaneet 51 Peg b

advertisement
Sterrenkunde Practicum 2
Proef 2: De exoplaneet 51 Peg b
Paul van der Werf
10 maart 2011
1
Inleiding
Al sinds antieke tijden wordt er gespeculeerd over het bestaan van planeten rond andere sterren dan de
zon. We leven in dit opzicht in een bijzondere tijd, want in de afgelopen vijftien jaar is er het bestaan van
honderden van zulke exoplaneten aangetoond. Het licht van deze planeten direct waarnemen is echter
heel moeilijk, omdat deze op zeer kleine hoeksafstand van hun moederster staan en ook nog eens tot
miljarden malen zwakker zijn (vind maar eens een vuurvliegje naast een vuurtoren).
De grote doorbraak is tot stand gekomen door middel van indirecte technieken. Het meest succesvol
is de “radiële snelheidsmethode”, en zo is ook de eerste echte exoplaneet ontdekt (51 Pegasus b, oftewel
51 Peg b; NB: 51 Peg a is de ster, en 51 Peg b de planeet). Al wordt de planeet zelf niet gezien, de radiële
component van de beweging van de ster om het planeet-ster barycentrum (dus de radiële snelheid vR )
kan worden gemeten.
Uit Newton’s zwaartekrachtswet kunnen we afleiden dat de te verwachte variatie in vR , veroorzaakt
door een planeet in een cirkelbaan met een omloopsperiode P , een amplitude k heeft van
k=
2πG
P
31
MP sin i
2
,
(1)
(MP + M∗ ) 3
waarbij G de gravitatieconstante is, MP en M∗ de massa van de planeet en de ster, en i de inclinatiehoek
waaronder we de planeetbaan zien. Als de planeetbaan precies in het vlak van de hemel ligt (i = 0), zien
we dus geen vR variaties. Let op: je bepaalt dus MP sin i, en niet MP .
Opgave 1:
Leid deze uitdrukking af (hint: gebruik de derde wet van Kepler). Herschrijf vervolgens de formule zodat
P in eenheden van dagen is, M∗ in M , en MP in Jupiter-massa’s (NB: MP M∗ ). Wat is de amplitude
van de vR variatie op de zon veroorzaakt door de aarde? En door Jupiter?
2
Bepaling van de minimale massa van 51 Peg b
In 1995 is met behulp van de radiële snelheidsmethode de eerste echte exoplaneet ontdekt rond de ster
51 Peg. We gaan nu zelf de vR periode en amplitude van dit systeem bepalen. De vR data kan je inlezen
van een bestand op de practicum website, waarin de eerste kolom de Juliaanse datum aanduidt (relatief
ten opzichte van een bepaalde datum), de tweede kolom de gemeten vR in meters per seconde, en de
derde kolom de onzekerheid op deze meting. Dit bestand (51Peg mayorqueloz95.dat) geeft de originele
dataset uit 1995, waarmee deze exoplaneet voor het eerst werd aangetoond. Lees het bestand in in IDL
en plot vR als functie van tijd. Schat nu de periode en amplitude zo goed mogelijk met het oog.
We laten IDL de precieze waardes bepalen. Hiervoor gaan we het volgende model fitten aan de
waarnemingen:
2π (t − t0 )
vR = k sin
+ v0 = k sin (2π (f + f0 )) + v0 ,
(2)
P
waarbij we geı̈nteresseerd zullen zijn in k en P , omdat die nodig zijn om MP sin i te bepalen.
1
Om nu de periode te zoeken die de waarnemingen het beste fit, gaan we deze fit uitvoeren door χ2 te
minimaliseren, waarbij χ2 gegeven is door
2
χ =
2
N X
vR,i − modeli
∆vR,i
i=1
,
(3)
waarin vR,i en ∆vR,i de gemeten waarden van vR en de onzekerheid daarop zijn, en N het aantal meetpunten is.
Een χ2 fit is niets anders dan een gewogen kleinste kwadraten fit; als de onzekerheid op alle meetpunten gelijk is, krijg je de standaard kleinste kwadraten fit. Hoe kleiner dus de χ2 , hoe beter ons model de
waarnemingen fit, en die periode waarbij χ2 het kleinste is, zullen we beschouwen als onze beste waarde.
Om dit te kunnen doen moeten we wel voor elke P , ook k, f0 en v0 optimaliseren. Bedenk zelf hoe je
aan een goede beginschatting voor v0 komt.
Opgave 2:
Bepaal met behulp van deze χ2 fit de beste schatting van P en k. Laat hierbij de periode varieren tussen
±1 dag van je met het oog geschatte waarde, met stapjes van 0.01 dag. Zet voor elke periode-stap de
epoch om in fase f . Varieer nu voor elke P , ook k tussen ±10 m s−1 van de met het oog geschatte waarde
(1 m s−1 stappen), en f0 tussen 0 en 1 (met 0.01 stapjes), en v0 (bedenk zelf een geschikte stapgrootte).
Bepaal voor elke P de laagste χ2 en sla deze waardes op in een array. Plot nu χ2 als functie van P , en
bepaal de minimale χ2 waarde. Welke baanperiode fit het beste? Je kunt nu dit verder optimaliseren
door veel kleinere stapjes te nemen rondom de best gevonden oplossing. Zo kunnen de optimale waarden
voor P , k en f0 gevonden worden. Laat deze oplossing zien in een diagram van vR tegen fase f , met de
beste fit. Wat is de minimale massa van de planeet (zoek zelf de massa van de moederster op)?
3
Is de fit statistisch acceptabel?
In het voorafgaande hebben we de data gefit met een model van de vR variatie van de ster, veroorzaakt
door een planeet. De beste fit van het model geeft een amplitude van de variatie, en een periode, die
samen werden omgezet naar een minimale planeet massa. Maar in hoeverre kunnen we dit antwoord nu
vertrouwen?
Dergelijke vragen komen in de sterrenkunde vaak voor. Een principiële kwestie is dat we nooit
helemaal zeker weten of het model wel het goede is. Er zijn diverse redenen die we kunnen bedenken
waarom het model misschien niet goed is:
• de planeet heeft misschien een ellipsbaan;
• er is misschien een tweede planeet in het planetenstelsel;
• er zitten systematische fouten in de waarnemingen;
• ...
Een van de manieren om hier meer over te kunnen zeggen, is om te bekijken of het model de data “goed”
fit. Dat wil zeggen, dat we gaan kijken of de afwijkingen tussen het model en de data niet groter zijn
dan we statistisch verwachten.
3.1
Statistische tests
Stel, we hebben een set meetwaarden yobs,i met meetfouten σi , en we willen testen of een model ymod,i
een correcte beschrijving is van de waarnemingen.
2
We stellen een test op, die op grond van de waarnemingen en het model twee mogelijke uitslagen kan
geven:
1. model geeft goede fit: model geaccepteerd = “positief”
2. model geeft slechte fit: model afgewezen = “negatief”
We kunnen nu 4 verschillende situaties onderscheiden:
1. Model is goed + test accepteert model = “goed positief”
2. Model is goed + test verwerpt model = “fout negatief”
3. Model is fout + test accepteert model = “fout positief”
4. Model is fout + test verwerpt model = “goed negatief”
In gevallen 2 en 3 is er duidelijk een probleem. In zijn algemeenheid gebruiken we de 2de uitkomst,
“fout negatief”, om een statistische test op zijn betrouwbaarheid te waarderen. We willen slechts een
kleine kans lopen dat we het model ten onrechte afwijzen. De consequentie van deze strategie is dat
een afwijzing van het model grote significantie heeft, dat wil zeggen dat er slechts een kleine kans is dat
het ten onrechte is gebeurd. Aan de andere kant betekent een kleine kans op “fout negatief” (geval 2)
een grotere kans geeft op “fout positief” (geval 3). Veelal wordt een limiet van 5% voor “fout negatief”
gebruikt.
De belangrijkste uitkomst van testen zoals hierboven beschreven is het volgende:
1. als de hypothese dat het model goed is wordt aanvaard, dan verklaren we “dat het model een goede
beschrijving geeft van de data”, oftewel dat “het model is consistent met de data”. Het zegt niet
dat het model “waar” is;
2. als de hypothese dat het model goed is wordt afgewezen, dan verklaren we dat we het model kunnen
uitsluiten met “95% significantie” (je ziet vaak in publicaties “a confidence limit of 95%”). De 95%
komt van 100%-5%, waar de 5% de kans is dat de hypothese ten onrechte is afgewezen.
3.2
De χ2 test
De χ2 die we in het voorafgaande enkel als gewogen kleinste kwadraten fit gebruikt hebben, heeft nog een
hele andere, belangrijke toepassing, nl. als statistische test voor de nauwkeurigheid van het aangenomen
model. We schrijven χ2 als
2
N X
yobs,i − ymod,i
2
χ =
,
(4)
σi
i=1
waarbij yobs,i de waarnemingen zijn met bijbehorende fouten σi , en ymod,i de modelvoorspellingen. We
gaan er vanuit dat de waarneemfouten een Gaussische verdeling hebben rond nul, met dispersie σi voor
iedere waarneming i. Dan heeft χ2 de zogenaamde “Chi-kwadraat” verdeling, welke is gegeven in standaard statistiekboeken (Numerical Recipes heeft een goed hoofdstuk (Hoofdstuk 15) over het fitten van
data; goed materiaal is ook te vinden op Wikipedia onder “Pearson’s chi-square test”). Gebruik in IDL
de functies chisqr cvf en chisqr pdf.
We zien direct dat hoe groter χ2 is, hoe groter de afwijkingen tussen het model en de data zijn. De
test die we nu opstellen is de volgende:
• hypothese: het model fit de waarnemingen goed
• χ2 < χ2lim : accepteer hypothese
• χ2 > χ2lim : wijs hypothese af
We stellen de waarde van χ2lim zodanig dat de kans op een “fout negatieve” uitkomst 5% is. Dat wil
zeggen dat
P (χ2 > χ2lim ) = 0.05
(5)
3
als de hypothese correct is. Deze kans is een functie van χ2lim en van het aantal waarnemingen N . Voor
de χ2 -verdeling gaan we ervan uit dat de Gaussische variabelen onafhankelijk zijn. Nu zijn de metingen
inderdaad ook onafhankelijk, maar het model dat er wordt afgetrokken wordt eerst gefit aan de metingen
(en is dus wel afhankelijk van de metingen). Hiervoor moet als gecorrigeerd worden: gebruik voor de
berekening van de verdeling van χ2 voor N niet het aantal waarnemingen, maar het aantal waarnemingen
verminderd met het aantal vrijheidsgraden (dat is het aantal ”fit” parameters) van het model.
Opgave 3:
Pas de bovenstaande χ2 -test toe op het aan de waarnemingen gefitte model. Bereken P (χ2 > χ2obs ) om
de significantie van het resultaat voor deze dataset te bepalen. Geef ook de limiet χ2lim voor een kans
van een fout negatieve uitkomst van 5%, en geef de waarde van N die je gebruikt hebt, en hoe je eraan
gekomen bent.
4
Onzekerheden in de resultaten
In het voorafgaande hebben we getest hoe goed de fit is die we hebben gekregen aan de radiële snelheidsdata van 51 Peg. Wat echter nog ontbreekt is een bepaling van de foutmarges op de gevonden parameters.
Ook deze kunnen we afleiden met behulp van de χ2 .
Om te beginnen gaan we terug naar het geval van een toevalsvariabele x die een normaalverdeling
heeft. Voor de standaarddeviatie σ van x geldt dan dat
P (µ − σ < x < µ + σ) = 0.68,
(6)
P (|x − µ| > σ) = 0.32.
(7)
oftewel
Hierin is µ de verwachtings waarde. We zeggen ook wel dat σ de 68% “confidence limit” geeft.
In het geval van de χ2 verdeling gebruiken we een volledig analoge benadering om de confidence limit
te bepalen, alleen wordt dit gecompliceerd door het feit dat we met meerdere vrijheidsgraden te maken
hebben. De berekening gaat als volgt:
Opgave 4:
1. Bereken de waarde ∆χ2 waarvoor geldt
P (χ2 − χ2min > ∆χ2 ) = 0.32.
(8)
Merk op dat het aantal vrijheidsgraden gelijk is aan 4, omdat f0 ook een vrije parameter is, ook al
ga je die niet verder gebruiken.
2. Bepaal eerst de best fittende (dus kleinste) waarde van χ2 ; noem deze χ2min . Maak daarna in IDL
een plot waarin je k en P tegen elkaar uit zet, en plot hierin (met het IDL commando CONTOUR)
een contourlijn van constante χ2 waarbij moet gelden
χ2 = ∆χ2 + χ2min .
(9)
Let op: in deze uitdrukking is χ2 de minimale χ2 bij de gebruikte waarden van k en P . Dit
compliceert de berekening. De 68% confidence limit voor de amplitude van de radiële snelheid en
de baanperiode is nu het gebied dat wordt begrensd door deze contour lijn.
Geef in je verslag de waarden van ∆χ2 en χ2min aan.
Opgave 5:
Bepaal tenslotte de onzekerheid in de (minimale) massa van de planeet 51 Peg b.
4
Download