Hessian matrix independent ofh the parameters
Review: Fit a line to N data points
€ | ˆ y | ||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
|
||||||||||||||
ˆx ≡ | ∑ | ||||||||||||||
ˆ b | ∑ | yi σ i |
|
, |
|
||||||||||
€ | = | 1 σ i |
|
∑ | 1 σ i |
For slope a, set b=0 and find a by optimal scaling:
ˆ a = | ∑ | yi xi − ˆ x ) σi | 2 | ∑ | 1 | 2 σ i | ||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
|
2 σ i |
|
(xi −ˆ x ) | |||||||||
∑ |
α 0 = ˆ | ∑ | ( | yi − ˆ α 1 P1(xi) )P0(xi) σi | 2 |
|
] = | 1 | ˆ x | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
P0 | Pivot point: |
|||||||||||||||||||
€ | ∑ | P0 | 2(xi) σ i |
|
∑ | 2(xi) σ i | 2 | |||||||||||||
α 1 = ˆ | ∑ | ( | yi − ˆ α 0 P0(xi) )P1(xi) σi | 2 |
|
∑ | ||||||||||||||
∑ | P1 2(xi) σ i | 2 | ||||||||||||||||||
|
y | = | ||||||||||||||||||
|
||||||||||||||||||||
|
---|
χ2≡ | N | # | yi −(a xi + b) | & |
|
|||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
∑ | ||||||||||||||||||||||||
% $ | ( ' | |||||||||||||||||||||||
σ i | ||||||||||||||||||||||||
i=1 | ||||||||||||||||||||||||
∑ | x y − a x − b ( | y = a x + b | ||||||||||||||||||||||
|
∑ | (y − a x − b |
|
|||||||||||||||||||||
€ | b | χ2(a,b) | ||||||||||||||||||||||
a | ∑x2 σ 2 | + b∑x σ 2 | = | ∑ | x y σ2 | |||||||||||||||||||
a | ∑x σ 2 | + b∑1 σ 2 | = | € |
|
|||||||||||||||||||
|
||||||||||||||||||||||||
# | Σx /σ2 | & | # | a | Σx y /σ2 | |||||||||||||||||||
% | ( |
|
||||||||||||||||||||||
% | ||||||||||||||||||||||||
|
Σ 1/σ2 | b | Σ y /σ2 | ˆa | ||||||||||||||||||||
$ |
|
|||||||||||||||||||||||
H α | = |
|
||||||||||||||||||||||
( c = correlation vector ) | ||||||||||||||||||||||||
= | H |
|
---|
The Hessian Matrix
H jk ≡1 2 | , | χ2≡ | N | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
∑ | ||||||||||||||
|
||||||||||||||
i=1 | ||||||||||||||
|
||||||||||||||
|
||||||||||||||
|
||||||||||||||
i∑ |
|
|||||||||||||
|
|
|||||||||||||
|
||||||||||||||
|
---|
Parameter Uncertainties Hessian matrix describes the curvature of the χ2 surface :
χ2(α) = χ2( ˆ α ) + | j,k∑ | ( α j − ˆ α j | )Hj kαk− ˆ α k | 1 | ∂2χ2 | ||
---|---|---|---|---|---|---|---|
∂aj∂ak |
|
||
---|---|---|
€ | ||
|
Cov(aj,ak) = H−1 "# |
---|
|
---|
General Linear Regression
Scale M Patterns | M | |
---|---|---|
∑ |
|
|
||||||||
---|---|---|---|---|---|---|---|---|---|
N | = | N | σ i 2yi− |
M | |||||
χ2≡ | ∑ | ∑ | ∑ | ||||||
| |||||||||
|
i=1 | j |
Normal Equations:
2 | N | # | yi − | M | aP(x) | Pk(xi) | |||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
∑ | ∑ | ||||||||||||||||||
% |
|
||||||||||||||||||
|
% $ | ∑ | |||||||||||||||||
i | j | ||||||||||||||||||
M | # | N | Pji Pki | N |
|
Pki ≡ Pk(xi) | |||||||||||||
∑ |
|
∑ | |||||||||||||||||
% | |||||||||||||||||||
% $ | = | N | |||||||||||||||||
j | i | i | |||||||||||||||||
H jk = | N |
|
c(y) | ||||||||||||||||
M | |||||||||||||||||||
∑ | H jk aj = ck(y) | ∑ | ∑ | ||||||||||||||||
|
k = | ∑ | |||||||||||||||||
j | i | i |
|
---|
|
|
|||||
k | ||||||
H1 | ∂2χ2 | N | ||||
∂α j ∂αk | = | ∑ | ||||
i=1 |
Elliptical χ2 contours, unique solution by linear regression (matrix inversion).
Non - Linear Models :
j,k∑ | (αj− ˆαj | )Hj kαk− ˆαk | ) | |||
---|---|---|---|---|---|---|
|
∂2χ2 |
|
||||
∂α j ∂αk |
|
|||||||
---|---|---|---|---|---|---|---|
|
|||||||
∂µ |
|
|
|||||
∂ A= g∂µ | € | ||||||
|
|||||||
∂µ | |||||||
∂σ |
|
3 | 2 | 6 |
|
---|---|---|---|---|
1 | ||||
|
4 | 5 | 7 |
---|---|---|---|
|
3. Take a random step, e.g. using a Gaussian
random number with same σi (and
covariances) as “recent” points.MCMC requires no derivativesJ Easy to code J
MCMC generates a “chain” of points tending to move downhill, then settling into
|
0.5 | |||||
---|---|---|---|---|---|---|
0 | ||||||
-1 | ||||||
0.6 | 0.8 | 1 | 1.2 |
-0.02 0 0.02 0.04 0.06 0.08 |
---|
0.1
0.12
0.14
|
1 |
---|