Hessian matrix independent ofh the parameters

Review: Fit a line to N data points
| € | ˆ y | ||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
|
||||||||||||||
| ˆx ≡ | ∑ | ||||||||||||||
| ˆ b | ∑ | yi σ i |
|
, |
|
||||||||||
| € | = | 1 σ i |
|
∑ | 1 σ i | ||||||||||
For slope a, set b=0 and find a by optimal scaling:
| ˆ a = | ∑ | yi xi − ˆ x ) σi | 2 | ∑ | 1 | 2 σ i | ||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
2 σ i |
|
(xi −ˆ x ) | |||||||||
| ∑ | ||||||||||||
| α 0 = ˆ | ∑ | ( | yi − ˆ α 1 P1(xi) )P0(xi) σi | 2 |
|
] = | 1 | ˆ x | ||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| P0 | Pivot point: |
|||||||||||||||||||
| € | ∑ | P0 | 2(xi) σ i |
|
∑ | 2(xi) σ i | 2 | |||||||||||||
| α 1 = ˆ | ∑ | ( | yi − ˆ α 0 P0(xi) )P1(xi) σi | 2 |
|
∑ | ||||||||||||||
| ∑ | P1 2(xi) σ i | 2 | ||||||||||||||||||
|
y | = | ||||||||||||||||||
|
||||||||||||||||||||
|
|---|


| χ2≡ | N | # | yi −(a xi + b) | & |
|
|||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ∑ | ||||||||||||||||||||||||
| % $ | ( ' | |||||||||||||||||||||||
| σ i | ||||||||||||||||||||||||
| i=1 | ||||||||||||||||||||||||
| ∑ | x y − a x − b ( | y = a x + b | ||||||||||||||||||||||
|
∑ | (y − a x − b |
|
|||||||||||||||||||||
| € | b | χ2(a,b) | ||||||||||||||||||||||
| a | ∑x2 σ 2 | + b∑x σ 2 | = | ∑ | x y σ2 | |||||||||||||||||||
| a | ∑x σ 2 | + b∑1 σ 2 | = | € |
|
|||||||||||||||||||
|
||||||||||||||||||||||||
| # | Σx /σ2 | & | # | a | Σx y /σ2 | |||||||||||||||||||
| % | ( |
|
||||||||||||||||||||||
| % | ||||||||||||||||||||||||
|
Σ 1/σ2 | b | Σ y /σ2 | ˆa | ||||||||||||||||||||
| $ |
|
|||||||||||||||||||||||
| H α | = |
|
||||||||||||||||||||||
| ( c = correlation vector ) | ||||||||||||||||||||||||
| = | H | |||||||||||||||||||||||
|
|---|
The Hessian Matrix
| H jk ≡1 2 | , | χ2≡ | N | |||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ∑ | ||||||||||||||
|
||||||||||||||
| i=1 | ||||||||||||||
|
||||||||||||||
|
||||||||||||||
|
||||||||||||||
| i∑ |
|
|||||||||||||
|
|
|||||||||||||
|
||||||||||||||
|
|---|
Parameter Uncertainties Hessian matrix describes the curvature of the χ2 surface :
| χ2(α) = χ2( ˆ α ) + | j,k∑ | ( α j − ˆ α j | )Hj kαk− ˆ α k | 1 | ∂2χ2 | ||
|---|---|---|---|---|---|---|---|
| ∂aj∂ak | |||||||
|
||
|---|---|---|
| € | ||
|
||
| Cov(aj,ak) = H−1 "# |
|---|
|
|---|
General Linear Regression
| Scale M Patterns | M | |
|---|---|---|
| ∑ |
|
|
||||||||
|---|---|---|---|---|---|---|---|---|---|
| N | = | N | σ i 2yi− |
M | |||||
| χ2≡ | ∑ | ∑ | ∑ | ||||||
| | |||||||||
|
i=1 | j | |||||||
Normal Equations:
| 2 | N | # | yi − | M | aP(x) | Pk(xi) | |||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ∑ | ∑ | ||||||||||||||||||
| % |
|
||||||||||||||||||
|
% $ | ∑ | |||||||||||||||||
| i | j | ||||||||||||||||||
| M | # | N | Pji Pki | N |
|
Pki ≡ Pk(xi) | |||||||||||||
| ∑ |
|
∑ | |||||||||||||||||
| % | |||||||||||||||||||
| % $ | = | N | |||||||||||||||||
| j | i | i | |||||||||||||||||
| H jk = | N |
|
c(y) | ||||||||||||||||
| M | |||||||||||||||||||
| ∑ | H jk aj = ck(y) | ∑ | ∑ | ||||||||||||||||
|
k = | ∑ | |||||||||||||||||
| j | i | i | |||||||||||||||||
|
||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
|
|||||
| k | ||||||
| H1 | ∂2χ2 | N | ||||
| ∂α j ∂αk | = | ∑ | ||||
| i=1 | ||||||
Elliptical χ2 contours, unique solution by linear regression (matrix inversion).
Non - Linear Models :
| j,k∑ | (αj− ˆαj | )Hj kαk− ˆαk | ) | |||
|---|---|---|---|---|---|---|
|
∂2χ2 |
|
||||
| ∂α j ∂αk | ||||||
|
|||||||
|---|---|---|---|---|---|---|---|
|
|||||||
| ∂µ |
|
|
|||||
| ∂ A= g∂µ | € | ||||||
|
|||||||
| ∂µ | |||||||
| ∂σ | |||||||
|
3 | 2 | 6 |
|
|---|---|---|---|---|
| 1 | ||||
|
4 | 5 | 7 |
|---|---|---|---|
|
3. Take a random step, e.g. using a Gaussian
random number with same σi (and
covariances) as “recent” points.MCMC requires no derivativesJ Easy to code J
MCMC generates a “chain” of points tending to move downhill, then settling into
|
0.5 | |||||
|---|---|---|---|---|---|---|
| 0 | ||||||
| -1 | ||||||
| 0.6 | 0.8 | 1 | 1.2 | |||
| -0.02 0 0.02 0.04 0.06 0.08 |
|---|
0.1
0.12
0.14
|
1 |
|---|




