Contents
1 Introduction 1
2 Statistical models 3
2.1 Model A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2 Model B . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.3 Model C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3 Characterization of the MLE and graph-theoretic interpretations of its
properties 11
3.1 Parameter reduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3.2 Optimality conditions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.3 Relation to graph theory . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.4 Non-uniqueness . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.4.1 Algebraic conditions for mixture uniqueness . . . . . . . . . . . . . . 24
3.4.2 Graph theoretic conditions for mixture uniqueness . . . . . . . . . . 25
3.5 Further reduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
4 Computational aspects of the parameter reduction 31
4.1 Lee’s algorithm for the size of the maximum clique . . . . . . . . . . . . . . 33
4.2 MaxCliqueFinder algorithm . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.3 SimpleCliqueFinder algorithm . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4.4 Performance of the algorithms . . . . . . . . . . . . . . . . . . . . . . . . . . 44
5 The optimization 47
5.1 Iterative Quadratic Minimization . . . . . . . . . . . . . . . . . . . . . . . . 48
5.2 Vertex direction method . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
5.3 Max-Flow problem in network optimization . . . . . . . . . . . . . . . . . . 52
6 (In)consistency of the naive MLE 55
6.1 Model A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
6.2 Model C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
6.3 Model B . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
7 Repairing the inconsistency of the naive MLE in models B and C 69
7.1 Explicitly limiting the class of functions over which is maximized . . . . . . 69
7.2 Smoothing the empirical measure . . . . . . . . . . . . . . . . . . . . . . . . 70
7.3 A Kullback-Leibler approach . . . . . . . . . . . . . . . . . . . . . . . . . . 71
8 Application to AIDS data 79
8.1 An overview of HIV/AIDS . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
8.2 The data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
8.3 Methods and results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
8.4 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
9 Conclusions 97
10 Suggestions for further research 99
附件列表