ΜΑΣ 458 (Στατιστική Ανάλυση Δεδομένων) και ΜΑΣ468 (Θέματα Στατιστικής ΙΙ)

Εργασία 4

Ημερομηνία Παράδοσης: 17/04/2019

  1. Να εκτιμήσετε τη μέση τιμή \(\theta=E[X\ln(X)]\) όπου \(X\sim Exp(1)\), με χρήση Monte Carlo στην R. Nα γράψετε συνάρτηση που παίρνει σαν όρισμα ένα \(\varepsilon\) και ένα \(n\) και υπολογίζει \(n\) δείγματα της Monte Carlo εκτιμήτριας της \(\theta\) με \(RMSE\leq \varepsilon\). Η συνάρτηση θα πρέπει να εκτιμά τη διακύμανση \(\sigma^2=Var(X\ln(X))\) με χρήση \(N_0=10^6\) δειγμάτων και ακολούθως να βρίσκει τον απαραίτητο αριθμό δειγμάτων \(N\) ούτως ώστε οι εκτιμήτριες Monte Carlo να έχουν το επιθυμητό σφάλμα. Οι \(n\) εκτιμήτριες Monte Carlo θα πρέπει να παράγονται με νέα δείγματα (όχι με αυτά που χρησιμοποιήθηκαν για την εκτίμηση της διακύμανσης). Η συνάρτηση θα πρέπει να επιστρέφει τα \(n\) δείγματα, την εκτίμηση του \(\sigma^2\) καθώς και τον αριθμό δειγμάτων \(N\) που χρησιμοποιήθηκαν για την κατασκευή των Monte Carlo εκτιμητριών. Να καλέσετε τη συνάρτηση για \(\varepsilon=0.1, 0.01, 0.001\) και \(n=100\). Φαίνεται να συγκλίνουν οι εκτιμήτριες κάπου; Επιβεβαιώνεται ότι η διακύμανση (και άρα το μέσο τετραγωνικό σφάλμα) των εκτιμητριών είναι περίπου \(\varepsilon^2\);

  2. Να εκτιμήσετε τη μέση τιμή \(\theta=E[X\ln(X)]\) όπου \(X\sim Exp(1)\), με χρήση Monte Carlo στην R. Nα γράψετε συνάρτηση που παίρνει σαν όρισμα ένα \(\varepsilon\) και ένα \(\alpha\in[0,1]\) και υπολογίζει μια εκτιμήτρια Monte Carlo της \(\theta\) η οποία έχει απόλυτο σφάλμα μικρότερο από \(\varepsilon\) με πιθανότητα \(1-\alpha\). Η συνάρτηση θα πρέπει να εκτιμά τη διακύμανση \(\sigma^2=Var(X\ln(X))\) με χρήση \(N_0=10^6\) δειγμάτων και ακολούθως να βρίσκει τον απαραίτητο αριθμό δειγμάτων \(N\) ούτως ώστε η εκτιμήτρια Monte Carlo να έχει το επιθυμητό σφάλμα. Η εκτιμήτρια Monte Carlo θα πρέπει να παράγεται με νέα δείγματα (όχι με αυτά που χρησιμοποιήθηκαν για την εκτίμηση της διακύμανσης). Η συνάρτηση θα πρέπει να επιστρέφει την εκτιμήτρια Monte Carlo, την εκτίμηση του \(\sigma^2\), τον αριθμό δειγμάτων \(N\) που χρησιμοποιήθηκαν για την κατασκευή της εκτιμήτριας, καθώς και \(1-\alpha\) προσεγγιστικό διάστημα εμπιστοσύνης για το \(\theta\). Nα καλέσετε τη συνάρτησή σας για \(\varepsilon=0.1, 0.01, 0.001\) και \(\alpha=0.05\). Να εμφανήσετε τις εκτιμήτριες Monte Carlo και τα αντίστοιχα διαστήματα εμπιστοσύνης και να σχολιάσετε τη συμπεριφορά τους.

  3. Να εκτιμήσετε την πιθανότητα \(p=P(X\in [3,4])\) όπου \(X\sim N(0,1)\), με χρήση Importance Sampling. Θεωρήστε 3 πιθανές proposal κατανομές \(Exp(1), N(3.5,1), 3+Exp(1)\) και γράψετε συνάρτηση στην R που παίρνει ως όρισμα ένα \(Ν\) και εκτιμά τη διακύμανση \(\sigma^2=Var(h(Y)\frac{f_X(Y)}{g(Y)})\), για τις κατάλληλες \(h, f_X, g\). Να καλέσετε τη συνάρτηση για \(Ν=10^6\). Ποια proposal κατανομή έχει την καλύτερη απόδοση; Να γράψετε συνάρτηση στην R, που παίρνει ως όρισμα ένα \(\varepsilon\) και υπολογίζει ένα δείγμα της εκτιμήτριας Importance Sampling του \(p\) με \(RMSE\leq \varepsilon\), με χρήση της βέλτιστης proposal κατανομής. H συνάρτηση θα πρέπει να επιστρέφει την εκτιμήτρια, την εκτίμηση του \(\sigma^2\) καθώς και τον αριθμό βημάτων που χρησιμοποιήθηκαν για την κατασκευή της εκτιμήτριας Importance Sampling. Να καλέσετε τη συνάρτηση σας για \(\varepsilon=0.01*ptrue\), όπου ptrue η τιμή που δίνει η pnorm για την πιθανότητα \(p\) (δηλαδή θα έχουμε σφάλμα 1% της πραγματικής τιμής). Πόσα βήματα χρειάζεται η μέθοδος Important Sampling σε αυτή την περίπτωση; Συγκρίνετε τον αριθμό βημάτων που βρήκατε, με τον απαιτούμενο αριθμό βημάτων της απλής μεθόδου Monte Carlo σύμφωνα με το φράγμα που είδαμε στο Παράδειγμα A.