Sunday 17 September 2017

Gen Matrix In Stata Forex


HINWEIS: Die IDRE Statistical Consulting Group wird im Februar die Website auf das WordPress CMS migrieren, um die Wartung und Erstellung neuer Inhalte zu erleichtern. Einige unserer älteren Seiten werden entfernt oder archiviert, so dass sie nicht länger erhalten bleiben. Wir werden versuchen, Redirects beizubehalten, damit die alten URLs weiterhin so gut funktionieren, wie wir können. Willkommen beim Institut für Digitale Forschung und Bildung Helfen Sie der Stat Consulting Group, indem Sie ein Geschenk geben Stata Class Notes Zählen von n bis N Einführung Stata hat zwei eingebaute Variablen namens n und N. N ist die Stata-Notation für die aktuelle Beobachtungsnummer. N in der ersten Beobachtung 1, 2 im zweiten, 3 im dritten und so weiter. N ist die Stata-Notation für die Gesamtzahl der Beobachtungen. Wir sehen, wie n und N arbeiten. Wie Sie sehen können, enthält die Variable id die Beobachtungsnummer, die von 1 bis 7 läuft, und nt die Gesamtzahl der Beobachtungen, die 7 ist. Zählen mit mit n und N in Verbindung mit dem Befehl kann einige sehr nützliche Ergebnisse liefern. Natürlich müssen wir, um den by-Befehl zu verwenden, zuerst unsere Daten auf der by-Variablen sortieren. Nun ist n1 die Beobachtungsnummer innerhalb jeder Gruppe und n2 die Gesamtzahl der Beobachtungen für jede Gruppe. Um die niedrigste Punktzahl für jede Gruppe aufzulisten, verwenden Sie Folgendes: Um die höchste Punktzahl für jede Gruppe zu verwenden, verwenden Sie Folgendes: Eine weitere Verwendung von n Verwenden Sie n, um herauszufinden, ob es doppelte ID-Nummern in den folgenden Daten gibt: Die Beobachtungen 6 und 7 haben die gleichen Identifikationsnummern und unterschiedliche Werte. Duplikate finden Mit Hilfe von N können Sie doppelte Beobachtungen finden. In diesem Beispiel sortieren wir die Beobachtungen durch alle Variablen. Dann verwenden wir alle Variablen in der by-Anweisung und set set n gleich der Gesamtzahl der identischen Beobachtungen. Schließlich listen wir die Beobachtungen auf, für die N größer als 1 ist, wodurch die doppelten Beobachtungen identifiziert werden. Wenn Sie eine Menge von Variablen in der Datenmenge haben, könnte es lange dauern, um sie alle zweimal eingeben. Wir können die Wildcard verwenden, um anzuzeigen, dass wir alle Variablen verwenden möchten. Weiter in den neuesten Versionen von Stata können wir kombinieren Art und durch in eine einzige Aussage. Unten ist eine vereinfachte Version des Codes, die genau die gleichen Ergebnisse wie oben ergibt. Der Inhalt dieser Website sollte nicht als eine Bestätigung für eine bestimmte Website, Buch oder Software-Produkt von der Universität von Kalifornien ausgelegt werden. NOTICE: Die IDRE Statistical Consulting-Gruppe wird die Migration der Website, um die WordPress CMS im Februar zu erleichtern Wartung und Erstellung neuer Inhalte. Einige unserer älteren Seiten werden entfernt oder archiviert, so dass sie nicht länger erhalten bleiben. Wir werden versuchen, Redirects beizubehalten, damit die alten URLs weiterhin so gut funktionieren, wie wir können. Willkommen beim Institut für Digitale Forschung und Bildung Helfen Sie der Stat Consulting Group, indem Sie ein Geschenk geben Stata FAQ Wie kann ich auf gespeicherte Informationen zugreifen, nachdem ich einen Befehl in Stata ausgeführt habe (zurückgegebene Ergebnisse) Zusätzlich zu der Ausgabe, die im Ergebnisfenster angezeigt wird, Viele Statas-Befehle speichern Informationen über den Befehl und seine Ergebnisse im Speicher. Dies ermöglicht es dem Benutzer, ebenso wie andere Stata-Befehle, diese Informationen leicht zu nutzen. Stata nennt diese zurückgegebenen Ergebnisse. Zurückgegebene Ergebnisse können sehr nützlich sein, wenn Sie Informationen verwenden möchten, die von einem Stata-Befehl erzeugt werden, um etwas anderes in Stata zu tun. Wenn Sie z. B. eine Variable zentrieren möchten, können Sie die Summe zur Berechnung des Mittelwertes verwenden und dann den Mittelwert verwenden, um die Variable zusammenzufassen, um die Variable zu zentrieren. Die Verwendung der zurückgegebenen Ergebnisse eliminiert die Notwendigkeit, den Wert des Mittelwerts zu wiederholen oder zu schneiden und einzufügen. Ein weiteres Beispiel für die Rückgabe der Ergebnisse ist, wenn Sie die vorhergesagten Werte der Ergebnisvariablen generieren möchten, wenn die Prädiktorvariablen auf einer bestimmten Menge von Werten liegen, können Sie die Koeffizienten erneut eingeben oder ausschneiden und einfügen, aber Ergebnisse zurückgeben Machen die Aufgabe viel einfacher. Der beste Weg, um ein Gefühl, wie die Ergebnisse der Arbeit zu erhalten, ist direkt zu springen und starten Sie suchen und mit ihnen. Der folgende Code öffnet ein Beispiel-Dataset und verwendet summarize (abgekürzte Summe), um deskriptive Statistiken für die Variable lesen zu erzeugen. Dies erzeugt die erwartete Ausgabe, aber noch wichtiger für unsere Zwecke, hat Stata nun Ergebnisse aus dem zusammengefassten Befehl im Speicher gespeichert. Aber wie Sie wissen, welche Informationen gespeichert worden sind Eine Auflistung der Informationen, die von jedem Befehl gespeichert werden, ist in der Hilfedatei und in gedrucktem Handbuch enthalten, so konnte ich dort aussehen, aber ich kann auch einfach geben Sie return Liste. Die alle zurückgegebenen Ergebnisse im Speicher auflisten wird. Oben ist eine Liste der zurückgegebenen Ergebnisse, wie Sie sehen können, jedes Ergebnis ist von der Form r (.), Wo die Ellipsen (ist ein kurzes Label). Wir konnten sehen, die Hilfedatei für den Befehl zusammenfassen, um herauszufinden, was jeder Eintrag in der Liste ist, aber es ist oft einfach, herauszufinden, welchen Wert zu welchem ​​Ergebnis, zum Beispiel r (Mittelwert) zugeordnet ist. Nicht überraschend enthält den Mittelwert des Lesens (Sie können dies gegen die Ausgabe zu überprüfen), aber andere sind nicht so offensichtlich, zum Beispiel r (sumw). Für diese, müssen Sie das Handbuch zu konsultieren, wenn Sie denken, Sie können sie verwenden möchten. Die meiste Zeit wird der Prozess relativ einfach sein, weil youll wissen, welches Ergebnis Sie zugreifen möchten, werden Sie in der Liste suchen, um herauszufinden, welcher Name es unter gespeichert wird, anstatt auf der Liste und versuchen, herauszufinden, was jeder Element ist. Wie Sie sich vorstellen können, verschiedene Befehle, und sogar der gleiche Befehl mit verschiedenen Optionen, speichern Sie verschiedene Ergebnisse. Im Folgenden fassen wir die Variable erneut zusammen, fügen aber die Detailoption hinzu. Dann verwenden wir return Liste, um die Liste der zurückgegebenen Ergebnisse zu erhalten. Ebenso wie die Detailoption zusätzliche Informationen zur Ausgabe hinzufügt, führt dies auch zu zusätzlichen Informationen, die in den zurückgegebenen Ergebnissen gespeichert sind. Die neue Liste enthält alle Informationen, die durch den obigen Summen-Befehl zurückgegeben werden, plus Schiefe-Kurtosis und eine Anzahl von Perzentilen, einschließlich der ersten (r (p25)) und dritten (r (p75)) Quarteile und des Medians (r (p50) ). Nun, da wir einen gewissen Sinn dafür haben, welche Ergebnisse durch den Befehl summarise zurückgegeben werden, können wir die zurückgegebenen Ergebnisse nutzen. Nach dem Durchlaufen eines der oben erwähnten Beispiele werden wir den Mittelwert der Variablen lesen. Unter der Annahme, dass der letzte Befehl, den wir liefen, der oben zusammengefasste Befehl war, erzeugt der untenstehende Code eine neue Variable, cread, die die mittleren zentrierten Werte von read enthält. Beachten Sie, dass anstatt den tatsächlichen Wert des gelesenen Mittelwertes in diesem Befehl zu verwenden, der Name des zurückgegebenen Ergebnisses (dh r (Mittelwert)) verwendet wird, dann weiß Stata, wann r (Mittelwert) Diese Systemvariable. In der nächsten Zeile fassen wir die neue Variable zusammen. Während der Mittelwert nicht exakt gleich Null ist, liegt er innerhalb des Rundungsfehlers von Null, so daß wir wissen, daß wir richtig zentriert die Variable gelesen haben. Wie der obige Code vorschlägt, können wir zurückgegebene Ergebnisse ziemlich genau so verwenden, wie wir eine tatsächliche Zahl verwenden würden. Dies liegt daran, dass Stata die r (.) Als Platzhalter für einen reellen Wert verwendet. Für ein anderes Beispiel, sagen wir, dass wir die Varianz des Lesens aus seiner Standardabweichung berechnen wollen (ignoriert die Tatsache, dass summarise die Varianz in r (Var) zurückgibt). Wir können dies über den Display-Befehl als Taschenrechner. Die zweite Zeile des Codes unten tut dies. Wir können sogar das Ergebnis durch Abschneiden und Einfügen des Wertes der Standardabweichung von der Ausgabe überprüfen, was im dritten Befehl unten ausgeführt wird. Die Ergebnisse sind grundsätzlich gleich, der sehr geringe Unterschied ist Rundungsfehler, da die gespeicherte Schätzung r (sd) mehr Genauigkeitswerte enthält als der Wert der Standardabweichung, der in der Ausgabe angezeigt wird. Arten der zurückgegebenen Ergebnisse, r-Klasse und e-Klasse Nun, da Sie ein wenig über die Ergebnisse und wie sie funktionieren Sie wissen, sind Sie bereit für ein wenig mehr Informationen über sie. Zurückgegebene Ergebnisse kommen in zwei Haupttypen, r-Klasse und e-Klasse (es gibt auch s-class und c-class resultsvariables, aber wir werden hier nicht diskutieren). Befehle, die Schätzungen durchführen, zB Regressionen aller Typen, Faktorenanalyse und anova, sind e-class Befehle. Andere Befehle, z. B. Zusammenfassungs-, Korrelations - und Nachschätzbefehle, sind r-class-Befehle. Die Unterscheidung zwischen Befehlen der R-Klasse und der E-Klasse ist wichtig, da Stata Ergebnisse aus Befehlen der e-Klasse und der r-Klasse in verschiedenen quotplaces. quot-Dateien speichert. Dies hat zwei Verzweigungen für Sie als Benutzer. Zuerst müssen Sie wissen, ob die Ergebnisse in r () oder e () (sowie den Namen des Ergebnisses) gespeichert sind, um sie nutzen zu können. Wenn Sie nicht sicher, welche Klasse ein Befehl youve ausgeführt wird, können Sie entweder schauen Sie es in der Hilfedatei oder quotlookquot an einem Ort (mit dem entsprechenden Befehl, um Ergebnisse zu listen), wenn die Ergebnisse nicht dort gespeichert sind sie wahrscheinlich in das andere. Eine potenziell wichtigere Verzweigung des Unterschieds, wie Ergebnisse von Befehlen der r-Klasse und e-Klasse zurückgegeben werden, besteht darin, dass die zurückgegebenen Ergebnisse nur dann gespeichert werden, wenn ein anderer Befehl derselben Klasse ausgeführt wird. Das heißt, die Ergebnisse der vorherigen Befehle werden durch nachfolgende Befehle derselben Klasse ersetzt. Im Gegensatz dazu wird das Ausführen eines Befehls einer anderen Klasse die zurückgegebenen Ergebnisse nicht beeinflussen. Wenn ich zum Beispiel eine Regression und dann eine zweite Regression ausführe, werden die Ergebnisse der ersten Regression (in e ()) durch die für die zweite Regression (ebenfalls in e () gespeicherten) ersetzt. Wenn jedoch anstelle einer zweiten Regression ein Befehl nach der Einschätzung ausgeführt wurde, würden die Ergebnisse der Regression in e () verbleiben, während die Ergebnisse des Postschätzbefehls in r () platziert werden würden. Zwar gibt es eine Unterscheidung zwischen den beiden, die tatsächliche Verwendung von Ergebnissen aus r-Klasse und e-Klasse Befehle ist sehr ähnlich. Für den Anfang, die Befehle sind parallel, um die r-Klasse Ergebnisse im Speicher der Liste Liste ist Liste. Um das gleiche für E-Klasse Ergebnisse der Befehl ereturn Liste zu tun. Ferner werden mit Ausnahme der Unterschiede in den Namenskonventionen (r () vs. e ()) die Ergebnisse auf die gleiche Weise abgerufen. Das Beispiel unten zeigt dies, zuerst regressieren wir schreiben auf weiblich und lesen. Und verwenden Sie dann die ereturn-Liste, um die zurückgegebenen Ergebnisse anzuzeigen. Die Liste der zurückgegebenen Ergebnisse für regress enthält mehrere Arten von zurückgegebenen Ergebnissen unter den Überschriften Skalaren, Makros, Matrizen und Funktionen. Wir werden die Arten der zurückgegebenen Ergebnisse unten erläutern, aber jetzt zeigen wir Ihnen, wie Sie die skalar zurückgegebenen Ergebnisse auf die gleiche Weise verwenden können, wie wir die zurückgegebenen Ergebnisse aus der Zusammenfassung verwenden. Zum Beispiel ist eine Möglichkeit, die Varianz der Fehler nach einer Regression zu berechnen, die restliche Summe von Quadraten durch die Gesamtfreiheitsgrade (d. h. n-1) zu teilen. Die restliche Summe von Quadraten wird in e (rss) gespeichert, und das n für die Analyse wird in e (N) gespeichert. Im Folgenden verwenden wir den Anzeigebefehl als Taschenrechner zusammen mit den zurückgegebenen Ergebnissen, um die Varianz der Fehler zu berechnen. Die Ergebnisse werden zurückgegeben: Skalare, Strings, Matrizen und Funktionen Wie oben erwähnt, gibt es sowohl für r - als auch für e-class-Befehle mehrere Arten von zurückgegebenen Ergebnissen, einschließlich Skalaren, Strings, Matrizen und Funktionen. In den Listen der zurückgegebenen Ergebnisse ist jeder Typ unter seiner eigenen Position aufgelistet. Die Ergebnisse unter der Überschrift quotscalarsquot sind nur, dass ein einzelner numerischer Wert. Ihre Verwendung wird oben diskutiert, so dass wir nicht mehr über sie in diesem Abschnitt sagen. Zurückgegebene Ergebnisse unter quotmacrosquot sind in der Regel Zeichenfolgen, die Informationen über den Befehl, der ausgeführt wurde, geben. Beispielsweise enthält e (cmdline) in den zurückgegebenen Ergebnissen für die oben gezeigte Regression den Befehl, den der Benutzer ausgegeben hat (ohne Abkürzungen). Diese werden im Allgemeinen bei der Programmierung von Stata verwendet. Ergebnisse, die unter quotmatricesquot aufgeführt werden, sind, wie Sie erwarten, Matrizen. Während die Liste der Ergebnisse, die von return-Liste und erturn Liste zurückgegeben werden, zeigen Sie die Werte, die von den meisten der zurückgegebenen Ergebnisse, das ist nicht praktisch mit Matrizen, stattdessen die Dimensionen der Matrizen aufgeführt sind. Um den Inhalt von Matrizen zu sehen, müssen Sie sie mit Matrix-Befehlen anzeigen lassen. Wir machen dies unten mit der Koeffizientenmatrix (e (b)) unter Verwendung der Befehlsmatrixliste e (b). (Beachten Sie, dass es nach dem Anpassen eines Modells einen anderen Weg gibt, auf Koeffizienten und deren Standardfehler zuzugreifen, wird im Folgenden beschrieben.) Wenn wir Matrixoperationen auf zurückgegebenen Matrizen durchführen oder auf einzelne Elemente der Matrix zugreifen möchten, Verschieben Sie die Matrix als zurückgegebene Ergebnis auf eine normale Matrix. Dies geschieht in der letzten Zeile der Syntax unten. Schließlich werden die Ergebnisse, die unter der Überschrift "Funktionen" wiedergegeben werden, Funktionen enthalten, die in ähnlicher Weise wie andere Stata-Funktionen verwendet werden können. Die häufigste Funktion, die von den Stata-Schätzbefehlen zurückgegeben wird, ist wahrscheinlich e (sample). Diese Funktion markiert die Stichprobe, die für die Abschätzung der letzten Analyse verwendet wird. Dies ist nützlich, da Datensätze oft fehlende Werte enthalten, so dass nicht alle Fälle des Datensatzes in einer gegebenen Analyse verwendet werden. Unter der Annahme, dass der letzte Schätzbefehlslauf die Regression des Schreibens auf das Weibchen war, und das Lesen, das oben gezeigt ist, verwendet die erste Codezeile unten e (Abtastwert), um den Mittelwert des Lesens unter den in dem Modell verwendeten Fällen zu finden. Die zweite Codezeile verwendet e (sample), um eine neue Variable namens flag zu erstellen, die für Fälle gleich ist, die in der Analyse verwendet wurden, andernfalls Null. (Anmerkung, da der Beispiel-Dataset keine fehlenden Daten enthält, werden alle Fälle in die Analyse einbezogen, und Flag ist eine Konstante gleich Eins.) Koeffizienten und ihre Standardfehler Wie oben diskutiert, passen nach einem Modell Modell Koeffizienten und deren Standard auf Fehler werden in e () in Matrixform gespeichert. Diese Matrizen ermöglichen dem Benutzer den Zugriff auf die Koeffizienten, aber Stata bietet Ihnen einen noch einfacheren Zugriff auf diese Informationen, indem er sie in den Systemvariablen b und se speichert. Um auf den Wert eines Regressionskoeffizienten nach einer Regression zuzugreifen, muss man nur bvarname eingeben, wobei varname der Name der Prädiktorvariablen ist, deren Koeffizient Sie untersuchen möchten. Um auf den Standardfehler zuzugreifen, können Sie einfach sevarname eingeben. Um auf den Koeffizienten und den Standardfehler der Konstante zuzugreifen, verwenden wir Bcons bzw. Sek. Im folgenden führen wir das gleiche Regressionsmodell, das wir oben (ohne die Ausgabe), mit weiblichen lief und lesen, um das Schreiben vorherzusagen. Sobald wir das Modell geschätzt haben, verwenden wir den Anzeigebefehl, um zu zeigen, dass die Werte in b gleich unseren Regressionskoeffizienten sind. Schließlich berechnen wir den vorhergesagten Wert des Schreibens, wenn ein weiblicher Student (weiblich 1) eine Leserate von 52 hat. Der Inhalt dieser Website sollte nicht als eine Bestätigung irgendeines bestimmten Webseiten-, Buch - oder Softwareprodukts durch die Universität von Kalifornien.

No comments:

Post a Comment