Tuesday, October 11, 2016

Stata 11 Bewegende Gemiddelde

Die skoonmaak van data in Stata Skoonmaak data is 'n redelik breë term wat van toepassing is op die voorlopige manipulasies op 'n datastel voor analise. Dit sal heel dikwels die eerste opdrag van 'n navorsingsassistent wees en is die vervelige deel van enige navorsingsprojek wat ons laat wens ons het 'n navorsingsassistent. Stata is 'n goeie hulpmiddel vir die skoonmaak en manipulering van data, ongeag van die sagteware wat jy van plan is om te gebruik vir analise. Jou eerste pas by 'n datastel kan enige van of al die volgende behels: Die skep van 'n aantal kleiner onderafdelings gebaseer op navorsing kriteria Val Waarnemings Val veranderlikes Transformasie veranderlikes Hantering van uitskieters Skep nuwe veranderlikes Moving veranderlikes Labeling veranderlikes hernoeming veranderlikes Of dit jou eerste keer skoonmaak data of jy nou 'n gesoute data aap, jy kan 'n paar nuttige wenke vind deur die lees van meer. Gebruik die Stata hulp lêer. Stata het 'n ingeboude in funksie wat u toelaat om toegang te verkry tot die handleiding sowel as hulp lêers op enige gegewe opdrag. Tik hulp in die opdrag venster, gevolg deur die naam van die opdrag wat jy hulp nodig het en druk die Enter sleutel: Skryf 'n doen-lêer. skoon nooit 'n datastel deur blindelings betree opdragte (of erger, kliek knoppies). Jy wil die opdragte in 'n doen-lêer skryf, en dan loop dit. Op hierdie manier, as jy 'n fout maak, sal jy nie het jou hele dataset verwoes en jy sal nie nodig het om weer te begin van nuuts af. Dit is 'n algemene advies wat van toepassing is op enige werk wat jy doen op Stata. Werk van doen-lêers kan ander mense te sien wat jy gedoen het as jy ooit raad nodig het, dit maak jou werk reproduceerbare en dit laat jou toe om klein foute ietwat mee reg te stel. Om 'n doen-lêer te begin, klik op die ikoon wat lyk soos 'n notaboek op die top-linker hoek van jou Stata kyker 2. In die voorlopige stadiums van jou werk, kan jy voel dat 'n doen-lêer is meer hindernis as wat dit is nuttig. Byvoorbeeld, as jy nie so vertroud is met 'n opdrag, kan jy verkies om dit die eerste keer probeer. 'N eenvoudige manier om dit te doen en nog dissipline oor skryfwerk doen-lêers is om jou doen-lêer in fases te skryf, slegs 'n paar opdragte voordat hulle die uitvoering, die regstelling van foute as jy gaan. Met die oog op 'n aantal opdragte uit te voer, eerder as die hele doen-lêer, net na vore te bring die mense wat jy wil uit te voer, en klik op die ikoon Voer Seleksie (doen) op die top van jou doen-lêer redakteur, by die heel regs. As jy meer vaardig geword met programmering in Stata, het jy t nodig het om uit te bevele nie probeer, en jy sal ontdek die vreugde van die skryf van 'n doen-lêer en met dit uit te voer sonder 'n glitch. Om 'n hele doen-lêer uit te voer, nie na vore te bring enige deel daarvan en klik op die ikoon Voer Seleksie (doen). Jy mag wonder oor die opdragte duidelik, meer verreken en stel mem 15000 in die kiekie voorbeeld. Hierdie drie opdragte is administratiewe bevele wat baie nuttig aan die begin van 'n doen-lêer te hê. Die eerste, 'n duidelike, word gebruik om enige vorige dataset jy dalk gewerk aan skoon te maak. Hoe meer verreken opdrag vertel Stata nie te breek of die --more-- boodskap vertoon. Ten slotte, die opdrag gestel mem 15000 verhoog die beskikking van Stata geheue van jou rekenaar hier sal ons dit nodig het as die grootte van die datastel ons afgelaai word vanaf 3 is groter as die 10MB by verstek om data toegeken. Een laaste opmerking oor doen lêers: As jy dubbel klik op 'n gered doen lêer, sal dit nie oopmaak vir redigering, maar eerder Stata sal dit doen-lêer, wat 'n bietjie irriterend kan wees om 'n doen-lêer uit 'n gids heropen sonder die uitvoering hardloop die instruksies daarin, regs-kliek op dit en kies wysig eerder as oop. Hou altyd 'n log. Weereens, dit is 'n algemene reël op Stata. Hou 'n log beteken dat jy kan terug gaan en kyk na wat jy gedoen het sonder om dit weer te doen. Begin 'n log is net 'n kwessie van die toevoeging van 'n opdrag aan die bokant van jou doen-lêer wat Stata vertel om aan te meld, asook waar jy wil die log om gered te word: Meld met behulp whateverpathyouwant: pickanameforyourlog. smcl 4. vervang 5 Let op hoe logs gered onder die smcl uitbreiding. Moenie vergeet om jou log sluit voor die aanvang van 'n nuwe een. Die laaste opdrag op jou doen-lêer 6 sal gewoonlik teken naby. Behalwe soos jy gaan. Rekenaars ongeluk, krag gaan uit, dinge gebeur. Slaan jou doen-lêers elke paar minute as jy dit skryf. 'n doen lêer spaar is op dieselfde manier as die redding van enige teks editor dokument gedoen: óf klik op die ikoon disket, of druk Ctrl S: Jy moet ook jou dataset red as jy dit verander, maar maak seker dat jy 'n weergawe van die oorspronklike datastel te hou , in die geval wat jy nodig het om oor te begin. Die opdrag om te spaar 'n datastel op Stata is te red, gevolg deur die pad waar jy wil hê dat die dataset om gered te word, en die opsionele opdrag vervang. Let op hoe die uitbreiding vir Stata data is. dta, en ook daarop hoe die nuwe dataset het 'n ander naam van die oorspronklike 7. Raak vertroud met jou datastel. Datastelle kom met code books. Jy moet weet wat elke veranderlike is, hoe dit s gekodeer, hoe ontbrekende waardes geïdentifiseer. 'N Goeie praktyk is om werklik te kyk na die data, sodat jy die struktuur van die inligting te verstaan. Om dit te doen, kan jy klik op Data in die top-linker hoek van jou kyker en kies Data redakteur, dan gegee editor (blaai). 'N Nuwe venster sal oopmaak en jy kan jou data te sien. Jy kan ook gebruik om die opdrag blaai, óf deur dit direk te tik in die opdrag venster, of van 'n doen-lêer: Een van die onderskeidende kenmerke van is dat wanneer jy 'n datastel te laai, dit kom met byskrifte. Veranderlike etikette is beskrywings van veranderlikes, en waarde vir etikette word gebruik om die manier veranderlikes gekodeer beskryf. Basies, die waarde etiket sit op die top van die kode, sodat wanneer jy blaai, sien jy wat die kode beteken eerder as wat dit is. Om dit te duideliker te maak, laat ons kyk na die data met geen etikette. Kyk, byvoorbeeld, by die GEOPRV veranderlike. Die skep van 'n aantal kleiner onderafdelings gebaseer op navorsing kriteria Daar is baie redes waarom jy 'n kleiner deel van jou data kan hê, maar die belangrikste een is dat hoe groter die dataset, hoe moeiliker is dit vir Stata om te bestuur, wat stadiger jou stelsel. Jou doel is om jou dataset so klein as moontlik te maak, terwyl die behoud van al die relevante inligting. Jou navorsing agenda bepaal wat jou finale dataset sal bevat. Laat ons sê jy data op die gesondheid gewoontes van Kanadese 12 jaar en ouer, maar jou navorsingsvraag is spesifiek vir vroue van reproduktiewe ouderdom wat in Ontario 8. Jy duidelik Don t nodig het om die mans in jou datastel te hou, en jy het t nodig het om die inwoners van ander as Ontario provinsies te hou. Verder kan jy waarskynlik vroue daal onder 15 en meer as 55 jaar oud. Nou, laat ons kyk na hoe jy dit sou doen. Waarnemings daal, moet jy een van twee Stata beveel (hou of daling) kombineer met die as kwalifiseerder. Maak seker dat jy jou oorspronklike datastel gered voordat jy begin. Die gebod moet met omsigtigheid gebruik word (of geheel en al vermy word), want dit alles sal daal, maar wat jy spesifiek te hou. Dit kan 'n probleem wees as jy nie 100 manne uit wat jy wil hou. Die daling opdrag sal daal vanaf jou dataset wat jy spesifiek vra Stata daal. Die as kwalifiseerder beperk die omvang van die opdrag om die waarnemings vir wat die waarde van 'n uitdrukking is waar. Die sintaksis vir die gebruik van hierdie kwalifiseerder is eenvoudig: Waar opdrag in hierdie geval sou wees, laat val en exp is die uitdrukking wat moet waar wees vir die daling opdrag om aansoek te doen 9. Die gebruik van die voorbeeld van vroue van reproduktiewe ouderdom in Ontario, die eerste uitgelig lyn druppels mans, die tweede lyn druppels enige waarneming nie in Ontario, terwyl die laaste reël druppels waarnemings in ouderdomsgroepe ouer of jonger as ons subset van belang. Jy moet versigtig wees met logiese operateurs die sintaksis in die derde reël sien. 'N Algemene fout is om Stata vra om te daal as DHHGAGE 2. Daar is geen individue in die datastel wat ouer as 55 en jonger as 15. Ons wil daal as ouer as 55 jaar of jonger as 15. Hier is 'n lys van operateurs in uitdrukkings. Jy sal gebruik logiese en relasionele operateurs in samewerking met as: Nog 'n manier waarop jy mag nodig wees om jou dataset kleiner te maak is deur die val van veranderlikes wat nie nuttig om jou navorsing. Dit mag wees dat die inligting vervat in 'n gegewe veranderlike inligting gedupliseer (dws 'n ander veranderlike bied dieselfde inligting), of dalk al die waarnemings vir 'n veranderlike ontbreek, of 'n veranderlike gebeur net te wees in jou dataset maar is irrelevant vir jou navorsing . Weglating van veranderlikes is baie eenvoudig net gebruik maak van die daling opdrag. As ons kyk na die data van CCHS, is die veranderlike SLP 01 (Aantal ure spandeer aan die slaap per nag) gekodeer as Een voorsien vol (Nie van toepassing) vir elke waarneming in die datastel. Dit is duidelik dat ons nie iets leer uit daardie veranderlike, sodat ons kan dit te laat val. Die sintaksis vir die weglating van veranderlike is eenvoudig: Waar varlist is die lys van veranderlikes sou jy graag wou laat val. Dit is maklik om 'n aantal van 'n veranderlike te laat val op 'n tyd op hierdie manier. Hier is ek val al die veranderlikes wat gekodeer as nie van toepassing op meer as 95 waarnemings 10: Soms veranderlikes is nie die manier waarop jy wil hê hulle moet wees gekodeer. In hierdie afdeling sal ons kyk na twee transformasies jy mag nodig wees om te doen op 'n paar veranderlikes voor die gebruik van hulle: recode en destring. Die recode opdrag verander die waardes van numeriese veranderlikes volgens die gespesifiseerde reëls. In die CCHS dataset, baie veranderlikes ontbrekende waardes gekodeer as Een voorsien vol of. d. Dit is gerieflik omdat dit geen invloed op berekeninge wat jy kan doen met behulp van die data (byvoorbeeld as jy 'n gemiddelde bereken). Daar is egter baie datastelle gebruik 999 as 'n vermiste veranderlike kode, en wat dalk problematies wees. Ons wil dalk hierdie recode as. ten einde nie hulle raak enige berekeninge ons plan op te doen met die data. Die sintaksis vir hierdie opdrag is: recode varlist (ou waarde (s) nuwe waarde) 11 Laat s recode die hoogte en BMI veranderlikes uit die CCHS data, (ter wille van illustrasie, aangesien dit is regtig nie nodig in hierdie geval): die destring opdrag kan jy data gestoor in die tou formaat (bv alfanumeriese) te omskep in 'n numeriese formaat. Die CCHS dataset geen stringveranderlike bevat. Ten einde om te sien wat 'n stringveranderlike lyk, kan ons die gesprek opdrag, toString gebruik, 'n stringveranderlike skep. Ons sal dan omskep wat veranderlike terug na 'n numeriese formaat. 'N string veranderlike toon in rooi in die data redakteur: Hoewel dit dieselfde lyk as die veranderlike CIH 2, Stata kan nie enige berekeninge op die stringveranderlike doen (sedert sy formaat vertel Stata dat dit is gemaak van briewe of ander simbole) . Laat s destring dit: Let op die gebruik van die opsies te genereer en te vervang. Wanneer ons die vals stringveranderlike geskep, gebruik ons ​​genereer, want ons wou 'n nuwe aparte veranderlike. Nou, wanneer ons destring, ons vervang die stringveranderlike deur sy numeriese eweknie. Hoe jy kies om dit te doen in jou eie dataset hang af van hoe jy van plan is om die veranderlikes te gebruik. Sal jy nog enige nut vir die stringveranderlike Indien wel genereer 'n nuwe een wanneer jy destring. Wil jy net dat veranderlike om nie in string formaat Dan vervang dit met die nuwe een. Hier kan ons sien dat ons veranderlike string is nou heeltemal identies aan die veranderlike CIH 2: (Ons kan dit veranderlike nou drop) Uitskieters verdien hul eie afdeling, want daar is dikwels verwarring oor wat presies 'n uitskieter uitmaak. 'N uitskieter is NIE 'n waarneming met 'n ongewone, maar moontlike waarde vir 'n veranderlike 12 seldsame gebeurtenisse voorkom. Die uitskieters jy bekommerd is oor moet wees is die mense wat kom uit kodering fout. Hoe kan jy sê wat is wat gesonde verstand gaan 'n lang pad hier. Eerste, kyk na jou data met behulp van die data redakteur (blaai). Uitskieters is geneig om te spring op jou. As jy 'n klein dataset, kan jy ook elkeen van jou veranderlikes tabuleer: getabuleer n veranderlike sal jy 'n lys van al die moontlike waardes wat veranderlike neem in die datastel gee. Uitskieters sal wees om die ekstreemwaardes. Kyk na die orde van grootte. Is hierdie waardes geloofwaardig As die dataset is baie groot, maar kan dit nie prakties wees om te staar teen al die waardes 'n veranderlike kan neem. Trouens, sal Stata nie tabuleer as daar te veel verskillende waardes. Jy kan kyk na jou data in 'n spreidiagram: In die CCHS dataset, caseid is die individuele ID, terwyl hwtghtm is die hoogte in meter. Die grafiek vertel ons daar is geen uitskieters in hierdie datastel: Nog 'n manier om te kyk vir uitskieters is om die waarnemings op te som vir 'n veranderlike, met behulp van die gedetailleerde opsie: Die venster gevolg sal die belangrikste persentiele van die verspreiding (insluitend die mediaan 50) wys, die eerste vier oomblikke, asook die vier kleinste en vier grootste waarnemings: Dit is duidelik dat daar is geen uitskieters. Laat s dink vir 'n oomblik dat die 99 persentiel van die hoogte verspreiding sluit 'n waarneming met 5.2m ingeskryf as die hoogte. Is dit moontlik dat daar werklik 'n 5.2m vrou wat in hierdie dataset Kyk na die orde van grootte waarmee hierdie waarneming sou verskil van die tweede grootste. Dit is amper 50 standaardafwykings groter. Wat moet jy doen met so 'n waarneming Daar is 'n aantal oplossings, maar niemand is perfek: Drop dit uit jou datastel (daal as hwtghtm 1,803) Gebruik die as kwalifiseerder om dit uit te sluit wanneer die opwekking van statistieke wat die hoogte veranderlike gebruik (opdrag as hwtghtm 1,803 ) ignoreer as die hoogte veranderlike is nie eintlik wat belangrik is in jou navorsing en die res van die veranderlikes vir hierdie waarnemings word gekodeer net mooi Daar is twee hoof opdragte wat jy moet weet om nuwe veranderlikes genereer: gen is vir die basiese beginsels, terwyl egen kan jy mooi fancy kry. Jy kan hierdie kombineer met kwalifiseerders soos as of in asook voorvoegsel soos deur en bysort 14. Byvoorbeeld, sê jy wil 'n veranderlike wat vir jou vertel of die vroue in die datastel 'n live-in-vennoot te skep. Terwyl daar is geen onfeilbare manier om vas te stel wat, sal ons dit benader deur te aanvaar dat vroue wat as getroud of gemeenregtelike eintlik saam met hul gade of gemeenregtelike vennoot hul huwelikstatus aangedui: Die eerste reël skep die veranderlike livein en ken dit 'n waarde van 1 indien die waarde van die huwelikstatus veranderlike (dhhgms) is óf 1 (getroud) of 2 (gemeenregtelike). Die tweede lyn vervang die ontbrekende waarde kode met 0, maak die livein veranderlike binêre. Nou, laat ons sê jy wil graag 'n kategoriese veranderlike wat vir jou vertel skep, deur ouderdomsgroep, as 'n vrou is onder of bo-gemiddelde in terme van liggaamsmassa-indeks (BMI). Die eerste reël van opdrag skep 'n veranderlike (meanbmi) wat neem op 'n unieke waarde vir elke ouderdomsgroep, die gemiddelde LMI vir daardie ouderdomsgroep. Die voorvoegsel bysort is 'n kombinasie van die en soort wat jy kan in dieselfde breek dit in twee opdragte: deur DHHGAGE: egen meanbmi gemiddelde (HWTGBMI) die soort deel van die opdrag organiseer die waarneming volgens die veranderlike DHHGAGE, van die kleinste tot die grootste, 'n stap vereis voordat jy enige optrede deur die veranderlike. Dit is gewoonlik makliker om net te gebruik bysort. Die tweede en derde lyne (wat begin met gen) skep 'n binêre veranderlike wat 0 gelyk asof 'n waarneming het 'n BMI laer as die gemiddelde vir haar ouderdomsgroep, en 1 of haar LMI bo haar ouderdomsgroep gemiddelde. Jy het nou hierdie nuwe veranderlikes geskep het, sou dit lekker wees om seker te maak dat die reëls waarvolgens jy dit gegenereer korrek was. Die ideaal is, sal jy graag om te kyk na livein (die nuwe veranderlike gebaseer op huwelikstatus) en dhhgms (die huwelikstatus veranderlike). Maar dit is moeilik om te twee veranderlikes vergelyk tensy hulle langs mekaar. Jy kan die bevel orde te gebruik om 'n veranderlike te beweeg (maw beweeg 'n kolom van jou dataset). As jy 'n veranderlike te skep, by verstek dit die laaste kolom van jou datastel. Jy kan dit volgende skuif na 'n ander veranderlike in plaas: As ons kyk na ons dataset, kan ons sien vergelyk die nuwe veranderlike na die ou en maak seker dat ons gekodeerde dit behoorlik: Net omdat ons twee nuwe veranderlikes met betrekking tot BMI is nou die laaste kolomme, laat se skuif die oorspronklike BMI veranderlike om die einde van die datastel: Dit nou maklik om te blik op ons nuwe veranderlikes: Het jy die probleem op lyn 8 die veranderlike bmicat moet nie gekodeer 1 agterkom as die oorspronklike BMI veranderlike gekodeer as 'n vermiste waarde. Ons kan dit op te los met 'n vinnige vervang: vervang bmicat. As hwtgbmi. d Wanneer jy 'n nuwe veranderlike te skep, is dit 'n goeie idee om dit te etiketteer. Hoekom hou julle veranderlikes gemerk maak dit maklik vir jou of enigiemand anders met jou dataset om vinnig te sien wat elke veranderlike verteenwoordig. Jy moet dink van jou werk as iets wat mense moet in staat wees om voort te plant. Etikettering jou veranderlikes is 'n klein taak wat dit baie makliker vir ander om jou data 15 gebruik maak. Die sintaksis vir etikettering veranderlikes is soos volg: etiket veranderlike VARNAME etiket. In ons vorige voorbeeld, sou die opdrag soos volg lyk: Let daarop dat jy hierdie opdrag kan afkort tot laboratorium var: Jy mag vind dat jy vinniger werk as jou veranderlikes name wat jy erken met die eerste oogopslag. In die meeste gevalle is dit geensins 'n noodsaaklike taak in skoonmaak data, maar as jy die data van 'n ander land te gebruik, byvoorbeeld, mag jy vind dat die veranderlike name in 'n vreemde taal, maak dit baie moeilik om te onthou. Die sintaksis is so maklik soos kan wees: die naam van oldname newname Laat ons kyk die finale doen-lêer Jou doen-lêer kan effens anders as dit wees, maar dit moet lei tot dieselfde finale dataset: Kom ons probeer om dit te draai op een slag te sien As dit werk. Moenie na vore te bring enige opdrag en klik op Voer (moenie). Let daarop dat wanneer Stata ontmoetings die opdrag blaai 'n data redakteur sal pop-up op jou skerm. Het jy 'n blik op jou data toe te sluit die data redakteur sodat Stata om voort te gaan loop die doen-lêer. Laat s ook die tyd om ons logs oopmaak om te sien hoe dit lyk en hoe dit kan nuttig wees neem. Uiteindelik laat ons kyk na ons finale datastelle en maak seker dat dit bevat al die regte veranderlikes, in die regte formaat. Dit bring ons aan ons werkswinkel, maar dit is net die begin vir jou. Leer om statistiese sagteware gebruik behels 'n baie trial and error, kwaad googlen, en desperaat probeer om iemand wat weet hoe om 'n lus Hier volg 'n paar uitstekende hulpbronne om jou kennis van Stata verder skryf vind: Welkom by die Instituut vir Digitale navorsing en Onderwys herhaalde maatreëls analise met Stata data: wye versus lang herhaalde maatreëls data kom in twee verskillende formate: 1) wye of 2) lank. In die wye formaat verskyn elke vak keer met die herhaalde maatreëls in dieselfde waarneming. Vir inligting oor die langtermyn-formaat is daar een waarneming vir elke tydperk vir elke vak. Hier is 'n voorbeeld van die data in die wye formaat vir vier tydperke. In die bogenoemde y1 is die reaksie veranderlike ten tye een. In 'n lang vorm lyk die data soos hierdie. Let daarop dat die tyd is 'n eksplisiete veranderlike met 'n lang vorm data. Hierdie formaat genoem persoon-tydperk data deur sommige navorsers. Stata ontledings herhaalde maatreëls vir beide ANOVA en vir lineêre gemengde modelle in 'n lang vorm. Aan die ander kant, SAS en SPSS gewoonlik ontleed herhaalde meting ANOVA in 'n groot vorm. Maar beide SAS en SPSS vereis dat die gebruik lang data gemengde modelle. Die voorbeeld dataset Ons voorbeeld dataset is slim genoem herhaal maatreëls en kan afgelaai word by die volgende opdrag. Daar is 'n totaal van agt vakke gemeet teen vier keer punte elk. Hierdie data is in 'n groot-formaat waar y1 is die reaksie op tyd 1, y2 is die reaksie op tyd 2, en so aan. Die vakke word verdeel in twee groepe van vier vakke met behulp van die veranderlike TRT. Hier is die basiese beskrywende statistiek by elk van die vier keer punte gekombineer en uitgebreek deur behandeling groep. Volgende, sal ons die grafiek die agt sel beteken met die gebruiker geskrewe, profileplot. Jy kan hierdie opdrag aflaai deur te tik findit profileplot is die Stata opdrag venster. Nou, laat ons kyk na die korrelasie en kovariansiematrikse van die antwoorde met verloop van tyd. Herhaal maatstaf ANOVA aanvaar die binne-onderwerp kovariansie struktuur is saamgestelde simmetriese. Die kovariansiematriks nie bo nie verskyn om saamgestelde simmetrie hê. Ons sal binne-onderwerp kovariansie in meer besonderhede later bespreek in die aanbieding. Hervorm van wye lang Noudat ons gekyk na 'n paar van die beskrywende statistiek kan ons die data te hervorm in lang vorm met behulp van die verander vorm opdrag. Die opsie i () gee die veranderlike wat die onderwerp identifiseer terwyl die opsie j () skep 'n nuwe veranderlike wat die tydperk aandui. Noudat ons die data kan ons aanbeweeg na herhaalde maatreëls ANOVA het hervorm. Herhaal maatreëls ANOVA In ANOVA omgangstaal hierdie ontwerp het beide tussen-onderwerp en binne-onderwerp effekte, maw dit is 'n gemengde effekte model. In die besonder hierdie ontwerp word soms na verwys as 'n split-plot faktoriaal variansieanalise. In Stata, met die data in 'n lang vorm, moet ons die fout terme spesifiseer vir beide die tussen-onderwerp en binne-onderwerp effekte. In die algemeen, die reël is dat daar 'n enkele fout term vir al die tussen-onderwerp effekte en 'n aparte fout term vir elk van die binne-onderwerp faktore en vir die interaksie van binne-onderwerp faktore. Ons model is relatief reguit vorentoe met slegs twee foute terme. Die tussen-onderwerp effek is behandeling (TRT) en sy foutterm is onderhewig geneste in behandeling (ID TRT). Die binne-onderwerp faktor tyd tyd. Sy foutterm is die oorblywende fout vir die model. Herhaal maatreëls ANOVA het 'n aanname dat die binne-onderwerp kovariansie struktuur is saamgestelde simmetriese, ook bekend as, uitruilbare. Met saamgestelde simmetrie die afwykings by elke keer na verwagting gelyk te wees en al die kovariansies verwag gelyk aan mekaar te wees. As die binne-onderwerp kovariansie struktuur is nie saamgestelde simmetriese dan die p-waardes verkry uit die herhaalde maatreëls ANOVA kan nie akkuraat weerspieël die ware waarskynlikhede. Stata laat se jy die gebrek aan verbinding simmetrie in ag neem deur die insluiting van die herhaalde opsie () in die ANOVA opdrag wat p-waardes bere vir konserwatiewe F-toetse. Ons sal kovariansie strukture bespreek in groter diepte later in die aanbieding. Hier is die ANOVA opdrag vir ons gegee. Die behandeling-deur-time interaksie is betekenisvol as die twee hoof-effekte van behandeling en tyd. Die uitset sluit die p-waardes vir drie verskillende konserwatiewe F-toetse: 1) Huynh-Feldt, 2) Kweekhuis-Geisser en 3) word Posbus se konserwatiewe F. Hierdie waardes is aanwysers van die p-waarde is selfs al is die data nie voldoen aan die saamgestelde simmetrie aanname. Ons kan die saamgevoeg binne-onderwerp kovariansiematriks sien met die aanbieding van die Srep matriks. Inspeksie van die saamgevoeg binne-onderwerp kovariansiematriks twyfel oor die geldigheid van die saamgestelde simmetrie aanname. Gelukkig het die p-waardes vir die konserwatiewe F-toets dui steeds beduidende uitwerking vir die TRT tyd interaksie en die tyd belangrikste effek. Toetse van eenvoudige effekte Sedert die behandeling-deur-time interaksie is beduidende ons moet probeer om die interaksie te verduidelik. Een manier om dit te doen, is deur die gebruik van die toets van 'n eenvoudige effekte. Ons sal begin deur te kyk na die effek van die tyd by elke behandeling vlak. Die effek van die tyd by elke behandeling die eenvoudige werking van die tyd het drie grade van vryheid vir elke vlak van die behandeling vir 'n totaal van ses grade van vryheid. Hierdie toets van eenvoudige effekte sal die oorblywende fout te gebruik vir die model as sy foutterm. Ons sal die opdrag kontras gebruik om die toets van 'n eenvoudige effekte doen. Paarsgewyse volg ups Sedert elk van die toetse van 'n eenvoudige effekte behels vier keer punte sal opvolg met paarsgewyse vergelykings met behulp van die opdrag rande met die opsie pwcompare. ANOVA met gepoelde foutterm Die toetse van behandeling by elke das punt vereis dat die gebruik van die gesamentlike fout. Dit wil sê, pooling ID TRT en die oorblywende fout. Dan kan jy maklik deur die verwydering van ID TRT van die ANOVA opdrag. Let daarop dat die oorblywende grade van vryheid is nou 24. Die effek van behandeling by elke keer Nou kan ons die eenvoudige effekte van die behandeling uit te voer op elke keer weer met behulp van die opdrag kontras. Aangesien daar twee vlakke van behandeling by elke keer punt is daar 'n totaal van vier grade van vryheid. Aangesien elke toets is een graad van vryheid, het ons nie te doen nie opvolg toetse. Grafiek van interaksie 'n grafiek van die interaksie is altyd nuttig. Ons sal die opdrag rande gebruik en marginsplot om die plot te produseer. Nadele van herhaalde maatreëls ANOVA herhaalde maatreëls ANOVA ly aan 'n paar nadele waaronder, nie toelaat dat ongelyke waarnemings binne onderwerp gebruiker moet korrek fout term vir elk te bereken aanvaar saamgestelde simmetrie / uitruilbare kovariansie struktuur herhaalde maatreëls gemengde model 'N alternatief vir herhaalde maatreëls ANOVA is om die ontleding as 'n herhaalde maatreëls gemengde model hardloop. Ons sal dit doen met behulp van die xtmixed opdrag. Let daarop dat ons nie die fout terme spesifiseer, moet ons eers na die naam van die veranderlike waarop die data herhaal, in hierdie geval ID spesifiseer. Hier is wat die xtmixed opdrag lyk. Let ons gebruik die reml opsie sodat die resultate vergelykbaar met die ANOVA resultate sal wees. Benewens die skattings van die vaste effekte kry ons twee ewekansige effekte. Dit is die variansie van die afsnitte en die oorblywende variansie wat ooreenstem met die tussen-onderwerp en binne-onderwerp afwykings onderskeidelik. xtmixed produseer skattings vir elke kwartaal in die model individueel. Om gesamentlike toetse (multi mate van vryheid) van die interaksie en die belangrikste effekte te kry sal ons die opdrag kontras gebruik. Grafiek van interaksie Laat s die grafiek die interaksie met behulp van dieselfde marges en marginsplot beveel soos voorheen. Toets van 'n eenvoudige effekte Weereens, kan ons toetse van eenvoudige effekte gebruik om die beduidende interaksie verstaan. tyd by elke behandeling Sedert elk van hierdie toetse van eenvoudige effekte gebruik drie grade van vryheid, sal ons followup usinf paarsgewyse vergelykings. behandeling by elke keer Post-hoc toets van tendense Nog 'n manier van kyk na hierdie resultate sou wees om te kyk na die tendens oor tyd vir elk van die twee groepe. Ons doen dit deur gebruik te maak van die p. kontras operateur wat gebruik koëffisiënte van ortogonale polinome gee. Ons hou die operateur dat ons in die toetse van 'n eenvoudige effekte wat gebruik word om die resultate deur behandeling te gee. Die resultate toon 'n beduidende lineêre tendens vir beide behandeling 1 en behandeling 2. Behandeling 2 het 'n beduidende kwadratiese tendens terwyl behandeling 1 het 'n beduidende kubieke tendens. Post-hoc toets van gedeeltelike interaksie Nog 'n alternatief is om te kyk na die gedeeltelike interaksies tussen behandeling en tyd. Ons gaan kyk na die twee behandelings en twee keer punte vir elke toets. Om ons toetse van gedeeltelike interaksie verstaan ​​dit help om die grafiek van die interaksie te sien. Die eerste toets kyk na die twee lyne tussen tyd 1 en tyd 2. Die volgende toets kyk na die lyne tussen tyd 2 en tyd 3. En die finale toets kyk na die twee lyne tussen tyd 3 en tyd 4. Vir elk van die gedeeltelike interaksies ons die toets as die interaksie tussen die vier selle is betekenisvol. Die pad na die opstel van die toetse van gedeeltelike interaksie is om die 'n gebruik. (Aangrensende) kontras operateur saam met die vir interaksie. Die verduideliking is baie meer kompleks as die konsep. Die resultate dui daarop dat daar geen interaksie tussen tyd 1 en tyd 2 of tussen tyd 2 en tyd 3. Daar is egter 'n interaksie tussen tye 3 en 4. Binne-onderwerp kovariansie strukture Ons verklaar vroeër dat ons terug sal kry om die onderwerp van binne-onderwerp kovariansie strukture. So, laat ons kyk na 'n paar van die moontlike binne-onderwerp kovariansie strukture. Dit kovariansie struktuur behandel die herhaalde effekte as heeltemal onafhanklik, net asof die ontwerp was tussen-vakke. Saamgestelde simmetrie / uitruilbare herhaalde maatreëls ANOVA aanvaar dat die binne-onderwerp kovariansie struktuur saamgestelde simmetrie. Daar is 'n enkele variansie (1) vir elk van die pare van proewe. Dit word hieronder geïllustreer. Stata noem dit kovariansie struktuur verwissel. Ongestruktureerde Vir die ongestruktureerde kovariansie elke keer punt het sy eie variansie (bv 21 is die kovariansie van tyd 1 en tyd 2). Dit is die soort van kovariansie struktuur gevind meerveranderlike variansieanalise (MANOVA). Die nadeel van die gebruik van ongestruktureerde kovariansie is die groter aantal parameters word geskat. Outoregressiewe Nog 'n algemene kovariansie struktuur wat dikwels waargeneem word in herhaalde maatreëls data is 'n outoregressiewe struktuur, wat erken dat die kommentaar wat meer onmiddellike is meer gekorreleer as maatreëls wat meer ver is. Hieronder is 'n voorbeeld van 'n outoregressiewe 1 kovariansiematriks. Dit is ook moontlik om outoregressiewe 2 of 3 tipe strukture het. Benewens die kovariansie strukture hierbo getoon, Stata bied ook die volgende kovariansie strukture: bewegende gemiddelde, gebande, toeplitz en eksponensiële. Voorbeeld met ongestruktureerde kovariansie Na die inspeksie van ons binne-onderwerp kovariansiematriks, het ons besluit om ongestruktureerde binne-onderwerp kovariansie gebruik. Hier is die gesamentlike (multi mate van vryheid) toets vir die interaksie. toetse van eenvoudige effekte: TRT keer sedert die interaksie is statisties beduidend sal ons opvolg met 'n toets van 'n eenvoudige effekte van tyd by elke behandeling. Groeimodelle Lineêre groeimodel Dit is ook moontlik om die tyd te hanteer as 'n kontinue veranderlike, in welke geval, sou die model word beskou as 'n lineêre groeimodel wees. Om die interpretasie van die afsnit ons gaan tyd begin by nul in plaas van een te vereenvoudig. Ons doen dit deur die skep van 'n nuwe veranderlike ctime wat tyd - 1. Ons moet toelaat dat xtmixed weet dat ons die behandeling van ctime as deurlopende deur gebruik te maak van die c. voorvoegsel. Let by die gebruik van 'n gemengde model dit is nie nodig vir elke vak word gemeet op dieselfde tyd punte hoewel dit in ons geval hulle is almal gemeet op dieselfde vier keer punte. Hier is ons lineêre groeimodel. Soos jy kan sien die interaksie termyn is steeds statisties beduidend nie. Jy moet versigtig wees oor die interpretasie van TRT en ctime as hoof effekte in die ANOVA sin te wees. Die ctime koëffisiënt is die helling van y op ctime in die verwysingsgroep. Terwyl die koëffisiënt vir TRT is die verskil in die twee groepe toe ctime nul. Eenvoudige hange Ons kan die bevel marges te gebruik met die opsie dydx die hange van elk van die twee behandeling groepe kry. Let daarop dat die helling vir TRT 1 is dieselfde as die koëffisiënt vir ctime hierbo. Ons kan ook die verskil in die hange met behulp van die opdrag rande met verwysing groep kodering met behulp van die r toets. kontrasteer operateur. Dit is nie regtig nodig is om dit te doen omdat ons reeds weet dat die verskil in hellings is betekenisvol van die interaksie termyn hierbo. In werklikheid, as jy die Z-waarde te neem vir die interaksie (3,57) en vierkante dit (12,7449), kry jy die chi-kwadraat onder om getoon binne afronding fout.


No comments:

Post a Comment