Thursday 26 October 2017

How-To Calcolo Asimmetria E Curtosi In Stata Forex


Asimmetria e curtosi Un compito fondamentale in molte analisi statistiche è quello di caratterizzare la posizione e la variabilità di un insieme di dati. Un ulteriore caratterizzazione dei dati comprende asimmetria e curtosi. Asimmetria è una misura di simmetria, o più precisamente, la mancanza di simmetria. Una distribuzione, o insieme di dati, è simmetrica se sembra la stessa a sinistra ea destra del punto centrale. Curtosi è una misura se i dati sono pesanti dalla coda o leggera coda rispetto a una distribuzione normale. Cioè, insiemi di dati con elevata curtosi tendono ad avere code pesanti, o valori anomali. I set di dati con un basso curtosi tendono ad avere code di luce, o la mancanza di valori anomali. Una distribuzione uniforme sarebbe il caso estremo. L'istogramma è una tecnica grafica efficace per mostrare sia l'asimmetria e curtosi di set di dati. Definizione di Skewness Per i dati univariata Y 1. Y 2. S N. la formula per skewness è: g frac (Y - bar) N dove (bar) è la media, s è la deviazione standard, e N è il numero di punti di dati. Si noti che nel calcolo della asimmetria, la s viene calcolata con N nel denominatore piuttosto che N - 1. sopra formula per asimmetria è definito come il coefficiente di Fisher-Pearson di asimmetria. Molti programmi software in realtà calcolare il coefficiente di regolare Fisher-Pearson di asimmetria G frac frac (Y - bar) N Questo è un adeguamento per dimensione del campione. La regolazione si avvicina a 1 come N diventa grande. Per riferimento, il fattore di aggiustamento è 1.49 per N 5, 1.19 per 10 N, 1.08 per 20 N, 1,05 per la N 30, e 1,02 per N 100. Il asimmetria di una distribuzione normale è pari a zero, e tutti i dati simmetrici dovrebbe avere una asimmetria vicino allo zero. I valori negativi per l'asimmetria indicano i dati che sono i valori distorta sinistra e positivi per l'asimmetria indicano i dati che è giusto distorta. Con inclinata a sinistra, si intende che la coda sinistra è lunga rispetto alla coda destra. Analogamente, asimmetrica a destra significa che la coda destra è lunga rispetto alla coda sinistra. Se i dati sono multi-modale, allora questo può influenzare il segno della asimmetria. Alcune misure hanno un limite inferiore e hanno ragione distorta. Ad esempio, in studi di affidabilità, tempi di guasto non può essere negativo. Va notato che esistono definizioni alternative di asimmetria in letteratura. Ad esempio, l'asimmetria Galton (noto anche come Bowleys asimmetria) è definito come Mbox frac Q -2 Q - Q dove Q 1 è il quartile inferiore, Q 3 è il quartile superiore, e Q 2 è l'asimmetria median. The Pearson 2 coefficiente è definito come S 3 frac - tilde) dove (tilde) è la mediana del campione. Ci sono molte altre definizioni per asimmetria che non sarà discusso qui. Definizione di curtosi Per i dati univariata Y 1. Y 2. S N. la formula per la curtosi è: mbox frac (Y - bar) N dove (bar) è la media, s è la deviazione standard, e N è il numero di punti di dati. Si noti che nel calcolo della curtosi, la deviazione standard è calcolata utilizzando N nel denominatore piuttosto che N - Definizione 1.Alternative di curtosi La curtosi di una distribuzione normale standard è tre. Per questo motivo, alcune fonti usano la seguente definizione di curtosi (spesso definito come l'eccesso di curtosi): Mbox Frac (Y - bar) N - 3 Questa definizione è utilizzata in modo che la distribuzione normale standard ha una curtosi pari a zero. Inoltre, con la seconda definizione curtosi positiva indica una distribuzione pesante dalla coda e curtosi negativa indica una distribuzione della luce coda. Quale definizione di curtosi è usato è una questione di convenzione (presente manuale utilizza la definizione originale). Quando si utilizza il software per calcolare la curtosi di esempio, è necessario essere consapevoli di quali convenzione viene seguita. Molte fonti usano il termine curtosi quando sono in realtà Computing curtosi in eccesso, quindi non può essere sempre chiara. L'esempio seguente mostra istogrammi per 10.000 numeri casuali generati da una normale, una doppia esponenziale, un Cauchy, e una distribuzione Weibull. Il primo istogramma è un campione da una distribuzione normale. La distribuzione normale è una distribuzione simmetrica con code ben educati. Questo è indicato dal asimmetria di 0,03. La curtosi di 2.96 si trova vicino al valore atteso pari a 3. L'istogramma verifica la simmetria. Doppia distribuzione esponenziale Il secondo istogramma è un campione da una distribuzione doppia esponenziale. Il doppio esponenziale è una distribuzione simmetrica. Rispetto al normale, ha un picco più forte, più rapido decadimento, e code pesanti. Cioè, ci si aspetterebbe una asimmetria vicino allo zero e una curtosi maggiore di 3. L'asimmetria è 0,06 e la curtosi è 5.9. Il terzo istogramma è un campione da una distribuzione di Cauchy. Per una migliore confronto visivo con gli altri insiemi di dati, abbiamo ristretto l'istogramma della distribuzione di Cauchy a valori compresi tra -10 e 10. I dati completi per i dati di Cauchy, infatti, ha un minimo di circa -29.000 e un massimo di circa 89.000. La distribuzione Cauchy è una distribuzione simmetrica con code pesanti e un singolo picco al centro della distribuzione. Dal momento che è simmetrica, ci si aspetterebbe una asimmetria vicino allo zero. A causa delle code più pesanti, potremmo aspettarci la curtosi di essere più grande rispetto a una distribuzione normale. In effetti l'asimmetria è 69.99 e la curtosi è 6.693. Questi valori estremamente elevati possono essere spiegati con le code pesanti. Proprio come la media e la deviazione standard può essere distorta da valori estremi nelle code, possono farlo anche le misure di asimmetria e curtosi. Il quarto istogramma è un campione da una distribuzione Weibull con parametro di forma 1.5. La distribuzione Weibull è una distribuzione asimmetrica con la quantità di asimmetria a seconda del valore del parametro di forma. Il grado di degrado come ci si allontana dal centro dipende anche dal valore del parametro di forma. Per questo insieme di dati, l'asimmetria è 1.08 e il curtosi è 4,46, che indica asimmetria moderata e curtosi. Trattare con asimmetria e curtosi Molti test statistici classici e gli intervalli dipendono su ipotesi di normalità. asimmetria significativa e curtosi indicano chiaramente che i dati non sono normali. Se un set di dati presenta asimmetria significativa o curtosi (come indicato da un istogramma o le misure numeriche), cosa possiamo fare su di esso Un approccio è quello di applicare un certo tipo di trasformazione per cercare di rendere i dati normale, o più quasi normale. La trasformazione Box-Cox è una tecnica utile per cercare di normalizzare un insieme di dati. In particolare, tenuto il registro o radice quadrata di un insieme di dati è spesso utile per i dati che mostrano moderata asimmetria destra. Un altro approccio è quello di utilizzare tecniche basate su distribuzioni diverse dalla normale. Ad esempio, in studi di affidabilità, l'esponenziale, Weibull e distribuzioni lognormale sono tipicamente usati come base per la modellazione piuttosto che utilizzare la distribuzione normale. La trama coefficiente di correlazione della probabilità e la trama probabilità sono strumenti utili per determinare un buon modello distributivo per i dati. I coefficienti di asimmetria e curtosi sono disponibili nella maggior parte dei software statistico general purpose programs. NOTICE: Il gruppo di consulenza statistica Idre sarà la migrazione del sito web per il CMS WordPress nel mese di febbraio per facilitare la manutenzione e la creazione di nuovi contenuti. Alcune delle nostre pagine più vecchie verranno rimossi o archiviati in modo tale che essi non saranno più mantenuti. Cercheremo di mantenere i reindirizzamenti in modo che i vecchi URL continueranno a lavorare nel miglior modo possibile. Benvenuti al Istituto per la ricerca e l'istruzione digitale Aiuto Consulting Group Stat dando un regalo FAQ: Che cosa è con le diverse formule per curtosi Nel descrivere la curtosi forma distribuzioni statistiche si riferisce al peakedness o piattezza della distribuzione. Diversi pacchetti statistici calcolano valori alquanto differenti per curtosi. Quali sono le diverse formule utilizzate e quali pacchetti uso che formula Inizieremo definendo due diverse somme di punteggi di deviazione alimentati. Il primo, s2. è la somma dei punteggi di deviazione quadrati mentre s4 è la somma dei punteggi di deviazione elevato alla quarta potenza. In seguito, definiremo m 2 per essere il secondo momento circa la media di x e M 4 di essere il quarto momento. Inoltre, V (x) sarà la stima non distorta della varianza della popolazione. Ora possiamo andare avanti e iniziare a guardare alcune formule per curtosi. La prima formula è quella che può essere trovato in molti libri, tra cui statistiche Snedecor e Cochran (1967). E 'utilizzato da SAS in proc significa che quando specificando l'opzione vardefn. Questa formula è quello più comunemente trovati in testi generali statistica. Con questa definizione una distribuzione normale ideale avrebbe un curtosi pari a zero. La seconda formula è quella usata da Stata con il comando riassumere. Questa definizione di curtosi può essere trovato in Bock (1975). L'unica differenza tra Formula 1 e Formula 2 è il -3 in formula 1. Così, con questa formula una distribuzione normale ideale avrebbe un curtosi di tre. La terza formula, qui di seguito, può essere trovato in Sheskin (2000) e viene utilizzato da SPSS e SAS proc significa quando si specifica l'opzione di vardefdf o per difetto se l'opzione vardef viene omessa. Questa formula utilizza le stime imparziali di varianza e del quarto momento circa la media. Il valore previsto per la curtosi con una distribuzione normale è zero. Formula 1 - SAS Formula 2 - Stata Formula 3 - SAS Formula 3 - Riferimenti SPSS Bock, R. D. (1975) multivariata Metodi statistici in Behavioral Research. New York: McGraw-Hill. Joanest, D. N. e Gill, C. A. (1998) Confrontando le misure di asimmetria campione e curtosi. Lo statistico, 47. pp 183-189. Sheskin, D. J. (2000) Manuale di Parametric e Procedure statistiche non parametrici, Second Edition. Boca Raton, Florida: Chapman amp HallCRC. Snedecor, G. W. e Cochran, W. G. (1967) Metodi statistici, sesta edizione. Ames, Iowa: Iowa State University Press. Il contenuto di questo sito web non deve essere interpretata come un'approvazione di un particolare sito web, il libro, o di un prodotto software dalla University of California.

No comments:

Post a Comment