Ho molti dati relativi alle serie storiche. Vorrei visualizzare questi dati, in modo da poter individuare modelli come il seguente:
"Circa cinque giorni dopo l'evento X, è molto probabile che si verifichi l'evento Y"
o
"Un breve scoppio nella frequenza dell'evento Z, rende probabile che anche l'evento Y si verifichi con una magnitudine extra elevata"
In particolare, non desidero descrivere i miei dati, in quanto sto cercando una soluzione generale a una domanda generale.
Modifica: la struttura della tabella semplificata è simile alla seguente:
thetime datetime
eventid int
magnitude double
intensity double
Prova a utilizzare una mappa termica a spirale per visualizzare i tuoi dati: questi sono eccellenti per aiutarti a individuare i modelli temporali. La dimensione temporale diventa una spirale, una rotazione all'anno o al mese e le altre variabili visualizzate come una mappa di calore.
TDWI ha n'intervista con Andrew Cardno, fondatore di Biz2 dove parla di questo approccio.
Divulgazione: Diversi anni fa, lavoravo per una delle precedenti attività di Andrew.
Mi piace grafici finanziari di Google , penso che sia un'ottima soluzione, in particolare il modo in cui sono stati collegati al grande grafico generale in basso:
E assicurati di esplorare le piccole interazioni all'interno - ad esempio, come al passaggio del mouse entrambi i grafici mostrano un'indicazione contemporaneamente (invece di disegnare una guida verticale che li collega).
Sembra un lavoro per grafici animati . Dovresti guardare discorso TED di Hans Rosling . È fantastico.
(Immagine da iwaterpolo su Wikipedia.)
Google ha un'implementazione che puoi provare.
Anche l'approccio al grafico delle finanze di Google potrebbe funzionare: basta tracciare l'intensità e l'intensità come due linee separate. Se esiste una correlazione tra le due misurazioni, le vedrai salire e scendere contemporaneamente. Se due misurazioni sono correlate negativamente (puoi verificare statisticamente questa ipotesi), puoi tracciare f(x) di una misurazione e -g (x) di un'altra. I grafici più semplici ottengono il punto un pubblico più ampio :)
Penso che funzionerà meglio usando i grafici. L'aspetto multidimensionale può essere gestito disegnando solo punti (o cerchi). Se si utilizza quindi quanto segue:
Penso che si speri che possano emergere schemi visivi.
Spero che sia di aiuto.
Statistiche. Il rilevamento e la previsione della correlazione delle serie temporali è il motivo per cui abbiamo inventato le statistiche. Dovresti leggere Covarianza e correlazione e autocorrelazione. Potresti essere particolarmente interessato ai correlogrammi e alla mappatura della covarianza.
Gli schemi visivi sono accurati, ma è facile per l'occhio credere di vedere schemi dove non ce ne sono, o è più probabile che manchino uno schema che potrebbe essere facilmente rilevato con una semplice analisi delle statistiche. In effetti, i modelli che altrimenti andrebbero persi nel rumore o nascosti in relazioni di fase complesse possono essere estratti e potenziati e resi visibili usando metodi statistici.
È davvero difficile dire se non sappiamo quali siano i dati. Come stai cercando di confrontare 10 tipi di eventi? Cento? Migliaia? E quanti dati vengono registrati per evento? Migliaia? Milioni? Ciò determinerebbe quale tipo di visualizzazione è possibile eseguire.
Se non hai un numero enorme di tipi di eventi, proverei qualcosa come piccoli multipli o un grafico a linee sfaccettato. Dato che hai sia magnitudo che intensità, puoi mappare la magnitudine sulla dimensione y e quindi mappare l'intensità sulla dimensione di un punto che si trova sul grafico.
Le carte Horizon sono anche qualcosa che potrebbe valere la pena guardare: https://square.github.io/cubism/
Un altro approccio potrebbe essere simile a quello che Stamen ha fatto per visualizzare i dati del NYSE qualche tempo fa: http://content.stamen.com/visualizing_a_day_of_financial_transactions_on_nasdaq