it-swarm-eu.dev

Vizualizujte data časové řady

Mám spoustu časových řad. Chtěl bych si tato data vizualizovat, abych mohl spatřit vzory jako je následující:

"Asi pět dní po události X se velmi pravděpodobně stane událost Y"

nebo

"Krátký výkyv ve frekvenci události Z způsobuje, že také událost Y se stane s mimořádně vysokou velikostí."

Konkrétně nechci popisovat, o čem jsou moje údaje, protože hledám obecné řešení obecné otázky.

Upravit: Zjednodušená struktura tabulky je následující:

thetime datetime
eventid int
magnitude double
intensity double
9
David

Pokuste se vizualizovat svá data pomocí spirálové tepelné mapy - to je výborná pomoc při hledání časových vzorců. Vaše časová dimenze se stane spirálou, jednou rotací za rok nebo měsíc a vaše další proměnné se zobrazí jako mapa tepla.

enter image description here

TDWI má rozhovor s zakladatel Biz2 Andrew Cardno , kde mluví o tomto přístupu.

Zveřejnění: Před několika lety jsem pracoval pro jeden z Andrewových dřívějších obchodů.

10
Bevan

Líbí se mi google finanční grafy , myslím, že je to skvělé řešení, zejména jak jej propojili s velkým přehledovým grafem dole:

enter image description here

A ujistěte se, že prozkoumáte malé interakce uvnitř - například, jak na mouseover oba grafy ukazují indikaci najednou (místo nakreslení svislého průvodce spojující je).

4

Zní to jako úloha pro pohybové mapy . Měli byste sledovat řeč TED Hanse Roslinga . Je to úžasné.

animated gif demonstrating a motion chart

(Obrázek z iwaterpolo na Wikipedii.)

Google má implementaci , kterou si můžete vyzkoušet.

2

Přístup k finančním grafům Google by také mohl fungovat - stačí vykreslit velikost a intenzitu jako dvě oddělené řádky. Pokud existuje korelace mezi těmito dvěma měřeními, uvidíte, jak jdou nahoru a dolů současně. Pokud jsou dvě měření negativně korelována (tuto hypotézu můžete statisticky otestovat), můžete vykreslit f(x) jednoho měření a -g (x) druhého). širší publikum :)

2
lynxoid

Myslím, že to bude fungovat nejlépe pomocí grafů. S aspektem vícerozměrného by se dalo nakládat tak, že kreslí jen tečky (nebo kruhy). Pokud použijete následující:

  • X je čas
  • Y je velikost
  • každá událost má svou vlastní barvu
  • a každá tečka je větší na základě intenzity

Myslím, že by se snad mohly objevit vizuální vzory.

Snad to pomůže.

1
nathanvda

Statistika. Detekce a predikce korelace časové řady je důvodem, proč jsme vynalezli statistiky. Měli byste si přečíst o Covariance a korelaci a autokorelaci. Možná vás bude zajímat Correlograms and Covariance Mapping.

Vizuální vzory jsou elegantní, ale pro oko je snadné uvěřit, že vidí vzory tam, kde žádné neexistují, nebo je pravděpodobnější, že vynecháte vzorek, který by se snadno zjistil pomocí jednoduché analýzy statistik. Ve skutečnosti lze vzorce, které by jinak byly ztraceny v šumu nebo skryté ve složitých fázových vztazích, extrahovány a vylepšeny a zviditelněny statistickými metodami.

0
Noah Spurrier

Je opravdu těžké říct, jestli nevíme, jaká data jsou. Jako byste se snažili porovnat 10 typů událostí? Sto? Tisíce? A kolik dat poitns na událost? Tisíce? Miliony? To by určilo, jaký druh vizualizace můžete udělat.

Pokud nemáte velké množství typů událostí, zkusil bych něco jako malé násobky nebo fazetovaný čárový graf. Protože máte jak velikost, tak intenzitu, můžete namapovat velikost na rozměr y a poté intenzitu mapovat na velikost bodu, který je na grafu.

Horizonty jsou také něco, na co by se vyplatilo podívat: https://square.github.io/cubism/

Jiný přístup by mohl být podobný tomu, co Stamen před vizualizací dat NYSE udělal před časem: http://content.stamen.com/visualizing_a_day_of_financial_transactions_on_nasdaq

0
bobfet1