Tabela: přehledná tabulka pro rychlé srovnání

Co je to tabela de fatos

Slovo tabela pochází z portugalštiny a v kontextu datových skladů a business intelligence označuje především tabelu de fatos, tedy tabulku faktů. Tabulka faktů je centrální tabulka v dimenzionálním modelování dat, která uchovává kvantitativní ukazatele, míry, z obchodního procesu. Mezi typické míry patří například tržby, počty prodaných kusů, počet kliknutí nebo stav zásob. Její hlavní funkcí je umožnit agregaci a rychlé analytické dotazy, což je základem pro reporting a dashboardy. Tabulka faktů je obklopena dimenzionálními tabulkami, které poskytují kontext jako kdo, co, kdy a kde. Tento model se nazývá hvězdicové schéma nebo snowflake schéma v závislosti na normalizaci dimenzí. Každý záznam v tabulce faktů představuje jednu událost nebo stav v určitém okamžiku.

Tabela: přehledná tabulka pro rychlé srovnání - 1

Přestože je termín tabela obecně chápán jako tabulka v portugalsky mluvících zemích, v odborné literatuře o datových skladech se používá právě pro označení tabulky faktů. Jejich základním rysem je vysoká granularita a velký objem dat. Každý řádek obsahuje kombinaci cizích klíčů a numerických měr. Právě díky této struktuře je možné rychle porovnávat výkonnost různých dimenzí, například srovnat tržby podle produktů, regionů a časových období. Tabulka faktů je tedy klíčovým prvkem pro rychlé srovnání v rámci business intelligence.

Tabela: přehledná tabulka pro rychlé srovnání - 2

Struktura tabulky faktů

Tabulka faktů se skládá ze dvou typů sloupců. První typ jsou cizí klíče, které odkazují na primární klíče v dimenzionálních tabulkách. Tyto klíče vytvářejí vztahy a umožňují spojování tabulek během dotazů. Druhý typ jsou číselné míry, které lze agregovat pomocí funkcí jako suma, průměr, minimum nebo maximum. Každá míra představuje metrický ukazatel obchodního procesu. Granularita tabulky faktů určuje úroveň detailu, například jedna transakce, jeden denní součet nebo jedna událost na webu. Čím vyšší granularita, tím více řádků tabulka obsahuje, ale zároveň poskytuje přesnější informace.

Tabela: přehledná tabulka pro rychlé srovnání - 3

Pro úspěšné dimenzionální modelování je důležité správně definovat klíče a míry. Cizí klíče by měly být co nejjednodušší a měly by odpovídat primárním klíčům dimenzí. Míry musí být numerické a musí mít smysl při agregaci. V některých případech se používají i takzvané degnerované dimenze, které jsou součástí tabulky faktů, ale nejsou odděleny do samostatné tabulky. Správná struktura tabulky faktů zásadně ovlivňuje výkon databáze a rychlost analytických dotazů.

Tabela: přehledná tabulka pro rychlé srovnání - 4

Typy faktových tabulek

Existují tři hlavní typy tabulek faktů, které se liší způsobem zaznamenávání dat a vhodností pro různé scénáře:

Tabela: přehledná tabulka pro rychlé srovnání - 5

  • Transakční tabulka faktů: obsahuje záznamy o jednotlivých událostech jako je prodej, kliknutí na reklamu nebo příjem na sklad. Každý řádek představuje jednu transakci. Tento typ poskytuje nejvyšší granularitu a umožňuje detailní analýzu času a událostí.
  • Periodická snímková tabulka: zachycuje stav v pravidelných intervalech, například měsíční zůstatek zásob nebo denní počet aktivních uživatelů. Řádky se přidávají vždy v daném čase a ukazují agregovaný stav k tomuto okamžiku.
  • Kumulativní snímková tabulka: sleduje průběh procesu v čase, například objednávku od přijetí po doručení. Každý řádek se aktualizuje a přidává se pouze v okamžiku nové události. Tento typ je vhodný pro procesy s více kroky.
  • Výběr správného typu závisí na obchodních požadavcích a povaze dat. Transakční tabulka je ideální pro detailní analýzy, periodický snímek pro pravidelné reporty a kumulativní snímek pro sledování životního cyklu procesu.

    Srovnání s dimenzionálními tabulkami

    Pro rychlé srovnání tabulky faktů a dimenzionální tabulky uvádíme následující přehled:

    VlastnostTabulka faktůDimenzionální tabulka
    ObsahČíselné míry a cizí klíčePopisné atributy jako názvy a kategorie
    ÚčelUchovávání měřitelných dat pro agregacePoskytování kontextu a filtrování
    GranularitaVysoká, jednotlivé události nebo souhrnyNízká, jedna řádka na entitu
    AktualizaceČasté vkládání nových záznamůMéně časté změny atributů
    Množství datVelmi velké, miliony až miliardy řádkůMenší, stovky až tisíce řádků

    Tabulka faktů je navržena pro agregace a výpočty, zatímco dimenzionální tabulky slouží pro filtrování a popis. V hvězdicovém schématu je tabulka faktů spojena s několika dimenzemi pomocí cizích klíčů. Tento model je základem pro nástroje jako Power BI nebo Tableau. Detailní informace o rozdílech poskytuje zdroj Monte Carlo Data.

    Role v datovém skladu

    Tabulka faktů je srdcem každého datového skladu. Umožňuje rychlé srovnání a analýzu díky své struktuře orientované na míry. V praxi se používá pro vytváření KPI, trendů a srovnání mezi dimenzemi. Například v prodejním datovém skladu tabulka faktů obsahuje položky objednávek, míry jako cena a množství a cizí klíče na dimenzi produktu, zákazníka, času a pobočky. Díky tomu

    tabela tabulka přehled srovnání data informace
    Upozornění Obsah má pouze informativní charakter.
    Autor

    Stefano Barcellos

    Přispěvatel na Visite Barbados.

    « Předchozí příspěvek
    Film: nejlepší novinky, recenze a trailery

    Související příspěvky