Co je to tabela de fatos
Slovo tabela pochází z portugalštiny a v kontextu datových skladů a business intelligence označuje především tabelu de fatos, tedy tabulku faktů. Tabulka faktů je centrální tabulka v dimenzionálním modelování dat, která uchovává kvantitativní ukazatele, míry, z obchodního procesu. Mezi typické míry patří například tržby, počty prodaných kusů, počet kliknutí nebo stav zásob. Její hlavní funkcí je umožnit agregaci a rychlé analytické dotazy, což je základem pro reporting a dashboardy. Tabulka faktů je obklopena dimenzionálními tabulkami, které poskytují kontext jako kdo, co, kdy a kde. Tento model se nazývá hvězdicové schéma nebo snowflake schéma v závislosti na normalizaci dimenzí. Každý záznam v tabulce faktů představuje jednu událost nebo stav v určitém okamžiku.

Přestože je termín tabela obecně chápán jako tabulka v portugalsky mluvících zemích, v odborné literatuře o datových skladech se používá právě pro označení tabulky faktů. Jejich základním rysem je vysoká granularita a velký objem dat. Každý řádek obsahuje kombinaci cizích klíčů a numerických měr. Právě díky této struktuře je možné rychle porovnávat výkonnost různých dimenzí, například srovnat tržby podle produktů, regionů a časových období. Tabulka faktů je tedy klíčovým prvkem pro rychlé srovnání v rámci business intelligence.

Struktura tabulky faktů
Tabulka faktů se skládá ze dvou typů sloupců. První typ jsou cizí klíče, které odkazují na primární klíče v dimenzionálních tabulkách. Tyto klíče vytvářejí vztahy a umožňují spojování tabulek během dotazů. Druhý typ jsou číselné míry, které lze agregovat pomocí funkcí jako suma, průměr, minimum nebo maximum. Každá míra představuje metrický ukazatel obchodního procesu. Granularita tabulky faktů určuje úroveň detailu, například jedna transakce, jeden denní součet nebo jedna událost na webu. Čím vyšší granularita, tím více řádků tabulka obsahuje, ale zároveň poskytuje přesnější informace.

Pro úspěšné dimenzionální modelování je důležité správně definovat klíče a míry. Cizí klíče by měly být co nejjednodušší a měly by odpovídat primárním klíčům dimenzí. Míry musí být numerické a musí mít smysl při agregaci. V některých případech se používají i takzvané degnerované dimenze, které jsou součástí tabulky faktů, ale nejsou odděleny do samostatné tabulky. Správná struktura tabulky faktů zásadně ovlivňuje výkon databáze a rychlost analytických dotazů.

Typy faktových tabulek
Existují tři hlavní typy tabulek faktů, které se liší způsobem zaznamenávání dat a vhodností pro různé scénáře:

Výběr správného typu závisí na obchodních požadavcích a povaze dat. Transakční tabulka je ideální pro detailní analýzy, periodický snímek pro pravidelné reporty a kumulativní snímek pro sledování životního cyklu procesu.
Srovnání s dimenzionálními tabulkami
Pro rychlé srovnání tabulky faktů a dimenzionální tabulky uvádíme následující přehled:
| Vlastnost | Tabulka faktů | Dimenzionální tabulka |
|---|---|---|
| Obsah | Číselné míry a cizí klíče | Popisné atributy jako názvy a kategorie |
| Účel | Uchovávání měřitelných dat pro agregace | Poskytování kontextu a filtrování |
| Granularita | Vysoká, jednotlivé události nebo souhrny | Nízká, jedna řádka na entitu |
| Aktualizace | Časté vkládání nových záznamů | Méně časté změny atributů |
| Množství dat | Velmi velké, miliony až miliardy řádků | Menší, stovky až tisíce řádků |
Tabulka faktů je navržena pro agregace a výpočty, zatímco dimenzionální tabulky slouží pro filtrování a popis. V hvězdicovém schématu je tabulka faktů spojena s několika dimenzemi pomocí cizích klíčů. Tento model je základem pro nástroje jako Power BI nebo Tableau. Detailní informace o rozdílech poskytuje zdroj Monte Carlo Data.
Role v datovém skladu
Tabulka faktů je srdcem každého datového skladu. Umožňuje rychlé srovnání a analýzu díky své struktuře orientované na míry. V praxi se používá pro vytváření KPI, trendů a srovnání mezi dimenzemi. Například v prodejním datovém skladu tabulka faktů obsahuje položky objednávek, míry jako cena a množství a cizí klíče na dimenzi produktu, zákazníka, času a pobočky. Díky tomu





