Finanční správa od zavedení elektronické evidence tržeb (EET) v prosinci 2016 až do současnosti provedla sice 113 tisíc kontrol a rozdala pokuty v řádech milionů, tvrdá a veřejností kontrolovatelná data o výběru DPH v souvislosti s EET však dosud k dispozici nebyla. Nyní to mění práce programátora Marka Sušického.

Ten si na základě zákona o svobodném přístupu k informacím od Finanční správy ČR vyžádal kompletní datové podklady k výběru EET od samotného počátku (od 1. 12. 2016 pro ubytovací a stravovací služby) až ke dni podání žádosti o informace, do listopadu 2017.

A nezůstalo zdaleka jen u hrubých dat. Počínaje dnešním dnem, 15. květnem 2018, spouští Sušický webové stránky datazeet.cz, kde přehledně zpracovaná data dává k dispozici všem.

„Finanční správa odpověděla na žádost o data z EET překvapivě kladně. Bylo potřeba něco zaplatit a chvíli počkat, ale nakonec jsme data v excelu dostali. Excel má 24MB a 142 tisíc řádek,” říká Sušický.

V datech lze volně a jednoduše vyhledávat podle krajů, předmětu činnosti či časového období, nabízejí přehled o nahlášených tržbách ze systému EET i o výběru daně z přidané hodnoty ve všech třech aktuálních sazbách.

„Finanční správa by byla schopna poskytnout data, jak přicházejí po hodinách. Díky tomu by bylo možné provést další analýzy, například odchodů z restauračních zařízení, největší nápory v obchodních střediscích a podobně,“ vysvětluje možnosti práce s daty z EET Marek Sušický.

Práce na takovém souboru dat by však podle Finanční správy vyšla žadatele na 150 tisíc korun. S ohledem na to, že data zpracovával z vlastního zájmu a ve volném čase, takový výdaj zavrhl. I tak stávající data nabízejí zajímavý potenciál.

Nejvýraznější zjištění je, že data jsou ve velkém nepořádku. Co to znamená?

Až do dubna zjevně do produkčního EET prosakovala testovací data. Některé řádky nedávají smysl. Celková tržba by měla vzniknout jako základ nepodléhající DPH a pak jednotlivé složky DPH ve výši 10, 15 a 21 %. Tento vzoreček platí jen u 782 řádků ze 142 tisíc. Tzn. pouze 0,55% řádků je úplně v pořádku.

Dle oficiálního vyjádření někdy obchodníci posílají informace o tržbách s mínusem. Někdy jsou v datech patrné omyly a jejich následné korekce – jeden den například obchodník vykáže obrovský nárůst tržeb (pravděpodobně jde omyl či chybu), v dalším dnu proto provede korekci opačným směrem.

Pro potřeby důkladné analýzy by bylo zapotřebí data čistit, což se nyní zjevně neděje (nebo nám poslaná data jsou nečištěná). Dostupná data jsou tedy dotčena jistou chybou, pro určité typy analýz je ale možné k nim nepřihlížet.

Další analýzy jsme proto prováděli nad daty od dubna 2017. K čemu jsme došli?

Protože jsme nedostali data za celý rok a první čtyři měsíce roku 2017 jsou zatíženy extrémní chybou, vzali jsme data od května za šest měsíců.

Za toto období se na DPH ve firmách používajících EET vybralo (evidovalo) 119 miliard korun. Ovšem v roce 2017 Ministerstvo financí deklaruje výběr DPH 381 miliard korun.

Při jednoduchém vynásobení (šest měsíců krát dva) se dostáváme na 238 miliard, což by znamenalo, že EET pokrývá cca 62,5 % vybíraného DPH.

To se zdá více, než je očekávaná hodnota, a opět to může vést k závěru, že poskytnutá data neodpovídají skutečnosti.

Z analýzy EET (pravidelnost)

Na diagramu je vidět jasná pravidelnost v objemu i dnech, kdy dochází k výběru DPH. Čtyři výrazné poklesy připadají na státní svátky, kdy musejí mít nově větší prodejny zavřeno.

Na základě těchto informací lze postavit rozumně fungující systém, který bude detekovat anomálie ve vybíraných částkách.

Díky tomuto lze také zodpovědět otázku, kolik stojí státní rozpočet svátky, kdy jsou nuceně zavřené obchody. Srovnejme dva květnové svátky: 1. května obchodníci zavírat nemusejí, 8. května ale ano a na diagramu je vidět pokles o cca 40 milionů korun.

Z dat je však patrné i to, jak se lidé před volnými dny předzásobují. Například 13. dubna 2017 byl výběr naopak rekordní – šlo o čtvrtek před volným Velkým pátkem a Velikonočním pondělím; nárůst ve výběru byl o 40 milionů korun.

Jde o velice prostou analýzu, která by zasloužila detailnější a delší rozbor, nicméně ukazuje potenciál těchto dat. Další zajímavá analýza by se mohla týkat například dnů mezi státními svátky, kdy si řada lidí bere dovolenou.

Hlavním problémem poskytnutých dat je datová kvalita a absence základních kontrol. Tím, že nesedí mnoho hodnot, se důvěryhodnost tohoto vzorku snižuje.

„EET je systém, který může zodpovědět mnoho otázek. Z výše uvedeného se domnívám, že finanční správa jeho význam zatím nedocenila a pravděpodobně neprovádí pokročilejší analýzy,” konstatuje Marek Sušický.

Redakce HlídacíPes.org požádala o reakci Finanční správu, do uzávěrky tohoto textu však odpověď nedorazila.

Sušický na druhé straně oceňuje spolupráci Finanční správy: „Velký dík jí patří za to, že data v agregované podobě poskytla, a tím umožnila vznik této a třeba i dalších analýz.“

