Nový velký třesk: velká a otevřená data

Fenomén“ big data“, neboli velkých dat, už v Evropě není žádnou novinkou. Všichni víme, co si pod tímto pojmem představit i jaké výzvy s sebou přináší. Big data představují tak komplexní soubory informací, že je nutné pro ně vymýšlet úplně nové formy zpracování. Na druhou stranu, big data otvírají tolik nových příležitostí, že by mohly představovat cestu k lepšímu rozhodování, objevování nových možností a optimalizaci procesů. Moc se mi líbí způsob, jakým je fenomén big data popsán ve zprávě společnosti Gartner z roku 2012: velký objem, velká rychlost a velká rozmanitost. V poslední době se ale na scéně začíná objevovat ještě jedna další dimenze: věrohodnost. V nejnovější fázi evropské ICT revoluce nejde jen o velká data – jde o velká a otevřená data. Termín „open data“ se používá hlavně v souvislosti s volným přístupem veřejnosti k informacím státních úřadů, samozřejmě při zachování všech principů ochrany soukromí, důvěrnosti a bezpečnosti údajů. A tím se dostáváme k věrohodnosti – big data a open data musí být zároveň i kvalitní data, založená na faktech a přesných informacích. V obecné rovině může volnější přístup k údajům shromažďovaným a generovaným veřejným sektorem, a jejich větší transparentnost, nastartovat další inovace, zlepšit informovanost různých průmyslových odvětví a zvýšit zodpovědnost státních úřadů a organizací. Je docela dobře možné, že se relativní úspěch, s jakým se země vyrovná s fenoménem velkých a otevřených dat, stává novým měřítkem společenského pokroku.

O dostupnosti údajů z veřejného sektoru a jeho celkové transparentnosti se v Evropské unii i v České republice vede debata už poměrně dlouho. Na české národní úrovni na začátku stála politická otázka, které typy informací se mají vůbec zpřístupnit, ale dnes se diskuse posunula do mnohem širšího měřítka. Je sice pravda, že český veřejný sektor už široké veřejnosti nabízí velmi pestrou škálu různých informací, ale pořád ještě nemůžeme mluvit o jejich skutečné dostupnosti, protože je velmi těžké najít přesně to, co člověk hledá, a když už se to podaří najít, použité formáty dat nejsou vždy standardní. Chce-li pak uživatel s daty smysluplně pracovat, potřebuje velkou dávku úsilí a někdy se i tak k dobrému výsledku nedopracuje.

Big data už skutečně nejsou ničím novým, což ale neznamená, že by bylo v tomto oboru vše vyřešeno. Velký objem velmi rozmanitých dat generovaných velkou rychlostí prostě nelze zvládat pomocí tradičních nástrojů informačních a komunikačních technologií (ICT). Mooreův zákon, který se často aplikuje u predikce a odhadu vývoje nových technologií, lze použít i pro zajímavou analýzu velkých dat. Sálové počítače, původně vyvinuté pro potřeby vlád a velkých firem, se během pouhých čtyř desetiletí zmenšily na velikost stolního zařízení pro běžné spotřebitele. Jejich výkon se každý rok zdvojnásobuje, to znamená, že každý rok vyprodukují dvojnásobné množství dat, než předchozí generace – a big data jsou na světě. A aby toho nebylo málo, občané dnes navíc očekávají i větší otevřenost. Země, které se naučí naplno využívat výhod velkých a otevřených dat, budou moci vybudovat transparentnější a odpovědnější veřejný sektor.

S výzvou, kterou dnes big data a open data představují, se snaží vypořádat spousta moderních zemí a hodně z nich se již udělalo velký pokrok na cestě ke zpřístupnění informací veřejnosti. Řada evropských zemí už v tomto směru začíná dýchat na záda Spojeným státům Americkým. Ostatní členské země EU včetně České republiky, na tom také nejsou vůbec špatně. Státní organizace ale budou ještě potřebovat čas na inventuru svých databází a na stanovení priorit pro zveřejňování údajů. Musí se také ujistit, že informace, které veřejnosti poskytnou a které samy o sobě nemusí být nijak citlivé, nebude možné v kombinaci s jinými údaji zneužít a porušit zásady důvěrnosti. Je nutné správně vyvážit, na jedné straně, nutnost omezit přístup k osobním údajům, citlivým a bezpečnostním informacím a, na druhé straně, snahu o co největší otevřenost.

Jelikož jsem optimista, tak tvrdím, že i přes všechny tyto komplikace big data přináší obrovský potenciál do budoucnosti. Vidím úžasnou příležitost k inovacím ve veřejné i soukromé sféře. Velká a otevřená data mohou být obrovským zdrojem inspirace pro malé i velké firmy ve všech odvětvích. A s inovacemi jde ruku v ruce vytváření hodnoty. Zpráva „Velká a otevřená data v Evropě: zdroj růstu nebo propásnutá šance?“ vypracovaná Varšavským institutem pro hospodářská studia odhaduje, že by politika EU-28 v této oblasti mohla do roku 2020 přinést růst HDP až o 206 miliard eur. To je růst HDP o 1.9% pouze díky novým IT řešením. Pokud dojde k rozšíření datových řešení, bude podle stejné zprávy růst HDP rozložen mezi všechna odvětví a sektory. Zpráva předpokládá, že nejvíce z tohoto vývoje získá obchod, který by měl v EU-28 zvýšit HDP o 23%. Výrobní průmysl by měl být na druhém místě s růstem 22%. Česká republika se tak díky svému vyspělému výrobnímu odvětví, které je pevně začleněno do mezinárodních dodavatelských řetězců, může těšit na dobré vyhlídky. Zpráva také zmiňuje, že finance, pojišťovnictví a veřejná správa mají růst o 13%. Tato růstová predikce, rozložená víceméně mezi všechny sektory a odvětví, odráží rostoucí produktivitu, efektivnější konkurenci a rozdělení produkce v rámci celé ekonomiky.

I malé společnosti mohou velkých a otevřených dat a nových technologií využít ve svůj prospěch, ke zvýšení vlastní konkurenceschopnosti. Podívejme se třeba na GPS (Global Positioning System), satelitní navigační systém americké armády. Je to učebnicový příklad, kdy se v osmdesátých letech president USA Ronald Reagan rozhodl, že světu otevře vládní informace a technologie. Podnikatelé po této úžasné příležitosti skočili a vlna inovací na sebe nenechala dlouho čekat: navigace pro auta, mobilní telefony, meteorologické nástroje, přesné informace pro zemědělce, atd. Můžete namítnout, že na GPS založené inovace nejsou pro business až tak důležité, ale s oficiální předpovědí počasí pracuje každý, od prodejce párků v rohlíku po makléře na burze. Dovolím si předpovědět, že open data v soukromém sektoru přináší další velký technologický třesk a že za dveřmi se už chystá nová smršť inovací. A stejně tak se nebojím tvrdit, že dřív nebo později bude většina podniků ve své každodenní práci nějakým způsobem využívat informace z veřejných zdrojů.

Chceme-li ale úspěšně realizovat inovace, které open data umožní, musíme nejdřív do detailů dořešit podmínky na politické úrovni Evropské unie.

Ze všeho nejdřív je nutné pořádně pochopit, co vlastně velká a otevřená data znamenají, a všechny členské státy si musí své vlastní informace uspořádat a stanovit priority. Velmi důležité bude i nastavení dobrého právního rámce pro ochranu soukromí, důvěrnost informací a bezpečnost. Informace shromažďované veřejnou správou jsou sice veřejným majetkem, ale nesmí docházet k narušení soukromí jednotlivců. Do budoucna můžeme doufat, že harmonizace zákonů o ochraně soukromí povede k posílení jednotného digitálního trhu a zároveň občanům umožní stanovit, které své informace si zveřejnit nepřejí. Soukromý sektor tak bude mít jistotu, že údaje, které se jim do rukou dostanou, pochází z transparentních zdrojů a byly získány dle jasně daných pravidel.

Zadruhé, přínos velkých a otevřených dat bude záviset i na technologiích pro jejich sběr, přenos, ukládání, zpracování a analýzu. Evropské země musí do svých procesů začlenit ICT řešení s širším uplatněním a lepší vzájemnou součinností, jako např. cloud computing. Příkladem ale nemají jít pouze centrální vlády. Svou trochou musí přispět i regionální úřady a samosprávy. Ve Spojeném království je jednou z prvních vlaštovek třeba dopravní podnik města Manchester, který se snaží z big data vytěžit co největší hospodářský i společenský užitek. Městský dopravce vytvořil platformu založenou na open datech a cloud computingu, jejímž smyslem je pomoci cestujícím lépe plánovat svou cestu a víc si cestování užít. Regionální dopravní informace jsou v rámci této platformy ukládány ve Windows Azure. Jelikož jsou tyto údaje veřejně přístupné, už více než 100 nezávislých programátorů a podnikatelů nabízí real-time mobilní aplikace s užitečnými informacemi od možností parkování přes umístění zastávek po jízdní řády.

Třetí, a pro mě osobně nejdůležitější, úkol, který před námi stojí, je silná podpora výchovy nových, talentovaných odborníků v oblasti vědy, techniky, technologií a matematiky. Na národní úrovni nesmí členské státy EU slevovat ze svých investic do vzdělávání, protože to budou právě dnešní a budoucí studenti, kdo se bude muset jednou s výzvami, které s sebou big data nesou, vypořádat. K analýze a zpracování informací se samozřejmě již dnes používají např. nástroje business intelligence, ale velká a otevřená data si vyžádají mnohem sofistikovanější přístup a systém. Evropa proto musí ještě zvýšit výdaje na technické a matematické studijní obory, chce-li vychovat skutečné experty schopné v praxi realizovat potenciál, který big data otvírají. Data vytržená z kontextu samozřejmě nemají žádný význam, a proto budeme brzy potřebovat a hodně chytrých analytiků, kteří je budou umět použít v praktických řešeních.

Revoluce zvaná big data je už na cestě. Když se k ní teď přidají i open data, věřím, že heslem dne se brzy stane transparentnost jako prostředek inovace. Nastává čas velkých a otevřených dat a jejich exponenciálního růstu. Moc se těším, že se evropští podnikatelé nechají tímto fenoménem inspirovat, a rád se nechám ohromit jejich nápady, jejichž výsledky, doufám, předčí i dopad, který měl na svět před třiceti lety systém GPS.