Velká data
Kenneth Cukier Viktor Mayer-Schönberger
Velká data
Big Data
Kenneth Cukier Viktor Mayer-Schönberger
Proč číst tuto knihu
Co se naučíte a získáte
- Zjistíte, jak velká data ovlivňují každodenní život a podnikání.
- Naučíte se, jak interpretovat data a využívat je k rozhodování.
- Zlepšíte své dovednosti v analýze dat a rozpoznávání vzorců.
- Pochopíte, jak mohou být velká data nástrojem pro inovaci a zlepšení procesů.
- Získáte inspiraci k tomu, jak efektivně využívat data ve svých projektech a iniciativách.
O knize
Podrobný přehled a kontext
Vítejte ve fascinujícím světě Velkých dat, kde každé kliknutí, každá interakce a každá informace vytváří obrovské množství dat, které čekají na to, aby byla využita. Kenneth Cukier a Viktor Mayer-Schönberger vás provedou touto rozmanitou krajinou, kde se data stávají nejen cenným zdrojem informací, ale i klíčem k vašemu úspěchu v dnešním digitálním světě.
Tato kniha není jen o technologiích; je to především o tom, jak se naučit interpretovat data a využívat je ve svůj prospěch. Autoři vám ukáží, jak velká data mění náš pohled na svět, jak ovlivňují rozhodování a jak mohou být mocným nástrojem pro inovace a efektivitu. S jejich příběhy a příklady z praxe se dozvíte, jak transformovat složitá čísla na užitečné poznatky.
Pokud toužíte po hlubším porozumění tomu, jak využít data k dosažení svých cílů, je kniha Velká data vaším nezbytným průvodcem. Společně se naučíte, jak být o krok napřed a přetvořit zdánlivě chaotické informace na smysluplné strategie a rozhodnutí.
Čtutáty
Moudra a inspirace z knihy
"Data nejsou jen čísla; jsou to příběhy čekající na to, aby byly vyprávěny."
"V dnešním světě, kde je informace king, jsou velká data vaší korunou."
"Interpretační dovednosti jsou novým klíčem k úspěchu v digitální ekonomice."
"Největší moudrost nespočívá v tom, co víme, ale v tom, co dokážeme udělat s informacemi, které máme."
"Velká data nás učí, že v detailu se skrývá odpověď na otázky, které nás trápí."
O autorovi
Kenneth Cukier Viktor Mayer-Schönberger
Klíčová myšlenka 1 z 14
Velká data poskytují poznatky, které bychom nemohli objevit analýzou dat v menším měřítku.
Před nástupem počítačů bylo shromažďování a zaznamenávání informací náročné a časově velmi náročné. Pro ilustraci si vezměme informace potřebné k provedení sčítání lidu. Podle americké ústavy se musí sčítání konat každých deset let; sčítání v roce 1880 však trvalo více než osm let, než bylo dokončeno a zveřejněno. To znamenalo, že údaje byly zastaralé ještě dříve, než se vůbec dostaly na veřejnost.
To ale byla minulost. Dnes – s vynálezem počítačů, s digitalizací a internetem – se situace dramaticky změnila. Informace lze shromažďovat pasivně (nebo s mnohem menším úsilím), mnohem rychleji a jejich ukládání je stále levnější. Tím jsme se dostali do éry velkých dat.
Formální definice neexistuje, ale „velká data“ obvykle označují jednak data shromažďovaná v nesrovnatelně větším měřítku než dříve, jednak příležitosti, které takto rozsáhlé datové soubory nabízejí – tedy nové, cenné poznatky, jež lze odhalit jejich analýzou.
V roce 2009 Google názorně ukázal možnosti velkých dat, když zveřejnil výzkum, v němž na základě analýzy vyhledávacích dotazů uživatelů dokázal předpovídat výskyt chřipky a sledovat její šíření. Porovnal historická data o vyhledávání s údaji o šíření chřipky v čase a prostoru z let 2007 a 2008 a identifikoval 45 vyhledávacích dotazů, které bylo možné použít ve vzorci pro předpověď šíření chřipky – a tato předpověď silně korelovala s oficiálními statistikami.
Jen několik týdnů po zveřejnění studie se na titulních stranách objevila zpráva o vypuknutí nové, smrtelné varianty chřipky H1N1. Google svůj systém okamžitě nasadil a získané ukazatele se ukázaly být včasnější a v mnoha ohledech užitečnější než vládní statistiky – poskytly totiž cenné informace orgánům veřejného zdravotnictví.
Velká data nám tedy umožňují získávat poznatky, které by z menších datových souborů vůbec nebylo možné vydolovat.
Klíčová myšlenka 2 z 14
Data se stále více shromažďují a využívají ve všech aspektech našich životů, od velikosti našich pozadí po způsob, jakým chodíme.
S nástupem internetových společností, jako jsou Facebook či Twitter, a s rostoucí oblibou chytrých zařízení jsme si zvykli na to, že naše vztahy, komentáře, preference i poloha se ukládají jako data, která lze následně analyzovat. Tento trend je součástí procesu datifikace – převádění informací o světě do podoby dat.
Protože z těchto dat dokážeme získávat cenné poznatky, lze očekávat, že datifikace bude dále sílit a objeví se nové způsoby sběru dat i z takových zdrojů, které jsme dříve vůbec nepovažovali za informační.
Příkladem je výzkum v japonském Advanced Institute of Industrial Technology, kde se používají tlakové senzory k měření rozložení hmotnosti, kterou naše tělo vyvíjí na sedadlo v autě. Ukázalo se, že podle tohoto „tlakového otisku“ lze jednotlivce identifikovat tak přesně, že by rozložení hmotnosti mohlo sloužit jako bezpečnostní prvek: vůz by nastartoval pouze řidiči, kterého „pozná“.
Potenciál datifikace si uvědomily i další firmy. Apple si v roce 2009 podal patentovou přihlášku na pasivní měření okysličení krve, srdečního tepu a tělesné teploty uživatelů prostřednictvím svých sluchátek. Podobně získala IBM v roce 2012 patent na dotykově citlivé podlahové krytiny, které mohou rozpoznávat, kde a jak se po nich různí lidé pohybují.
Jak tyto příklady ukazují, výzkumníci už dnes využívají zdroje informací, které jsme dříve za data vůbec nepovažovali. Cílem je odhalit cenné poznatky o tom, jak se chováme a jak interagujeme se světem, a na tomto základě vytvářet inovativní produkty.
Data se tak stále více shromažďují a využívají ve všech aspektech našich životů – od velikosti našeho pozadí až po způsob, jakým chodíme.
Klíčová myšlenka 3 z 14
Velká data nás osvobozují od omezení používání malých vzorků dat k reprezentaci celých populací.
Před současnou érou internetu a výpočetní techniky bylo shromažďování a zaznamenávání informací mnohem obtížnější. Tomu odpovídalo i to, že jsme dokázali nasbírat jen velmi omezené množství dat a pak se je snažili co nejlépe interpretovat.
Představte si například, že chcete před nadcházejícími komunálními volbami provést telefonický průzkum voličů. Je zřejmé, že není možné obvolat celou populaci, a tak zavoláte několika stovkám lidí a předpokládáte, že jejich odpovědi odrážejí názory všech voličů. Tento přístup se nazývá vzorkování: vezmete vzorek všech dat a doufáte, že je reprezentativní pro celou populaci.
Co když se vás ale po skončení průzkumu novinář zeptá, zda dokážete předpovědět volební chování konkrétního segmentu populace, například státních zaměstnanců? Když se podíváte do svých dat, zjistíte, že jste se ptali jen deseti takových lidí, takže vaše předpověď nemůže být příliš spolehlivá. A co když se novinář zeptá na ještě specifičtější podskupinu, třeba státní zaměstnance mladší 30 let? Tentokrát jste v průzkumu zachytili jen jednoho takového člověka – a na základě jediného případu už nelze dělat žádné závěry.
To je základní problém vzorkování: jakmile začnete zkoumat menší a menší podskupiny, rychle zjistíte, že máte příliš málo pozorování na to, abyste mohli vyvozovat smysluplné závěry.
Ve světě velkých dat je sběr informací mnohem snazší – máme přístup k nesrovnatelně větším objemům dat, a v některých případech dokonce k téměř úplným souborům. V „verzi s velkými daty“ byste tedy u volebního průzkumu pravděpodobně měli údaje o preferencích desítek tisíc lidí, možná dokonce o všech voličích ve vašem městě. To by vám umožnilo „přibližovat“ se k podskupinám v datech téměř bez omezení.
Velká data nás tak do značné míry osvobozují od nutnosti spoléhat se na malé vzorky, které mají reprezentovat celé populace.
Zamčené kapitoly (11)
- 4Obrovské množství neuspořádaných dat může být užitečnější než menší, přesnější soubory.
- 5Velká data nám neříkají, proč jsou dvě věci propojené, jen že jsou, ale i to často stačí.
- 6Ačkoli jsou data obvykle sbírána za konkrétním účelem, často existují sekundární aplikace, které mají ještě větší hodnotu.
- 7Kdokoliv může objevit nové příležitosti, jak vytvářet hodnotu z dat kolem sebe – stačí mít správné myšlení.
- 8Kombinace datových sad může vytvořit větší hodnotu než jednotlivé části.
- 9Online služby jako Facebook zaznamenávají všechno, co děláme na jejich stránkách, a tyto údaje využívají k vylepšení nabízených služeb.
- 10Současné zákony o ochraně soukromí a metody anonymizace jsou neúčinné a neefektivní při aplikaci na Big Data.
- 11Velká data usnadňují predikci kriminálního chování, ale nikdy bychom neměli soudit někoho, dokud skutečně nespáchal zločin.
- 12Přílišné zaměření na data může být nebezpečné: můžeme měřit špatné věci, podněcovat nevhodné chování nebo se spoléhat na nepřesná data.
- 13Závěrečná zpráva
- 14O autorech
Zbývá 11 z 14 kapitol
Odemkněte celé shrnutí
Získejte přístup ke všem kapitolám knihy Velká data a více než 3000 dalším shrnutím.

