Úvod do technologie Apache Hadoop

Sachin Bappalige vytvořil stručný a nenásilný úvod do technologie Apache Hadoop pro ty, kdo si pod tímto dnes již dobře známým názvem nedokáží představit nic konkrétního.

31. August 2014 | Lukáš Jelínek

S technologií Hadoop (celým názvem Apache Hadoop) se dnes setkáváme prakticky na každém kroku, tedy přinejmenším pokud se hovoří o zpracování „velkých dat“ (big data). Přitom mnoho lidí si pod tímto názvem nedokáže představit nic konkrétního a celý framework i jeho využití pro ně zůstávají zahaleny tajemstvím.

Sachin Bappalige z firmy IBM napsal článek, který je „stručným a nenásilným úvodem“ do problematiky technologie Hadoop. Čtenář se dozví, jak vypadá základní ekosystém, co jednotlivé komponenty dělají, k čemu slouží souborový systém HDFS a engine pro paralelní zpracování MapReduce. Seznámí se také s rozdílem mezi verzemi 1.x a 2.0 a co přináší NextGen MapReduce (YARN).