S technologií Hadoop (celým názvem Apache Hadoop) se dnes setkáváme prakticky na každém kroku, tedy přinejmenším pokud se hovoří o zpracování „velkých dat“ (big data). Přitom mnoho lidí si pod tímto názvem nedokáže představit nic konkrétního a celý framework i jeho využití pro ně zůstávají zahaleny tajemstvím.
Sachin Bappalige z firmy IBM napsal článek, který je „stručným a nenásilným úvodem“ do problematiky technologie Hadoop. Čtenář se dozví, jak vypadá základní ekosystém, co jednotlivé komponenty dělají, k čemu slouží souborový systém HDFS a engine pro paralelní zpracování MapReduce. Seznámí se také s rozdílem mezi verzemi 1.x a 2.0 a co přináší NextGen MapReduce (YARN).