Om du vill hitta godbitar i enorma datamängder så är det programmet Spark från Yahoo som du ska använda. Spark är ett nytt och öppet projekt som är hundra gånger snabbare än bland andra Hadoop. Om en viss datakörning tar 30 minuter i Hadoop gör Spark samma uppgift på 18 sekunder.
Målet med Spark är att skapa en ny plattform för dataanalys som ska användas inom både industrin och akademiska institutioner. Spark testas just nu av Amazon och det finns ett förslag att Spark ska bli ett officiellt Apache-projekt.