Sam sobie możesz w chmurze publicznej umieścić instancje Sparka i dostaniesz coś podobnego co oferuje jako usługę Google.
Tak samo z bazą danych. Możesz w chmurze sam postawić instancje do obsługi bazy albo prościej użyć już przygotowanej przez dostawcę usługi.
Co jest prostsze, bo nie musisz martwić się o backupy, ani klastrowanie ani administrację.
Nie tylko Google daje usługę bigdata w chmurzę, praktyczie wszyscy to dają.
Amazon ma na EMR
OpenStack Sahara.
Nie wiem co tam u MS ale na Azure pewnie też coś jet.