Capire il passato, osservare il presente, predire il futuro. Questi sono gli scopi della Data Science, un settore in fortissima espansione che risponde a una necessità urgente: come gestire e valorizzare le enormi quantità di dati che affluiscono nei server di tutto il mondo. Le aziende richiedono competenze in questo ambito e aspiranti di ogni livello tentano di formarsi il più velocemente possibile, ma spesso la confusione domina. In che rapporto sono Data Science, Big Data e Machine Learning? Quali competenze bisogna possedere? Quali sono gli strumenti più importanti da padroneggiare? Questo libro risponde in maniera chiara, organica e pratica. Mostra un percorso che parte delle basi del linguaggio Python, illustra strumenti fondamentali come NumPy e Pandas, esplora i Big Data con i framework Hadoop, Spark e SparkSQL e infine sfocia nella trattazione approfondita delle tecniche più importanti di Machine Learning.