Data Scientist – la figura professionale del futuro

Il XXI° secolo è il secolo delle novità e delle innovazioni sotto ogni ambito. Soprattutto per ciò che riguarda le tecnologie e il mondo aziendale. Mentre nel primo sono più evidenti cambiamenti e progressi, nel secondo caso è necessario addentrarsi.

Come se non fosse già complesso ed articolato di suo, si aggiungono tutti gli anglicismi che ormai usiamo al posto di parole che in italiano “suonano male” e che in inglese risultano più professional: stakeholder, soft skills, digital trasformation, asset management, turnover, warehouse e la lista potrebbe continuare davvero per molto!

Se per esempio dicessi “Data Scientist” quanti sarebbero in grado di spiegare esattamente chi è e cosa fa?

È proprio di questo che voglio parlare.

INDICE DELL’ARTICOLO

  • Chi è il Data Scientist?
  • Di cosa si occupa?
  • Perchè è così richiesto dalle aziende?
  • Quanto guadagna?
  • Come si diventa scienziato dei dati?
  • Perchè sceglierla come professione?

Chi è il Data Scientist?

Si tratta di una figura professionale che si è sviluppata in questo secolo di innovazioni dopo aver capito di cosa hanno davvero bisogno le aziende.

Esse sono in grado di raccogliere un vasto numero di dati, che vengono analizzati per ricavarne informazioni fondamentali per lo sviluppo del loro business.

Di cosa si occupa?

Il Data Scientist organizza ed analizza grandi quantità di dati per ricavarne informazioni utili su cui un’azienda può basare le proprie azioni strategiche.

Tornando al neologismo utilizzato, si chiama “Data Scientist” proprio perché ha a che fare con la gestione di Big Data(1) dai quali trae le informazioni più importanti e trasforma i dati in conoscenze e opportunità.

È necessario capire però cosa si intende per “dati”: ci sono i dati strutturati e quelli non strutturati. I primi non sono altro che dati organizzati per lo più per categorie (raccolti da servizi, prodotti e dispositivi elettronici..) e possono essere ordinati, letti ed organizzati in maniera automatica da un sistema. I secondi invece, provengono da input di persone (recensioni di clienti, video, messaggi di social network, mail..) e, a differenza dei primi, non sono classificabili automaticamente.

Serve per tale motivo una persona fisica: un Data Scientist. Egli deve individuare tutte le informazioni utili all’azienda come trend, evoluzioni, opportunità commerciali e altri dati di rilevanza statistica.

Il suo ruolo non è altro che l’evoluzione di un analista: dal quale si differenzia in quanto non cerca solo soluzioni a problemi, ma elabora i Big Data in diversi modi per scoprire tendenze, opportunità e criticità nascoste e inaspettate che possano avere un impatto rilevante sul business. È chiaro quindi che debba conoscere le dinamiche del business e il funzionamento dell’azienda per cui lavora.

Per fare un esempio concreto, un Data Scientist può aiutare un’impresa a specificare meglio la sua nicchia di mercato, a segmentare il suo pubblico di riferimento, a ottimizzare le strategie di marketing o a ripensare i processi di sviluppo dei prodotti basandosi su dati effettivi.

Ma i dati trattati sono utili solo agli attori aziendali? Certo che no, anche agli stakeholder(2). Per tale motivo devono essere comprensibili a tutti. Ed è questa un’altra mansione: visualizzazione di dati e creazione di report tramite l’utilizzo di grafici, mappe, tabelle e diagrammi per renderli più comprensibili.

Perchè è così richiesto dalle aziende?

Il Data Scientist risulta essere molto ricercato dalle aziende ed il motivo di questa grande attenzione è legato alle opportunità che genererebbero in futuro nelle imprese dove sono inseriti. Possono trovare maggiore occupazione nei settori della finanza, del retail (vendita al dettaglio), dell’e-commerce e del marketing. Tuttavia si sta diffondendo un po’ ovunque: ci sono opportunità di impiego nel settore manifatturiero, nella logistica e nei trasporti, nelle società di informatica e telecomunicazioni, in banche e assicurazioni, in ambito scientifico, nella sanità e nella Pubblica Amministrazione.

Tendenzialmente è un lavoro che si svolge in ufficio, anche se alcune aziende permettono di lavorare in Smartworking.

Quanto guadagna?

Il Data Scientist è una professione molto diffusa negli USA rispetto che negli altri Paesi, questo porta il caso degli Stati Uniti ad essere un’eccezione dove il guadagno medio annuo è di circa 110.000 dollari. Questo può essere dato probabilmente dalla presenza di una seniority media più elevata. A livello internazionale, la retribuzione media ricevuta da un Data Scientist risulta essere circa 68.000 dollari (comunque elevata!!).  E in Italia? In Italia, “lo scienziato dei dati” guadagna in media circa 30.000 euro annui.

Come si diventa scienziato dei dati?

Sono figure iper-specializzate che possiedono una laurea in Ingegneria informatica, Business Administration, Informatica, Economia, Matematica o Statistica. Hanno competenze eterogenee che variano dalla tecnologia alla conoscenza del mercato e del business, fino alla capacità di utilizzare tecniche di Machine Learning e linguaggi di programmazione. Ma è anche strettamente correlato al contesto organizzativo in cui essi sono inseriti.

Secondo il Butch Works (Agenzia di Data Science e di analisi di reclutamento) il Data Scientist deve possedere 9 skills: 6 competenze tecniche e 3 non tecniche.

Competenze tecniche

Per le prime distinguiamo competenze di analisi e di computer science. Le principali competenze di analisi di uno scienziato dei dati derivano da:

Formazione: come base possiedono una laurea ed alcuni presentano anche un dottorato di ricerca. Lo “scienziato di dati” richiede un ricco background per sviluppare competenze di analisi.

Linguaggi di programmazione SAS e/o R: necessità di conoscere a fondo almeno uno di questi strumenti analitici:

  • SAS (“Statistical Analysis System”): linguaggio di programmazione progettato per l’accesso ai dati, per la loro trasformazione e per il reporting
  • R: anche esso è un linguaggio di programmazione (per statistici) gratuito, open source, potente e adatto all’analisi e gestione dei dati. È disponibile per i sistemi operativi Unix, Linux, Windows e MacOS ed è definito software multipiattaforma.

Poi nell’ambito delle scienze computazionali (computer science) un Data Scientist dovrebbe conoscere:

Linguaggio PYTHON: linguaggio di programmazione ad alto livello, semplice da usare e open source. Viene utilizzato da aziende come Google e Youtube. Eventuali altri linguaggi di programmazione che possono essere utili sono Java, Scala, Julia e Matlab.

Piattaforma Hadoop: nonostante non sia obbligatorio, rimane una preferenza in molti casi. Anche esperienze in Hive o Pig (altri strumenti di analisi Big data). Inoltre Amazon S3 è consigliata.

SQL (“Structured Query Language”) : Nonostante Hadoop non sia uno strumento chiave della scienza dei dati, riuscire a scrivere ed eseguire query complesse è importante per un Data Scientist.

Dati non strutturati: dati non connessi da schemi o relazioni tabellari, come recensioni clienti, video, audio, file dei social media ecc. Questa è una competenza fondamentale che non può mancare.

Competenze non tecniche

Per le non tecniche, è importante sviluppare:

Curiosità intellettuale: essendo costantemente a contatto con i dati lo scienziato si trova ad acquisire un enorme quadro di informazioni. E’ “scontato” quindi che deve avere interesse nel campo in cui decide di operare, per potere sfruttare al meglio le altre competenze.

Conoscenza del settore: un Data Scientist deve conoscere appieno il settore in cui sta lavorando compresi i problemi che l’azienda sta cercando di risolvere. E’ necessario che riesca ad individuare informazioni utili alla risoluzione di tali problemi, ed identificare eventualmente altre aree di miglioramento.

Abilità comunicative: questa skill è necessaria ovunque e garantisce il successo o meno delle altre skills. Deve essere in grado di tradurre le informazioni tecniche ricavabili dai dati agli altri reparti aziendali quali ad esempio le vendite o il marketing.

Certificazioni

Ma non è tutto! Acquisire alcune delle seguenti certificazioni può contribuire ad entrare nel mondo della scienza dei dati:

  • Dell EMC Proven Professional certification program;
  • Certified Analytics Professional (CAP);
  • SAS Academy for Data Science;
  • Microsoft Certified Solutions Expert (MCSE);
  • Cloudera Certified Associate (CCA);
  • Cloudera Certified Professional: CCP Data Engineer;
  • Data Science Certificate – Harvard Extension School.

Perchè sceglierla come professione?

È una figura professionale molto richiesta dalle aziende, riveste un ruolo strategico che viene riconosciuto ed apprezzato. Sono sempre più numerose le offerte di lavoro per questa specializzazione, molto ben retribuite e cosa molto importante con poca concorrenza.

Scegliere di diventare Data Scientist significa scegliere una professione che va di pari passo con lo sviluppo tecnologico tra data mining(3), machine learning(4) e AI (intelligenza artificiale).

Un articolo della Harvard Business Review di qualche anno fa, ha definito il Data Scientist come “la professione più sexy del XXI° secolo”. Che sia il caso di iniziare a considerarla come tale?  

Legenda

(1) Big Data: l’analisi di grandi quantità di informazioni

(2) Stakeholder: l’insieme di clienti, fornitori, finanziatori come banche o azionisti, dipendenti ed in generale tutti i gruppi di interesse interni ed esterni all’azienda

(3) Data mining: l’insieme di tecniche e metodologie utilizzate nell’estrazione di informazioni utili da grandi quantità di dati

(4) Machine learning: noto come “apprendimento automatico”, è un ramo dell’intelligenza artificiale che raccoglie un insieme di metodi come: statistica computazionale, riconoscimento di pattern, elaborazione delle immagini, data mining, ecc. Nell’ambito dell’informatica, è una variante della programmazione tradizionale nella quale si predispone in una macchina l’abilità di apprendere qualcosa dai dati in maniera autonoma, senza ricevere istruzioni esplicite a riguardo