Skills più richieste per un Data Scientist (2021)

In questo articolo vediamo quali sono le 10 skills più presenti negli annunci di lavoro per Data Scientist nel 2021.

skills
Skills & Tools

Recentemente ho trovato un interessante articolo in cui venivano mostrate le 10 skills (tecniche) più richieste sul mercato del lavoro per noi Data Scientist.

L’analisi è stata condotta analizzando più di 15mila job description, provenienti dai siti Indeed, Monster e SimplyHired attraverso la tecnica del webscraping.

Naturalmente questo corpus non vuole essere un campione rappresentativo e non deve essere visto come un qualcosa di esaustivo, quanto più come una serie di indicazioni utili per capire che strada sta prendendo la professione dello scienziato dei dati.

la classifica

skills

A guidare la classifica il mitico Python, mio grande amore.

Anche nella mia vita professionale mi rendo conto sempre di più quanto Python sia utilizzato ed imprescindibile. Un po’ per la sua versatilità, un po’ per la sua potenza e semplicità, un po’ per la community nutritissima… Riesco davvero con difficoltà a pensare ad un mondo (.. da Data Scientist!) senza Python.

Al secondo posto troviamo un altro fido aiutante, SQL.

SQL lo si utilizza soprattutto per gestire i nostri dati, anche se spesso quello che si può fare in SQL lo si può fare in Python. Sicuramente SQL è molto comodo per fare query veloci, anche se mi trovo più a mio agio nel farle con Python. Forse è solo una questione di abitudine: uno dei miei più cari colleghi lo utilizza quotidianamente e mi sta facendo scoprire le sue meraviglie.

Al terzo posto non mi sarei mai aspettato di trovare R. Da quanto sono in azienda non ho mai visto nessuno infatti utilizzare R. All’Università ce lo hanno fatto usare e spesso mi è capitato di leggere paper in cui la parte sperimentale è stata condotta in R (ma poco di verticole sul Machine Learning). In ambito accademico so che è molto utilizzato… Ma non avrei mai pensato di trovarlo così in alto per un Data Scientist!

A seguire poi abbiamo Spark (soprattutto per i big data, insieme ad Hadoop e Scala), AWS, Tableau (per la Business Intelligence) e TensorFlow, per le reti neurali spinte.

l’importanza della programmazione

Quello che salta immediatamente agli occhi è che saper programmare ed utilizzare i linguaggi giusti è fondamentale per trovare lavoro in questo settore.

Python è ancora il linguaggio principe del Machine Learning, e a mio modesto avviso continuerà ad esserlo ancora per molto. SQL rimane un grande must per i database relazionali e Spark (con la sua interfaccia python, PySpark – molto utile) secondo me prenderà stabilmente il posto di R.

Ad ogni modo, a prescindere dal linguaggio, una buona base di programmazione è davvero importante, fatico infatti a pensare ad un Machine Learning totalmente scevro da essa.

E onestamente, mi piace che sia così 😀