Parmi les nouveaux métiers du numérique, les fonctions autour des données ont connu une forte popularité ces dernières années. La raison ? L’explosion de la quantité de data qu’exploite une entreprise aujourd’hui la pousse à s’entourer d’experts en données, pour pouvoir en tirer profit et les transformer en actions stratégiques. L’un de ces métiers qui fait fureur est le data scientist, appelé en français le scientifique des données.
À quoi sert un Data Scientist ?
Utiliser le Big Data pour répondre à des problématiques Business : voilà le rôle principal du Data Scientist.
Un Data Scientist répond à des questions de type « pourquoi ? » et « comment ? » au sein d’une entreprise. Face à un challenge business, il est un super-détective interrogeant des masses de données : il les explore, découvre les tendances cachées, leur pose des questions ouvertes, effectue des analyses de type : « que se passe-t-il lorsque… ?».
Plus fort encore, le Data Scientist apporte des réponses intelligibles à la fois par les équipes IT et par les équipes opérationnelles. C’est pourquoi le poste fait partie de la catégorie d’emploi Développement / IT. Après avoir recueilli et questionné les données, il analyse les résultats et les présente de façon claire, en prenant soin de faire des recommandations face au problème posé.
En quoi le Data Scientist est différent d’un Business Analyst ?
Le métier de Data Scientist arrive dans la lignée de celui de Business Analyst, mais il ne faut pas les confondre pour autant. Le Business Analyst travaille sur une partie des données structurées d’une organisation. Ses analyses ont pour but principal de fournir des arguments de prises de décision de type oui / non face à une question posée. A l’inverse, le Data Scientist travaille sur des questions ouvertes. Il utilise une multitude de sources de données brutes qu’il manipule à sa guise, qui peuvent aller jusqu’à exploiter de l’open data. L’un est un analyste évoluant dans un périmètre limité, l’autre un détective libre d’aller chercher où il veut.
Que fait le Data-Scientist de sa journée ?
Le Data Scientist, spécialiste des données, analyse la problématique de l’organisation dans des termes business. Son but est de la comprendre pour pouvoir ensuite la traduire en problème mathématique. Il consacre du temps à l’obtention des données : trouver les sources et organiser le stockage des données pour y avoir accès. Il consacre bien évidemment une bonne partie de son temps à questionner et analyser les données. Enfin, il met en forme ses résultats et ses recommandations.
Qui est vraiment le Data-Scientist ? Informaticien, mathématicien, webmarketer, spécialiste Business ?
Et bien… un peu (voire beaucoup) de tout ça à la fois. Pour être capable de découvrir des tendances cachées parmi les données, il doit impérativement connaître son business sur le bout des doigts, sinon, il passerait simplement à côté. Le côté « Business », essentiel, est l’une des caractéristiques nouvelles du métier.
D’un point de vue plus technique, pour pouvoir interroger et analyser des quantités massives de données, le Data Scientist doit être un mathématicien doué en analyse statistique. Il doit être capable de préparer les algorithmes sur mesure dont il aura besoin pour interroger les données.
Il doit par ailleurs maitriser les technologies utilisées pour les traitements de données et programmer les algorithmes dont il a besoin.
Enfin, faire parler les données est une chose, mais les obtenir en est une autre. Le Data Scientist doit maitriser les enjeux data d’un point de vue IT. Il doit savoir comment organiser et stocker les données. Des connaissances en data warehouse sont essentielles pour pouvoir faire des recommandations sur l’organisation des bases de données, voire même formuler des directives quant à la gouvernance des données (appelé « data governance » en anglais).
D’où vient le Data-Scientist ?
Quelques écoles et centres de formation proposent déjà des formations de Data Scientist, tel que le CES de Telecom ParisTech.
Plus généralement, en France, le Data Scientist a un profil d’ingénieur (issu des grandes écoles telles que Polytechnique ou Centrale), ou un profil de statisticien, issu de l’ENSAE ou l’ENSAI.
Avec ces écoles-ci, on peut rapidement former un jeune Data Scientist : il a une formation solide et peut s’adapter rapidement.
Un autre profil de Data Scientist est l’ingénieur qui a déjà plusieurs années d’expériences et qui se passionne pour tout ce qui touche à la data. Le dernier profil, plus senior, est le spécialiste de la gestion et de la politique des données.
Non pas un mais DES Data Scientist
On comprend, au vu de la pluralité du profil recherché (mathématicien, informaticien, doté d’un vrai côté « business », et détective), que LE Data Scientist va être compliqué à trouver. Il est probable que la fonction de Data Scientist soit remplie par plusieurs Data Scientists ayant chacun leur zone d’expertise. Un Data Scientist statisticien, un Data Scientist spécialiste du secteur d’activité etc…
Ce métier encore en construction nous réserve certainement de belles évolutions, mais beaucoup s’accordent déjà à dire que le Big Data va le propulser au premier plan des métiers web en vogue.