Que fait un "data-scientist" ? Rencontre avec Markus Bundschlus, Directeur des services d’information scientifique et commerciale

« Manipuler des Big Data, ça ne veut pas dire rester collé à son écran d’ordinateur toute la journée » 

Comme bon nombre de collaborateurs de Roche, Markus Bundschus, Directeur des services d’information scientifique et commerciale sur le site de Penzberg, passe beaucoup de temps en réunions de «brainstorming» avec des équipes issues des différentes activités du groupe. Ces séances lui permettent de mieux comprendre comment gérer et analyser les énormes volumes de données pour améliorer la santé des patients.

Le site de Penzberg, situé non loin de Munich, en Bavière, accueille plus de 5 000 salariés des deux grandes divisions du groupe, Diagnostics et Pharma. 

Plus jeune, Markus ne s’imaginait pas faire carrière dans l’informatique et les données : son rêve, c’était la biologie moléculaire. Et puis il a découvert un nouveau cursus de bio-informatique proposé conjointement par l’Université technique de Munich et l’Université Louis-et-Maximilien, alors que le projet de séquençage du génome humain venait à peine d’être lancé.

« Face à cet événement, les professeurs de ces deux universités se sont dit : les volumes de données générés sont énormes, qui va se charger de les analyser ? Et comment les exploiter pour en tirer de nouveaux éclairages ? »


Dans le cadre de son cursus, Markus a étudié la biologie moléculaire, l’informatique, les mathématiques et les statistiques : un éventail très large de disciplines, toutes indispensables pour interpréter ces données.

Son Doctorat en poche, Markus a d’abord travaillé pour Siemens à Munich, puis sur le site de Malvern (Pennsylvanie), non loin de Philadelphie. Il s’est consacré à des projets de développement d’un outil d’intelligence artificielle capable de prédire de nouveaux gènes liés à l’apparition de cancers. Cette première expérience l’a idéalement préparé à poursuivre sa carrière chez Roche, qu’il a rejoint il y a quatre ans. C’est également chez Roche que Markus a accédé à un poste de direction.

Il souligne qu’il est parfois délicat d’expliquer en quoi consiste son travail au quotidien. « J’ai tendance à évoquer la notion de “chaîne de valeur” : nous sommes d’abord un point de contact en début de chaîne », précise-t-il. « Nous étudions les bases de données, les revues scientifiques et d’autres sources de données internes et externes intéressantes et pertinentes. Nous devons déterminer si ces données présentent ou non un intérêt pour les services de Roche. C’est la première partie de notre travail. »
 

« Nous devons déterminer si ces données présentent ou non un intérêt pour Roche. » Markus Bundschus

 


Markus ajoute : « La deuxième partie concerne l’extraction d’informations : il s’agit de filtrer ces données de sorte qu’elles soient utiles à Roche. Nous allons rechercher, par exemple, les sources de données relatives aux expériences les plus intéressantes en matière d’origine génétique de cancers publiées à ce jour. Le troisième volet de notre travail consiste à analyser les données, c’est-à-dire à faire en sorte que les données identifiées débouchent sur des possibilités d’action ; en d’autres termes, en faire des données qui soient réellement exploitables par les équipes de Roche. »

Malgré les nombreux outils et programmes à disposition, être à la pointe sur le plan technologique, tout étant capable de gérer l’afflux massif de données est un défi permanent. Chaque jour, plus de 300 brevets liés aux sciences de la vie sont déposés et les bases documentaires telles que PubMed publient près de 2 400 articles. De plus, les technologies d’accès à ces informations évoluent, elles aussi, très rapidement. Pour Markus, rester à la pointe de la technologie est « à la fois l’aspect le plus difficile et le plus intéressant » de son travail.

Markus et ses collaborateurs doivent également relever un autre défi : faire en sorte que les données et les analyses fournies correspondent aux besoins réels de leurs « clients internes », notamment les chercheurs et les responsables du développement de produits de Roche. Grâce à des échanges réguliers avec les collaborateurs de l’ensemble du groupe, l’équipe est à même de fournir les données et les analyses les plus adaptées.

Markus conseille à ceux et celles qui souhaiteraient, comme lui, se lancer dans l’exploitation scientifique des données de prendre le temps de comprendre de quelles données ont besoin les chercheurs et d’être ouverts à l’utilisation de nouveaux outils et à la collaboration avec des équipes basées aux quatre coins du monde, par exemple, avec les collègues de pRED Informatics dans le cas de Roche.

« Soyez curieux », ajoute-t-il. « Intéressez-vous à la biologie moléculaire et faites l’effort de comprendre l’activité de l’entreprise. Si vous ne comprenez pas bien les besoins de l’entreprise et comment votre travail contribue à y répondre, vous ne faites que bidouiller avec votre ordinateur et ça ne servira strictement à personne. »

Markus ajoute : « La deuxième partie concerne l’extraction d’informations : il s’agit de filtrer ces données de sorte qu’elles soient utiles à Roche. Nous allons rechercher, par exemple, les sources de données relatives aux expériences les plus intéressantes en matière d’origine génétique de cancers publiées à ce jour. Le troisième volet de notre travail consiste à analyser les données, c’est-à-dire à faire en sorte que les données identifiées débouchent sur des possibilités d’action ; en d’autres termes, en faire des données qui soient réellement exploitables par les équipes de Roche. »

Malgré les nombreux outils et programmes à disposition, être à la pointe sur le plan technologique, tout étant capable de gérer l’afflux massif de données est un défi permanent. Chaque jour, plus de 300 brevets liés aux sciences de la vie sont déposés et les bases documentaires telles que PubMed publient près de 2 400 articles. De plus, les technologies d’accès à ces informations évoluent, elles aussi, très rapidement. Pour Markus, rester à la pointe de la technologie est « à la fois l’aspect le plus difficile et le plus intéressant » de son travail.

Markus Bundschlus, Data scientist

Markus et ses collaborateurs doivent également relever un autre défi : faire en sorte que les données et les analyses fournies correspondent aux besoins réels de leurs « clients internes », notamment les chercheurs et les responsables du développement de produits de Roche. Grâce à des échanges réguliers avec les collaborateurs de l’ensemble du groupe, l’équipe est à même de fournir les données et les analyses les plus adaptées.

Markus conseille à ceux et celles qui souhaiteraient, comme lui, se lancer dans l’exploitation scientifique des données de prendre le temps de comprendre de quelles données ont besoin les chercheurs et d’être ouverts à l’utilisation de nouveaux outils et à la collaboration avec des équipes basées aux quatre coins du monde, par exemple, avec les collègues de pRED Informatics dans le cas de Roche.

« Soyez curieux », ajoute-t-il. « Intéressez-vous à la biologie moléculaire et faites l’effort de comprendre l’activité de l’entreprise. Si vous ne comprenez pas bien les besoins de l’entreprise et comment votre travail contribue à y répondre, vous ne faites que bidouiller avec votre ordinateur et ça ne servira strictement à personne. »