Les Big Data chez Roche : Révéler l’invisible

Les  Big Data sont l’une des tendances majeures du secteur informatique et Roche réfléchit aux meilleurs moyens de les exploiter.
 

« Chez Roche, les Big Data recouvrent l’ensemble des méthodes et des techniques permettant d’exploiter de très gros volumes de données »,

indique Simon Ulrich, Directeur des services de veille commerciale et de Master data management de Pharma Informatics.

Les Big Data possèdent trois caractéristiques majeures, qui constituent également trois grands défis : le volume considérable de données, la diversité de leurs formats, et la vitesse à laquelle elles doivent être générées, traitées et exploitées. Ainsi, jusqu’en 2003, environ cinq milliards de giga-octets de données avaient été générés, en tout, par l’humanité sur Internet. En 2011, ce même volume de données était créé en 48 heures, et aujourd’hui… en quelques minutes ! Quelles en sont les conséquences pour Roche ?

 

« Le principal défi réside non pas dans les obstacles techniques mais dans l’obtention de données utiles pour produire des résultats exploitables »

Matthias Essenpreis, Directeur technique de la division Diagnostics, nous l’explique : « Les Big Data présentent un potentiel considérable, pour nous comme pour l’ensemble de notre secteur. Le principal défi ne réside pas dans les obstacles techniques, mais bien dans l’obtention de données utiles auprès de sources multiples et dans leur interprétation, pour produire des résultats exploitables. » Roche a identifié quatre domaines d’intérêt particuliers.

Au cœur de la démarche Roche :

1. Le premier domaine est celui de « l’analyse sociale » : il s’agit de collaborer avec les plateformes en ligne sur lesquelles les patients peuvent partager leurs expériences et histoires personnelles. « Roche souhaiterait avoir accès à ce type de données à des fins scientifiques. Outre les problèmes liés à la langue dans laquelle s’expriment ces patients, il faut tenir compte des contraintes juridiques et réglementaires, ainsi que de la protection de la vie privée.

2. Un autre domaine d’intérêt est « l’exploration des données », qui emploie des méthodes statistiques et des techniques de « data mining » telles que l’analyse et la détection de structures cohérentes dans des textes non structurés. L’un des objectifs est d’analyser les données à des fins prospectives et pas uniquement de façon rétrospective. 

3. Notre troisième domaine de travail privilégié est celui de l’augmentation des « data warehouse » ou « fermes de données » en français. Ces applications doivent aider à mieux analyser de grandes quantités de données brutes non structurées, notamment par des combinaisons et des comparaisons avec des ensembles de données structurés. 

4. Enfin, « l’analyse opérationnelle » traite les données issues de capteurs, implantés sur des machines de production ou d’autres outils, les flux de données ainsi produits servant à calculer des projections et des optimisations.

 

L’échec, nécessaire pour avancer

Roche travaille actuellement sur neuf projets liés aux Big Data et étudie le lancement de projets pilotes. « Nous devons rester conscients que les technologies de traitement des Big Data n’en sont qu’à leurs balbutiements. Tous secteurs confondus, environ 85 % des projets, pilotes compris, ne produisent pas de résultats directement exploitables sur le plan commercial », concède Simon Ulrich.

« Les projets pilotes menés par pRED visent à établir comment répondre à des problématiques scientifiques par l’exploitation de larges bases de données textuelles. Ainsi, nous avons créé une plateforme visant à faciliter l’accès aux résumés d’articles médicaux et autres publications scientifiques pour les chercheurs », indique Bryn Roberts, directeur général de pRED.

La Direction technique du groupe travaille actuellement à l’exploitation des technologies liées aux Big Data pour optimiser la production dans le domaine des biotechnologies, en s’intéressant par exemple aux flux de données entrants. L’objectif à long  terme est de concevoir un système capable de prévoir la réussite ou l’échec de différentes étapes de production.

Les différents services travaillent ensemble à un projet d’exploitation de données générées en dehors du cadre d’études cliniques contrôlées. En effet, ces données pourraient servir à démontrer l’efficacité d’un médicament.

« Le secteur informatique dans son ensemble n’est pas encore en mesure de proposer les solutions que nous recherchons », ajoute Simon. « Mais grâce à notre plateforme, nous sommes à même de nous adapter aux nouvelles tendances. Et s’agissant des Big Data, Roche est parfaitement préparé. »