Actualités
Big Data
14/11/2014

DSI : Les 8 grandes tendances en Big Data Analytics

 

Le domaine des Big Data évolue rapidement, voici les éléments à connaitre pour rester à la page.

 

 

 

1.       Les outils analytiques dans le Cloud

Hadoop a été conçu à l’origine pour fonctionner sur des clusters de machines physiques. Mais cela a changé, désormais de nombreuses technologies sont disponibles dans le Cloud :

  • Amazon’s Redshift gère des datawarehouses,
  • Google’s BigQuery propose des services d’analyses de données,
  • IBM’s Bluemix cloud platform et Amazon’s Kinesis proposent des services de traitement de données

L’avenir sera constitué de plate-formes hébergées en interne et de services utilisés dans le Cloud (le coût des machines physiques jouera en faveur des solutions Cloud).

 

2.       Hadoop : le nouveau système d’exploitation de données d’entreprise

Les frameworks comme MapReduce évoluent actuellement vers des solutions de gestion de ressources distribuées et font d’Hadoop un système global d’exploitation des données. Les entreprises peuvent gérer différents types de flux directement dans Hadoop avec un bon niveau de performances. Ceci induit un coût d’usage en baisse avec la possibilité de traiter différents types de requêtes via ce système.

 

3.       Les Big Data Lakes / enterprise Data Hubs

Désormais, les sources de données sont injectées dans un entrepôt de données Hadoop sans avoir à concevoir un modèle à l’avance. Ce système fournit des outils pour analyser les données au fur et à mesure et avec un haut niveau de définition de leur contenu. Il permet de créer des bases de données à grande échelle. Pour l’instant, cela demande un haut niveau de compétences, mais il est clair que les futures évolutions proposeront une démocratisation de leur mise en œuvre.

 

4.       Des analyses plus prédictives

La combinaison des outils de Big Data et des puissances de calculs élevées permettent aux analystes d’explorer de nouvelles données comportementales tout au long de la journée, telles que les visites sur un site web.

 

5.       SQL sur Hadoop : Plus rapide et meilleur

Hadoop reste complexe à mettre en œuvre, il réclame des compétences pointues en programmation et en mathématiques. Même si Hadoop permet de pouvoir injecter des données et de faire des requêtes sur n’importe quoi, il ressort que le frein technique est élevé. La possibilité de pouvoir utiliser SQL sur Hadoop est intéressante pour les entreprises, car elles peuvent s’appuyer sur leurs collaborateurs déjà compétents sur ce langage. C’est un moyen plus accessible de faire entrer Hadoop dans les entreprises.

SQL sur Hadoop ne remplacera pas les datawarehouses dans un avenir proche, mais il offre une alternative à des solutions plus couteuses dans le domaine analytique.

 

6.       NoSQL

Les alternatives aux SGBD traditionnels continuent à progresser dans le cadre de d’applications spécifiques d’analyses de données. Il en existe plus d’une quinzaine actuellement avec des spécialisations propres. Le No SQL est par exemple utilisé dans les bases Graph, une solution comme ArangoDB permet d’analyser plus rapidement les relations entre consommateurs et vendeurs qu’avec des SGBD traditionnels.

 

7.       Le Deep Learning

Ce système repose sur des machines qui reproduisent des réseaux de neurones. Il permet à des ordinateurs de repérer des sujets d’intérêt  au milieu de bases de données non structurées et d’en déduire des relations sans pour autant avoir de modèle de programmation spécifique.

 

8.       Les analyses in-memory

L’utilisation des bases de données in-memory afin d’accélérer les processus d’analyses progresse régulièrement.

 

Ces tendances induisent des évolutions dans les organisations IT, car elles nécessitent un élargissement des compétences des analystes et des Data Scientists. Ils vont devoir expérimenter ces technologies afin de les évaluer et de pouvoir les intégrer dans les applications business.

Dans un premier temps ces tests concerneront les personnels les plus expérimentés, ensuite ils pourront former d’autres ressources et participer au déploiement de ces nouveaux outils.

 

Un des champs d’application des Big Data concerne l’IoT, l’internet des objets, et il imposera la mise en œuvre de ces outils d’analyses. Plus tôt les DSI et les métiers en auront pris conscience, plus tôt les entreprises pourront trouver de nouveaux leviers de développement et de croissance.

 

>>D’après une idée de Robert L. Mitchell