Le DBA est mort, vive le DBA ! « Le DBA est mort» n’est pas une prophétie. Mais la perception de l’obsolescence du métier de DBA est une réalité. Par Christian Bilien, Head of Global Data Infrastructures, Société Générale

Le DBA est une figure familière, qu’il soit un Chubaka sympathique et incompréhensible ou un Luke Skywalker, super héro de la résolution d’incidents. Il faut constater une érosion de la perception de sa valeur, voire la négation par certains de l’utilité même de son existence. Quand cela a t-il commencé ? Dans mon environnement, 2014 a été marquée par une avalanche de concepts en provenance des GAFA (/Amazon/Facebook/ Apple). Il a fallu placer les RDBMS face aux technologies Big Data et les positionner dans l’Agile, le Devops, le Lean, le NoSql, L’IT , le , l’IT bi-modale, l’Open Source (assimilé au « gratuit») et j’en oublie certainement. Essayons de classer les sujets:

1. DevOps, Agile, Lean, Cloud, IT Bi-modale J’ai entendu à plusieurs reprises que « Le DBA n’est d’aucune utilité dans le DevOps». Dans un monde cloudifié, on pourrait d’ailleurs dire de même des ingénieurs réseaux, systèmes, stockage et middleware. Qu’en est-il ? Commençons par le cloud pour bases de données, une forme de PaaS («») nommée « Data Base As A Service» (DBaaS). En pratique, le DBaaS est essentiellement : • Un self service sous forme d’API et de portail. • Une exposition par les mêmes moyens du monitoring et des métriques. On peut soi-même développer un DBaaS, mais il existe également des produits commerciaux comme l’ Management pack. Ces APIs ont vocation à être intégrées dans les chaînes DevOps. Dans ce monde automatisé, le rôle du DBA est : • D’assurer les services « régaliens » de sécurité, de performance, de design d’architectures, de résilience, de monitoring, etc. • De créer et de maintenir la chaîne automatisée. La finalité du métier reste la même, seules les modalités changent.

2. Big Data, NoSql Quelques réflexions de quelques VIP du data management : • Nick Heudecker, Data & Analytics, Gartner Group : « dans le monde NoSql, les DBA sont absents des conversations ». L’auteur de ces lignes le déplore et relève d’ailleurs que cela posera rapidement des problèmes de gestion des données dans les entreprises. • Guy Harrison (1), établit la filiation entre les plateformes relationnelles et leurs compléments NoSql et Hadoop. • Merv Adrian, lui aussi du Gartner Group constate : Les 3 distributions Hadoop sont dans le « Magic Quadrant » Datawarehouse. Hadoop étend le champ traditionnel des Datawarehouses à l’analytique, le machine learning, la data science, etc. • Michael Stonebraker (2), qui a reçu la « Turing Award » (l’équivalent de la médaille Fields, ou d’un prix Nobel de l’informatique) en 2014 prévoit : Les mondes Hadoop et Datawarehouse traditionnels vont fusionner Les mondes NoSql et RDBMS feront de même SQL va supplanter tous les autres langages historiques du monde Big Data • Deux bloggers Oracle très influents, sur le thème de la pénétration d’Hadoop : Tanel Poder (« le monde hybride est là ») et Kerry Osborne (« all the cool kids are in it ») Un monde d’opportunités, basées sur des technologies nouvelles s’ouvre donc pour les DBAs. Ce tableau ne serait pas complet si on ignorait les possibilités qu’offrent les nouveaux métiers d’analyses de données. On dit que le job le plus cool du 21ème siècle est celui de Data Scientist : la demande est croissante, les salaires sont élevés. Le DBA est bien armé pour explorer ces nouveaux territoires. Il s’agit de revoir ses cours de statistiques (les réseaux neuronaux reviennent au goût du jour après une période d’oubli), de les mettre à jour (sur le machine learning principalement), et d’y ajouter des langages comme R ou Python. Stephen O’Grady théorise d’ailleurs dans « The New Kingmakers » la baisse de la valeur du logiciel (« le logiciel n’est pas un différentiateur ») pour mettre en avant l’augmentation de la valeur des données.

3. Open Source Open source et réduction de coûts vont de pair dans les esprits. On entend que « l’open source est gratuit ». Ajoutez-y une pincée de Cloud et « la gestion des données ne coûte plus rien » ! L’Open Source (OSS) est le modèle commercial aujourd’hui prévalant chez les vendeurs des nouvelles technologies de bases de données. A l’exception d’Hortonworks, les éditeurs proposent généralement une version OSS bridée et une version com- merciale. 7 milliards de dollars ont été investis en 2015 dans les sociétés adossées à l’OSS. Les 5 sociétés qui ont le plus bénéficié de cette manne sont les leaders du NoSql et d’Hadoop :

Top 10 OSS Venture Dollars Raised

Sugar CRM 121 Mirantis 121 124 Kaltura Inc. 129 MuleSoft 131 MapR Technologies 135 DataStax 194 Hortonworks 200 Mongo DB 330 Cloudera 1041 Christian Bilien @cbilien Il faudrait être bien naïf pour croire que le milliard de dollars inves- ti dans Cloudera est un don à une cause charitable. Le modèle com- mercial de ces sociétés est différent de celui de la vente de licences, Les slides correspondants à cet article sont sur : mais il n’en est pas forcément moins onéreux (en tenant compte d’un existant de gros volume, et à niveau de support similaire, l’OSS pour • http://www.slideshare.net/ les BDD a d’ailleurs en général un TCO plus important à l’instance). cbilien/the-dba-is-dead- again-long-live-the-dba Quand à l’idée de se passer d’un gestionnaire de données, essayez donc d’opérer du Hadoop même « as a service » sans spécialiste. Un DBA, ou un spécialiste qui fait un travail de DBA devra vite faire face Ressources : à la complexité des outils de sécurité, de la gestion des performances (1) Guy Harrison est l’auteur de et de la résilience. « Nex Generation Data Bases » chez Apress En conclusion, le DBA devra à mon avis évoluer ou (2) Michael Stonebraker est l’un des auteurs d’Ingres, de lentement glisser dans l’obsolescence. PostGreSQL, de Vertica et Quatre éléments doivent à mon sens guider cette d’autres BDD. Il a été CTO évolution : d’Informix et est aujourd’hui professeur au MIT. • Automatiser : dans un monde cloudifié, les tâches manuelles de er1 niveau, même offshorées, n’ont pas de valeur. • http://blogs.gartner.com/nick- • Changer d’échelle, passer du To au Po. Les besoins en gestion de heudecker/nosql-shouldnt- mean-nodba/ données issues de l’IOT, des logs et des données électroniques sont immenses. • http://www.scarydba.com/

• Adoption des nouvelles technologies : Les nouvelles technologies de • Next Generation Data Bases, bases de données sont en phase de maturation. Il faut accepter d’uti- Guy Harrison 2015, Apress liser des outils rudimentaires pour les administrer. • Gartner Group: Magic Quadrant for Data Warehouse • S’adapter aux nouvelles façons de travailler : les pratiques de DevOps, and Data Management du « as a service », des modes agiles et l’écosystème Cloud prennent Solutions for Analytics toujours plus d’ampleur. Le DBA doit s’adapter à ces méthodes. • http://tomtunguz.com/ open-source-software- environment/

• http://www.wsj.com/articles/ tech-firms-grapple-with- how-to-make-open-source- pay-1457031731

• http://tinyurl.com/o359jyp

• http://en.community.dell. com/techcenter/information- management/b/weblog/ archive/2015/11/02/what- kind-of-dba-are-you-galactic- edition