Skip to main content

Dr. Brian Dennis

L'art du code
Dr. Brain Dennis - Data Machines

Comment les machines à données font du Big Data


Lorsque Brian Dennis se rend au travail chaque jour, il a le privilège de savoir que son travail a un impact sur des défis divers tels que le financement des menaces, la traite des êtres humains, la cybersécurité, l'aide à la décision, les soins de santé, l'investissement et les litiges.

Data Machines Corp. est une société d'analyse de données spécialisée dans la conception, la construction et l'utilisation d'une architecture en nuage pour concevoir et partager des solutions aux problèmes d'analyse de données, de DevOps, d'intelligence machine et de science des données. Les systèmes et le code de l'entreprise sont utilisés quotidiennement par plus de 2 500 chercheurs, scientifiques des données et partenaires de transition de la recherche pour permettre des projets de R&D avancés. Data Machines travaille avec de vastes équipes de recherche composées de représentants du gouvernement, de l'industrie et du monde universitaire dans le cadre de la transition en marque blanche de technologies importantes.

Dr. Dennis a rejoint Data Machines en 2018 après avoir occupé des postes de recherche chez Invincea Labs et Lockheed Martin. En tant que directeur de l'ingénierie des données de l'entreprise, il poursuit ses 20+ années de recherche appliquée centrée sur les données dans l'industrie de la défense, en travaillant avec des organisations telles que la Defense Advanced Research Projects Agency (DARPA). La DARPA, agence de recherche et de développement du ministère de la défense des États-Unis, est chargée de développer des technologies émergentes destinées à l'armée.

"Travailler avec le DARPA est particulièrement intéressant car nous sommes en première ligne avec des chercheurs qui font des choses dont les autres n'entendront peut-être pas parler avant cinq ou dix ans et qui auront un impact incroyable dans dix ou quinze ans", a déclaré M. Dennis. "Notre rôle est de leur fournir une infrastructure. Nous les aidons à résoudre des problèmes, nous facilitons leur travail. Au quotidien, c'est très stressant et difficile, mais quand on voit les résultats, c'est formidable". 

Data Machines soutient notamment un projet de la DARPA intitulé "Learning with Less Labels" (Apprendre avec moins d'étiquettes). L'objectif est de trouver des algorithmes d'apprentissage automatique nouveaux et avancés qui utilisent beaucoup moins d'exemples étiquetés pour obtenir les mêmes résultats. 

Le Dr Dennis a donné une explication simplifiée du projet : "Disons que vous essayez de classer une image. S'agit-il de la photo d'un chat ou d'un chien ? Si vous êtes Google ou Facebook, il est facile d'obtenir un milliard d'exemples étiquetés et d'entraîner ces énormes modèles qui fonctionnent très bien. Mais si vous n'êtes pas Google ou Facebook, il est difficile d'obtenir un milliard d'exemples. En fait, dans certains domaines qui intéressent le gouvernement, un milliard d'exemples pourrait même ne pas exister. Ce programme se concentre donc sur la manière dont les chercheurs avancés peuvent développer ces algorithmes et montrer que, pour des ordres de grandeur inférieurs, ils obtiennent la même qualité pour une tâche telle que la classification d'images".

Le projet "Apprendre avec moins d'étiquettes" comporte de nombreux aspects, notamment la détection d'objets, la classification d'images et la traduction automatique. Dans le cadre d'une approche de recherche commune au DARPA, les équipes adoptent un large éventail d'approches : Certaines tentent de combiner plusieurs algorithmes d'apprentissage automatique différents ; d'autres se plongent dans les processus techniques ; d'autres encore utilisent des quantités massives de calcul, tandis que d'autres s'efforcent de faire fonctionner correctement les algorithmes sur une carte GPU en nuage. Ensuite, une équipe d'évaluation gouvernementale indépendante s'efforce d'identifier les approches réussies et d'aider chaque équipe à s'adapter sur la base d'un apprentissage partagé.

Data Machines s'engage à fournir l'infrastructure qui soutient toutes ces équipes dans le monde entier, y compris des chercheurs en Australie, au Canada, en Israël, aux Pays-Bas et dans l'ensemble des États-Unis.

C'est ce qui a conduit Data Machines à Linode.

"Aujourd'hui, quand on parle d'apprentissage automatique, on parle de GPU", a déclaré M. Dennis. "Tous les chercheurs veulent autant de capacité GPU que possible. Nous utilisons quelques GPU dans notre propre centre de données, mais nous avions besoin de plus pour soutenir l'ensemble de l'équipe à travers le monde. C'est alors que nous avons commencé à étudier les fournisseurs de clouds publics pour voir s'il y avait un moyen de mettre des ressources à la disposition de ces chercheurs à un prix raisonnable.

"Nous avons été choqués par les prix des autres grands fournisseurs, et j'ai donc regardé du côté de Linode, dont j'étais un client personnel depuis près de dix ans", poursuit le Dr Dennis.

Dr. Brian Dennis

"Linode n'avait pas seulement des prix très intéressants pour les instances GPU, mais utilisait également les cartes NVIDIA exactes et difficiles à trouver que nous achetions pour nos propres centres de données. De plus, Linode offre des GPU en différents incréments, ce qui est difficile à trouver avec d'autres fournisseurs. Cette flexibilité accrue est utile lors de la mise à l'échelle ou de l'éclatement du développement aux tests."

M. Dennis admet qu'une partie de sa responsabilité consiste à choisir la meilleure solution d'infrastructure pour chaque projet, et il est donc constamment à la recherche des meilleures options et en train d'évaluer d'autres fournisseurs. "Chaque projet que nous soutenons est un flocon de neige, et nous devons donc rester à l'affût des meilleures solutions individuelles, en équilibrant les coûts, l'élasticité, la flexibilité et la sécurité", explique-t-il. "Mais ce que j'ai appris, et le conseil que je partagerais avec d'autres, c'est ceci : Il existe d' autres choix que les grands fournisseurs à trois lettres qui peuvent s'avérer tout aussi précieux pour vous. D'autres fournisseurs de services en nuage, comme Linode, peuvent être flexibles et beaucoup plus réactifs. Vous devriez sortir des sentiers battus en contactant d'autres fournisseurs.

"Et d'après notre expérience chez Data Machines, je peux vous dire que Linode apporte de nombreux atouts à la table, y compris le coût, la fiabilité, le service client, et la simplicité dans la tarification et le déploiement. Nous apprécions le fait que Linode propose un ensemble de services relativement restreint mais bien ciblé et facile à mettre en place. Toutes les choses supplémentaires ne font que nous faire perdre du temps".

M. Dennis a ajouté que la fiabilité et le service à la clientèle fournis par Linode sont des arguments de vente importants. "La fiabilité de Linode est excellente, ce qui est extrêmement important pour les chercheurs de niveau international que nous servons. De plus, le service clientèle de Linode est de premier ordre et rapide. Vous travaillez avec une vraie personne. Si vous avez un client qui a des exigences très strictes, c'est formidable d'avoir un bon service à vos côtés.

Partager ceci