Ir al contenido principal

El Dr. Brian Dennis

Craft of Code
Dr. Brain Dennis - Máquinas de datos

Cómo aborda Data Machines los macrodatos


Cuando el Dr. Brian Dennis va a trabajar cada día, tiene el privilegio de saber que su trabajo impacta en diversos desafíos como la financiación de amenazas, el tráfico de personas, la ciberseguridad, el apoyo a la toma de decisiones, la atención sanitaria, la inversión y los litigios.

Data Machines Corp. es una empresa de análisis de datos que se especializa en el diseño, construcción y uso de la arquitectura de nubes para diseñar y compartir soluciones a problemas en el análisis de datos, DevOps, inteligencia de máquinas y ciencia de los datos. Los sistemas y el código de la empresa son utilizados diariamente por más de 2,500 investigadores, científicos de datos y socios de transición de la investigación para permitir proyectos avanzados de R&D. Data Machines trabaja con amplios equipos de investigación compuestos por el gobierno, la industria y el mundo académico en la transición de tecnologías importantes en marca blanca.

El Dr. Dennis se unió a Data Machines en 2018 después de haber ocupado puestos de investigación en los laboratorios Invincea y Lockheed Martin. Como Director de Ingeniería de Datos de la compañía, continúa sus más de 20 años de investigación aplicada centrada en datos en la industria de la defensa, trabajando con organizaciones como la Agencia de Proyectos de Investigación Avanzada de Defensa (DARPA). DARPA, una agencia de investigación y desarrollo del Departamento de Defensa de los Estados Unidos, es responsable del desarrollo de tecnologías emergentes para su uso en el ejército.

"Trabajar con DARPA es particularmente excitante porque estamos en primera línea con investigadores que están haciendo cosas de las que otros podrían no oír hablar durante cinco o diez años y eso tendrá un impacto increíble en diez o quince años", dijo el Dr. Dennis. "Nuestro papel es proporcionarles infraestructura. Les ayudamos a resolver problemas; somos facilitadores de su trabajo. El día a día es súper estresante y desafiante, pero cuando ves los resultados, es genial". 

Un proyecto de DARPA que Data Machines apoyan es un programa llamado "Aprendiendo con menos etiquetas". El objetivo es encontrar nuevos y avanzados algoritmos de aprendizaje de máquinas que utilicen muchos menos ejemplos etiquetados para lograr los mismos resultados. 

El Dr. Dennis ofreció una explicación simplificada del proyecto: "Digamos que estás tratando de clasificar una imagen. "¿Esta es una imagen de un gato, o es una imagen de un perro? Si eres Google o Facebook, es fácil conseguir mil millones de ejemplos etiquetados y entrenar a estos enormes modelos que funcionan bastante bien. Pero si no eres Google o Facebook, es difícil conseguir mil millones de ejemplos. De hecho, en algunos dominios que le importan al gobierno, mil millones de ejemplos podrían no existir. Así que el enfoque de este programa es cómo los investigadores avanzados pueden desarrollar esos algoritmos y mostrar de hecho que, para órdenes de magnitud, menos etiquetas obtienen la misma calidad para una tarea como la clasificación de imágenes".

"Aprender con menos etiquetas" es multifacético con aspectos enfocados a la detección de objetos, clasificación de imágenes y traducción automática. En un enfoque de investigación común a DARPA, los equipos están tomando una amplia gama de enfoques: Algunos están tratando de combinar múltiples algoritmos diferentes de aprendizaje automático; algunos se están sumergiendo profundamente en los procesos técnicos; otros están utilizando cantidades masivas de computación, mientras que otros están trabajando en conseguir que los algoritmos funcionen bien en una tarjeta GPU en la nube. Luego hay un equipo de evaluación independiente del gobierno que trabaja para identificar los enfoques exitosos y ayudar a cada equipo a adaptarse basándose en el aprendizaje compartido.

Data Machines tiene contratos para proporcionar la infraestructura que apoya a todos estos equipos en todo el mundo, incluyendo investigadores en Australia, Canadá, Israel, los Países Bajos, y en todos los EE.UU.

Eso fue lo que llevó a Data Machines a Linode.

"Cuando dices aprendizaje de máquina hoy, eso significa GPU", dijo el Dr. Dennis. "Todos los investigadores quieren toda la capacidad de la GPU que puedan conseguir. Nosotros tenemos algunas GPU en nuestro propio centro de datos, pero necesitábamos más para apoyar a todo el equipo en todo el mundo. Fue entonces cuando empezamos a buscar en los proveedores de nubes públicas para ver si había una manera de poner recursos a disposición de estos investigadores a un precio razonable".

"Recibimos sorpresas de otros grandes proveedores, así que miré en Linode, con quien había sido un cliente personal durante casi una década", continuó el Dr. Dennis.

El Dr. Brian Dennis

"Linode no sólo tenía un gran precio para las instancias de la GPU sino que también usaba las exactas y difíciles tarjetas NVIDIA que comprábamos para nuestros propios centros de datos. Además, Linode ofrece GPU en diferentes incrementos, lo cual es difícil de encontrar con otros proveedores. Ese aumento de la flexibilidad es útil cuando se amplía o se pasa del desarrollo a las pruebas".

El Dr. Dennis admite que parte de su responsabilidad es elegir la mejor solución de infraestructura para cada proyecto, por lo que está constantemente buscando las mejores opciones y evaluando otros proveedores. "Cada proyecto que apoyamos es un copo de nieve, por lo que tenemos que estar atentos a las mejores soluciones individuales, equilibrando el costo, la elasticidad, la flexibilidad y la seguridad", dijo. "Pero lo que he aprendido, y el consejo que compartiría con otros es este: Hay otras opciones además de los grandes proveedores de tres letras que pueden ser igual de valiosas para ti. Los proveedores de nubes alternativos como Linode pueden ser flexibles y mucho más receptivos. Debes salir de la caja en términos de ponerse en contacto con otros proveedores.

"Y por nuestra experiencia en Data Machines, puedo decirles que Linode trae muchos activos a la mesa, incluyendo costo, confiabilidad, servicio al cliente, y simplicidad en precios y despliegue. Nos encanta que Linode ofrezca un conjunto relativamente pequeño pero bien enfocado de servicios que son fáciles de soportar. Todo el material extra es sólo una carga para nuestro tiempo".

El Dr. Dennis añadió que la fiabilidad y el servicio al cliente que ofrece Linode son puntos de venta enormes. "La fiabilidad de Linode ha sido grande, lo cual es extremadamente importante para los investigadores de clase mundial a los que servimos. Y el servicio de atención al cliente de Linode es de primera clase y oportuno. Estás trabajando con una persona real. Si tienes un cliente con demandas muy estrictas, es genial tener un buen servicio de tu lado."

Compartir esto