Avançar para o conteúdo principal

Dr. Brian Dennis

Construção de Códigos
Dr. Brain Dennis - Máquinas de Dados

Como as Máquinas de Dados Fazem Grandes Dados


Quando o Dr. Brian Dennis vai trabalhar todos os dias, ele tem o privilégio de saber que seu trabalho impacta diversos desafios como finanças de ameaças, tráfico humano, segurança cibernética, apoio a decisões, saúde, investimento e documentos legais.

Data Machines Corp. é uma empresa de análise de dados especializada em projetar, construir e usar arquitetura de nuvem para projetar e compartilhar soluções para problemas em análise de dados, DevOps, inteligência de máquina e ciência de dados. Os sistemas e códigos da empresa são usados diariamente por mais de 2.500 pesquisadores, cientistas de dados e parceiros de transição de pesquisa para permitir projetos avançados de P&D. A Data Machines trabalha com amplas equipes de pesquisa compostas por governo, indústria e academia na transição de tecnologias importantes para a marca branca.

O Dr. Dennis juntou-se à Data Machines em 2018 depois de ocupar posições de pesquisa nos laboratórios Invincea e Lockheed Martin. Como Diretor de Engenharia de Dados da empresa, ele continua seus mais de 20 anos de pesquisa aplicada na indústria de defesa, trabalhando com organizações como a Defense Advanced Research Projects Agency (DARPA). A DARPA, uma agência de pesquisa e desenvolvimento do Departamento de Defesa dos Estados Unidos, é responsável pelo desenvolvimento de tecnologias emergentes para uso dos militares.

"Trabalhar com a DARPA é particularmente excitante porque estamos na linha de frente com pesquisadores que estão fazendo coisas que outros talvez não ouçam durante 5 a 10 anos e que terão um impacto incrível dentro de 10 a 15 anos", disse o Dr. Dennis. "Nosso papel é fornecer infraestrutura para eles". Estamos ajudando-os a resolver problemas; estamos sendo facilitadores do trabalho deles". No dia-a-dia, é super estressante e desafiador, mas quando você vê os resultados, é ótimo". 

Um projeto DARPA que a Data Machines suporta é um programa chamado "Aprendendo com menos rótulos". O objetivo é encontrar novos e avançados algoritmos de aprendizagem de máquinas que usam muito menos exemplos rotulados para alcançar os mesmos resultados. 

O Dr. Dennis ofereceu uma explicação simplificada do projeto: "Então digamos que estamos tentando classificar uma imagem. "Isto é uma imagem de um gato, ou é uma imagem de um cão? Se você é do Google ou do Facebook, é fácil conseguir um bilhão de exemplos rotulados e treinar esses enormes modelos que funcionam muito bem. Mas se você não é Google ou Facebook, é difícil conseguir um bilhão de exemplos. Na verdade, em alguns domínios com os quais o governo se preocupa, um bilhão de exemplos pode até nem existir. Então o foco deste programa é como pesquisadores avançados podem desenvolver esses algoritmos e mostrar para um fato que, para ordens de magnitude, menos rótulos eles recebem a mesma qualidade para uma tarefa como classificação de imagens".

"Aprender com menos etiquetas" é multifacetado com aspectos focados na detecção de objetos, classificação de imagens e tradução automática. Em uma abordagem de pesquisa comum à DARPA, as equipes estão adotando uma ampla gama de abordagens: Algumas estão tentando combinar vários algoritmos diferentes de aprendizado de máquina; algumas estão mergulhando profundamente em processos técnicos; outras estão usando quantidades maciças de computação, enquanto outras estão trabalhando para conseguir que os algoritmos funcionem bem em uma placa de GPU em nuvem. Depois, há uma equipe de avaliação governamental independente trabalhando para identificar abordagens bem-sucedidas e ajudar cada equipe a se adaptar com base no aprendizado compartilhado.

Data Machines contrata para fornecer a infraestrutura que suporta todas essas equipes em todo o mundo, incluindo pesquisadores na Austrália, Canadá, Israel, Holanda, e em todos os EUA.

Foi isso que levou as Máquinas de Dados para a Linode.

"Quando dizem aprendizagem de máquina hoje, isso significa GPUs", disse o Dr. Dennis. "Todos os investigadores querem o máximo de capacidade de GPU que conseguirem. Nós rodamos algumas GPUs em nosso próprio centro de dados, mas precisávamos de mais para dar suporte a toda a equipe ao redor do mundo. Foi aí que começamos a olhar para os provedores de nuvens públicas para ver se havia uma maneira de disponibilizar recursos para esses pesquisadores a um preço razoável".

"Recebemos um choque de outros fornecedores maiores, então olhei para Linode, com quem eu era um cliente pessoal há quase uma década", continuou o Dr. Dennis.

Dr. Brian Dennis

"A Linode não só tinha um ótimo preço para as instâncias de GPU, mas também estava usando as placas NVIDIA exatas e difíceis de encontrar que estávamos comprando para nossos próprios centros de dados. Além disso, a Linode oferece GPUs em diferentes incrementos, o que é difícil de encontrar com outros provedores. Essa maior flexibilidade é útil ao escalonar ou estourar do desenvolvimento para os testes".

O Dr. Dennis admite que parte da sua responsabilidade é escolher a melhor solução de infraestrutura para cada projeto, por isso está constantemente à procura das melhores opções e a avaliar outros fornecedores. "Cada projeto que apoiamos é um floco de neve, então temos que estar atentos às melhores soluções individuais, equilibrando custo, elasticidade, flexibilidade e segurança", disse ele. "Mas o que eu aprendi, e o conselho que eu compartilharia com os outros é o seguinte: outras escolhas além dos grandes fornecedores de três letras que podem ser igualmente valiosas para si. Os provedores alternativos de nuvens como Linode podem ser flexíveis e muito mais ágeis. Você deve sair da caixa em termos de contato com outros provedores.

"E a partir de nossa experiência na Data Machines, posso dizer que a Linode traz muitos ativos para a mesa, incluindo custo, confiabilidade, atendimento ao cliente e simplicidade no preço e implantação. Adoramos que a Linode ofereça um conjunto relativamente pequeno mas bem focado de serviços que são fáceis de suportar. Todo o material extra é apenas uma chatice para o nosso tempo".

O Dr. Dennis acrescentou que a confiabilidade e o atendimento ao cliente prestados pela Linode são enormes pontos de venda. "A confiabilidade da Linode tem sido grande, o que é extremamente importante para os pesquisadores de classe mundial que servimos. E o atendimento ao cliente da Linode é de primeira linha e oportuno". Você está trabalhando com uma pessoa de verdade. Se tens um cliente com exigências muito apertadas, é ótimo ter um bom serviço do teu lado."

Compartilhe