Pular para o conteúdo principal

Dr. Brian Dennis

Ofício do Código
Dr. Brain Dennis - Máquinas de Dados

Como as Máquinas de Dados Fazem Grandes Dados


Quando o Dr. Brian Dennis vai ao trabalho todos os dias, ele tem o privilégio de saber que seu trabalho impacta diversos desafios como finanças de ameaças, tráfico humano, cibersegurança, apoio a decisões, saúde, investimento e litígio.

Data Machines Corp. é uma empresa de análise de dados especializada em projetar, construir e usar arquitetura de nuvem para projetar e compartilhar soluções para problemas em análise de dados, DevOps, inteligência de máquina e ciência de dados. Os sistemas e códigos da empresa são usados diariamente por mais de 2.500 pesquisadores, cientistas de dados e parceiros de transição de pesquisa para permitir projetos avançados de P&D. A Data Machines trabalha com amplas equipes de pesquisa compostas por governo, indústria e academia em transição de tecnologias importantes com marca branca.

O Dr. Dennis juntou-se à Data Machines em 2018 após ocupar posições de pesquisa nos laboratórios Invincea Labs e Lockheed Martin. Como Diretor de Engenharia de Dados da empresa, ele continua seus mais de 20 anos de pesquisa aplicada centrada em dados na indústria de defesa, trabalhando com organizações como a Defense Advanced Research Projects Agency (DARPA). A DARPA, uma agência de pesquisa e desenvolvimento do Departamento de Defesa dos Estados Unidos, é responsável pelo desenvolvimento de tecnologias emergentes para uso pelos militares.

"Trabalhar com a DARPA é particularmente excitante porque estamos na linha de frente com pesquisadores que estão fazendo coisas que outros talvez não ouçam durante cinco a 10 anos e que terão um impacto incrível dentro de 10 a 15 anos", disse o Dr. Dennis. "Nosso papel é fornecer infra-estrutura para eles". Estamos ajudando-os a resolver problemas; estamos sendo capacitadores para o trabalho deles". No dia-a-dia, é super estressante e desafiador, mas quando você vê os resultados, é ótimo". 

Um projeto da DARPA que a Data Machines suporta é um programa chamado "Aprendendo com Menos Rótulos". O objetivo é encontrar novos e avançados algoritmos de aprendizagem de máquinas que usam muito menos exemplos rotulados para alcançar os mesmos resultados. 

O Dr. Dennis ofereceu uma explicação simplificada do projeto: "Então, digamos que você está tentando classificar uma imagem. Isto é uma imagem de um gato, ou isto é uma imagem de um cão? Se você é Google ou Facebook, é fácil obter um bilhão de exemplos rotulados e treinar esses enormes modelos que funcionam muito bem. Mas se você não é Google ou Facebook, é difícil conseguir um bilhão de exemplos. De fato, em alguns domínios com os quais o governo se preocupa, um bilhão de exemplos pode nem existir. Portanto, o foco deste programa está em como os pesquisadores avançados podem desenvolver esses algoritmos e mostrar para um fato que, para ordens de magnitude, menos etiquetas recebem a mesma qualidade para uma tarefa como a classificação de imagens".

O "Learning with Less Labels" é multifacetado, com aspectos voltados para a detecção de objetos, classificação de imagens e tradução automática. Em uma abordagem de pesquisa comum à DARPA, as equipes estão adotando uma ampla gama de abordagens: Algumas estão tentando combinar vários algoritmos de aprendizado de máquina diferentes; outras estão se aprofundando nos processos técnicos; outras estão usando grandes quantidades de computação, enquanto outras estão trabalhando para que os algoritmos funcionem bem em uma placa de nuvem GPU . Em seguida, há uma equipe de avaliação governamental independente trabalhando para identificar abordagens bem-sucedidas e ajudar cada equipe a se adaptar com base no aprendizado compartilhado.

Data Machines contrata para fornecer a infra-estrutura que apóia todas essas equipes em todo o mundo, incluindo pesquisadores na Austrália, Canadá, Israel, Holanda e em todos os Estados Unidos.

Foi isso que levou as máquinas Data Machines à Linode.

"Quando se fala em aprendizado de máquina hoje em dia, isso significa GPUs", disse o Dr. Dennis. "Todos os pesquisadores querem o máximo de capacidade possível em GPU . Executamos algumas GPUs em nosso próprio data center, mas precisávamos de mais para dar suporte a toda a equipe em todo o mundo. Foi quando começamos a procurar provedores de nuvem pública para ver se havia uma maneira de disponibilizar recursos para esses pesquisadores a um preço razoável.

"Recebemos um choque de adesivos de outros fornecedores maiores, então olhei para Linode, com quem eu era um cliente pessoal há quase uma década", continuou o Dr. Dennis.

Dr. Brian Dennis

"A Linode não só tinha ótimos preços para instâncias GPU , mas também usava as placas NVIDIA exatas e difíceis de encontrar que estávamos comprando para nossos próprios data centers. Além disso, a Linode oferece GPUs em diferentes incrementos, o que é difícil de encontrar em outros provedores. Essa maior flexibilidade é útil ao aumentar a escala ou passar do desenvolvimento para o teste."

O Dr. Dennis admite que parte de sua responsabilidade é escolher a melhor solução de infra-estrutura para cada projeto, portanto ele está constantemente em busca das melhores opções e avaliando outros fornecedores. "Cada projeto que apoiamos é um floco de neve, portanto temos que estar atentos às melhores soluções individuais, equilibrando custo, elasticidade, flexibilidade e segurança", disse ele. "Mas o que aprendi, e os conselhos que eu compartilharia com outros, é o seguinte: outras escolhas além dos grandes fornecedores de três letras que podem ser igualmente valiosas para você". Os fornecedores alternativos de nuvens como Linode podem ser flexíveis e muito mais ágeis. Você deve sair da caixa em termos de contato com outros provedores.

"E a partir de nossa experiência na Data Machines, posso dizer que a Linode traz muitos ativos para a mesa, incluindo custo, confiabilidade, atendimento ao cliente e simplicidade no preço e implementação. Adoramos que a Linode ofereça um conjunto relativamente pequeno, mas bem focado de serviços que são fáceis de se manter de pé. Todo o material extra é apenas um estorvo para o nosso tempo".

O Dr. Dennis acrescentou que a confiabilidade e o atendimento ao cliente prestados pela Linode são enormes pontos de venda. "A confiabilidade da Linode tem sido grande, o que é extremamente importante para os pesquisadores de classe mundial que servimos. E o atendimento ao cliente da Linode é de alto nível e oportuno". Você está trabalhando com uma pessoa de verdade. Se você tem um cliente com exigências realmente apertadas, é ótimo ter um bom serviço ao seu lado".

Compartilhe este