Vai al contenuto principale

Dr. Brian Dennis

Il mestiere del codice
Dr. Brain Dennis - Macchine dati

Come le macchine dei dati fanno i Big Data


Quando il Dr. Brian Dennis va al lavoro ogni giorno, ha il privilegio di sapere che il suo lavoro ha un impatto su sfide diverse come la finanza delle minacce, il traffico di esseri umani, la cybersicurezza, il supporto alle decisioni, la sanità, gli investimenti e le controversie.

Data Machines Corp. è un'azienda di analisi dei dati specializzata nella progettazione, nella costruzione e nell'utilizzo di architetture cloud per progettare e condividere soluzioni ai problemi di analisi dei dati, DevOps, machine intelligence e data science. I sistemi e il codice dell'azienda sono utilizzati quotidianamente da oltre 2.500 ricercatori, data scientist e partner di transizione della ricerca per consentire progetti di R&S avanzati. Data Machines collabora con ampi gruppi di ricerca composti da governo, industria e università per la transizione white-label di importanti tecnologie.

Il dottor Dennis è entrato a far parte di Data Machines nel 2018 dopo aver ricoperto posizioni di ricerca presso Invincea Labs e Lockheed Martin. In qualità di direttore dell'ingegneria dei dati dell'azienda, continua i suoi oltre 20 anni di ricerca applicata ai dati nel settore della difesa, collaborando con organizzazioni come la Defense Advanced Research Projects Agency (DARPA). La DARPA, un'agenzia di ricerca e sviluppo del Dipartimento della Difesa degli Stati Uniti, è responsabile dello sviluppo di tecnologie emergenti da utilizzare in ambito militare.

"Lavorare con la DARPA è particolarmente eccitante perché siamo in prima linea con ricercatori che stanno facendo cose di cui gli altri potrebbero non sentir parlare prima di cinque o dieci anni e che avranno un impatto incredibile tra dieci o quindici anni", ha dichiarato il dott. "Il nostro ruolo è quello di fornire loro un'infrastruttura. Li aiutiamo a risolvere i problemi, siamo dei facilitatori del loro lavoro. Ogni giorno è molto stressante e impegnativo, ma quando si vedono i risultati è fantastico". 

Un progetto DARPA che Data Machines sostiene è un programma chiamato "Learning with Less Labels". L'obiettivo è trovare nuovi e avanzati algoritmi di apprendimento automatico che utilizzino un numero molto inferiore di esempi etichettati per ottenere gli stessi risultati. 

Il dottor Dennis ha offerto una spiegazione semplificata del progetto: "Diciamo che si sta cercando di classificare un'immagine. È la foto di un gatto o di un cane?". Se siete Google o Facebook, è facile ottenere un miliardo di esempi etichettati e addestrare questi modelli enormi che funzionano abbastanza bene. Ma se non siete Google o Facebook, è difficile ottenere un miliardo di esempi. In effetti, in alcuni settori che interessano al governo, un miliardo di esempi potrebbe anche non esistere. Il programma si concentra quindi sul modo in cui i ricercatori più avanzati possono sviluppare questi algoritmi e dimostrare che, con un numero di etichette inferiore di ordini di grandezza, si ottiene la stessa qualità per un compito come la classificazione delle immagini".

Il progetto "Learning with Less Labels" è multiforme, con aspetti incentrati sul rilevamento degli oggetti, sulla classificazione delle immagini e sulla traduzione automatica. Secondo un approccio di ricerca comune a DARPA, i team stanno adottando un'ampia gamma di approcci: Alcuni cercano di combinare diversi algoritmi di apprendimento automatico; altri si immergono in profondità nei processi tecnici; altri ancora utilizzano enormi quantità di calcolo, mentre altri lavorano per far funzionare bene gli algoritmi su una scheda cloud GPU . C'è poi un gruppo di valutazione governativo indipendente che lavora per identificare gli approcci di successo e aiutare ogni gruppo ad adattarsi in base all'apprendimento condiviso.

Data Machines si occupa di fornire l'infrastruttura che supporta tutti questi team in tutto il mondo, compresi i ricercatori in Australia, Canada, Israele, Paesi Bassi e negli Stati Uniti.

Questo è ciò che ha portato Data Machines a Linode.

"Quando si parla di machine learning oggi, si parla di GPU", ha dichiarato il Dr. Dennis. "Tutti i ricercatori vogliono la massima capacità di GPU . Noi utilizziamo alcune GPU nel nostro data center, ma ne avevamo bisogno per supportare l'intero team in tutto il mondo. A questo punto abbiamo iniziato a cercare fornitori di cloud pubblici per vedere se c'era un modo per rendere disponibili le risorse a questi ricercatori a un prezzo ragionevole".

"Abbiamo avuto un'impressione di shock da parte di altri fornitori più grandi, quindi ho preso in considerazione Linode, con cui sono stato cliente personale per quasi un decennio", ha continuato il dott.

Dr. Brian Dennis

"Linode non solo aveva ottimi prezzi per le istanze GPU , ma utilizzava anche le stesse schede NVIDIA , difficili da trovare, che stavamo acquistando per i nostri data center. Inoltre, Linode offre GPU in diversi incrementi, cosa difficile da trovare con altri fornitori. Questa maggiore flessibilità è utile quando si passa dallo sviluppo al testing".

Il Dr. Dennis ammette che parte della sua responsabilità consiste nello scegliere la migliore soluzione infrastrutturale per ogni progetto, quindi è costantemente alla ricerca delle opzioni migliori e valuta altri fornitori. "Ogni progetto che supportiamo è un fiocco di neve, quindi dobbiamo tenere d'occhio le singole soluzioni migliori, bilanciando costi, elasticità, flessibilità e sicurezza", ha detto. "Ma quello che ho imparato e che consiglio ad altri è questo: Ci sono altre scelte, oltre ai grandi fornitori a tre lettere, che possono essere altrettanto valide per voi". I provider cloud alternativi come Linode possono essere flessibili e molto più reattivi. Dovreste uscire dagli schemi e contattare altri provider.

"E dalla nostra esperienza in Data Machines, posso dire che Linode offre molti vantaggi, tra cui il costo, l'affidabilità, il servizio clienti e la semplicità dei prezzi e della distribuzione. Ci piace che Linode offra un insieme di servizi relativamente piccolo ma ben focalizzato, facile da gestire. Tutte le cose extra sono solo una perdita di tempo".

Il Dr. Dennis ha aggiunto che l'affidabilità e il servizio clienti forniti da Linode sono punti di forza importanti. "L'affidabilità di Linode è stata ottima, il che è estremamente importante per i ricercatori di livello mondiale che serviamo. E il servizio clienti di Linode è di prim'ordine e tempestivo. Si lavora con una persona reale. Se si ha un cliente con esigenze molto strette, è bello avere un buon servizio dalla propria parte".

Condividi questo