Zum Inhalt springen

Dr. Brian Dennis

Craft of Code
Dr. Brain Dennis - Datenmaschinen

Wie Data Machines Big Data produziert.


Auf der täglichen Fahrt zur Arbeit hat Dr. Brian Dennis das Privileg zu wissen, dass seine Arbeit große Auswirkungen auf verschiedenste Bereiche hat, so z.B. auf Threat Finance, Transport, Cybersicherheit, Entscheidungshilfe, Gesundheitswesen, Investments und Recht.

Data Machines Corp. ist ein Unternehmen für Datenanalyse, das sich auf den Entwurf, den Aufbau und die Nutzung von Cloud Architekturen spezialisiert hat. Man entwickelt Lösungen für Probleme in den Bereichen Datenanalyse, DevOps, Maschinenintelligenz und Datenwissenschaft. Die Systeme und der Code des Unternehmens werden täglich von mehr als 2.500 Forschern, Informatikern und Research Transition Partnern verwendet. Data Machines arbeitet beim White-Label-Übergang wichtiger Technologien mit Forschungsteams der Regierung, der Industrie und von Hochschulen zusammen.

Dr. Dennis kam 2018 zu Data Machines, nachdem er Forschungsstellen bei Invincea Labs und Lockheed Martin innehatte. Als Director of Data Engineering setzt er seine über 20-jährige Arbeit in der angewandten datenzentrierten Forschung in der Verteidigungsindustrie fort und kooperiert mit Organisationen wie der Defense Advanced Research Projects Agency (DARPA). Die DARPA ist eine Forschungs- und Entwicklungsagentur des US-Verteidigungsministeriums und für die Entwicklung neuer Technologien für das Militär zuständig.

"Die Zusammenarbeit mit DARPA ist besonders spannend, weil wir mit den Forschern an vorderster Front zusammenarbeiten. Die tun Dinge, von denen andere vielleicht erst in fünf bis zehn Jahren hören, die dann aber eine unglaubliche Wirkung haben werden", so Dr. Dennis. "Unsere Aufgabe ist es, die Infrastruktur für sie bereitzustellen. Wir helfen ihnen, Probleme zu lösen; wir ermöglichen ihre Arbeit. Tag für Tag ist es super stressig und herausfordernd, aber wenn man die Ergebnisse sieht, ist es toll." 

Ein DARPA Projekt, das Data Machines unterstützt, hört auf den Namen "Lernen mit weniger Labels". Ziel ist es, neue und fortschrittliche Algorithmen für maschinelles Lernen zu finden, die weit weniger Labels (= gekennzeichnete Beispiele) verwenden, um die gleichen Ergebnisse zu erzielen. 

Dr. Dennis hat eine einfache Erklärung für das Projekt parat: "Nehmen wir an, Sie versuchen, ein Bild zu klassifizieren. Ist auf einem Bild eine Katze oder ein Hund? Google oder Facebook haben eine Milliarde gelabelte, also beschriftete Beispiele, um diese riesigen Modelle zu trainieren. Für andere ist es schwierig, eine Milliarde Beispiele zu bekommen. In einigen Bereichen, um die sich die Regierung kümmert, gibt es vielleicht nicht einmal eine Milliarde Beispiele. Der Schwerpunkt dieses Programms liegt also darauf, wie Wissenschaftler solche Algorithmen entwickeln können und wie sie für eine Aufgabe dieser Größenordnung mit weniger Labels die gleichen Ergebnisse erzielen können".

"Lernen mit weniger Labels" konzentriert sich auf Aspekte wie Objekterkennung, Bildklassifikation und maschinelle Übersetzung. In einem ähnlichen Forschungsansatz verfolgen die Teams verschiedenste Ansätze: Einige versuchen, mehrere Algorithmen des maschinellen Lernens zu kombinieren; einige tauchen tief in die technischen Prozesse ein; andere verwenden riesige Mengen an Rechenleistung, während wieder andere daran arbeiten, die Algorithmen auf einer einzigen Cloud GPU Karte funktionieren zu lassen. Dann gibt es ein unabhängiges Evaluierungsteam der Regierung, das erfolgreiche Ansätze identifiziert und Teams hilft, sich auf der Grundlage des gemeinsamen Lernens auszutauschen.

Data Machines stellt die Infrastruktur bereit, die all diese Teams weltweit unterstützt, darunter Forscher in Australien, Kanada, Israel, den Niederlanden und in den USA.

Und genau das hat Data Machines zu Linode geführt.

"Wenn Sie heute von maschinellem Lernen sprechen, dann sind damit GPUs gemeint", so Dr. Dennis. "Alle Forscher wollen möglichst viel GPU Kapazität. Wir betreiben zwar einige GPUs in unserem eigenen Rechenzentrum, aber wir brauchten mehr, um das gesamte Team auf der ganzen Welt zu unterstützen. So begannen wir mit der Suche nach Public Cloud Anbietern, die den Forschern Ressourcen zu einem vernünftigen Preis zur Verfügung stellen können.

"Wir bekamen bei den großen Providern einen Preisschock, also schaute ich mir Linode an, bei dem ich seit fast einem Jahrzehnt persönlicher Kunde war", fuhr Dr. Dennis fort.

Dr. Brian Dennis

"Linode hatte nicht nur tolle Preise für GPU Instanzen, sondern verwendete auch genau die schwer zu beschaffenden NVIDIA Karten, die wir für unsere eigenen Rechenzentren kauften. Außerdem bietet Linode GPUs in verschiedenen Abstufungen an, was bei anderen Anbietern kaum zu finden ist. Diese erhöhte Flexibilität ist hilfreich bei der Skalierung der Entwicklung und des Testens".

Dr. Dennis ist dafür zuständig, für jedes Projekt die beste Infrastrukturlösung zu wählen, daher ist er ständig auf der Suche und evaluiert andere Anbieter. "Jedes von uns unterstützte Projekt ist eine Schneeflocke, deshalb müssen wir nach den individuell besten Lösungen Ausschau halten und dabei Kosten, Elastizität, Flexibilität und Sicherheit abwägen", sagte er. "Aber was ich gelernt habe - und diesen Rat teile ich gerne mit anderen - ist: Es gibt neben den großen Anbietern mit drei Buchstaben noch andere Möglichkeiten, die für Sie genauso wertvoll sein können. Alternative Cloud Anbieter wie Linode können flexibel und viel reaktionsschneller sein. Sie sollten über den Tellerrand hinausschauen, wenn es darum geht, andere Anbieter zu kontaktieren.

"Und aus unserer Erfahrung bei Data Machines kann ich Ihnen sagen, dass Linode viele Pluspunkte mitbringt, darunter Kosten, Zuverlässigkeit, Kundendienst und Einfachheit bei Preisgestaltung und Bereitstellung. Wir finden es toll, dass Linode eine relativ kleine, aber gut fokussierte Reihe von Services anbietet, die leicht aufzustellen sind. All das zusätzliche Material ist nur eine Belastung".

Dr. Dennis fügte hinzu, dass die Zuverlässigkeit und der Kundendienst von Linode ein großes Verkaufsargument sind. "Die Zuverlässigkeit von Linode ist großartig und für die Weltklasse Forscher, für die wir arbeiten, äußerst wichtig. Auch der Support von Linode ist super und zeitnah. Sie arbeiten mit einer echten Person zusammen. Wenn Sie einen Kunden mit wirklich hohen Anforderungen haben, ist es toll, einen guten Service an der Seite zu haben."

Teilen