当布莱恩-丹尼斯博士每天上班时,他有幸知道他的工作影响着各种不同的挑战,如威胁金融、人口贩运、网络安全、决策支持、医疗保健、投资和诉讼。
Data Machines Corp.是一家数据分析公司,专门设计、构建和使用云架构来设计和分享数据分析、DevOps、机器智能和数据科学方面问题的解决方案。该公司的系统和代码每天被2500多名研究人员、数据科学家和研究过渡伙伴使用,以实现高级研发项目。Data Machines与由政府、工业和学术界组成的广泛研究团队合作,对重要技术进行白标过渡。
丹尼斯博士在Invincea实验室和洛克希德-马丁公司担任研究职位后,于2018年加入数据机器公司。作为公司的数据工程总监,他继续在国防工业领域从事20多年以数据为中心的应用研究,与国防高级研究计划局(DARPA)等组织合作。DARPA是美国国防部的一个研究和开发机构,负责开发供军队使用的新兴技术。
"丹尼斯博士说:"与DARPA合作特别令人兴奋,因为我们站在研究人员的前线,他们正在做别人可能在5到10年内都听不到的事情,而这些事情将在10到15年内产生难以置信的影响。"我们的作用是为他们提供基础设施。我们正在帮助他们解决问题;我们正在成为他们工作的推动者。日复一日,它是超级压力和挑战,但当你看到结果时,它是伟大的。"
数据机器公司支持的一个DARPA项目是一个名为 "用更少标签学习 "的项目。其目的是寻找新的和先进的机器学习算法,使用少得多的标记实例来实现相同的结果。
丹尼斯博士对该项目进行了简化解释:"因此,假设你正试图对一幅图像进行分类。'这是一张猫的照片,还是一张狗的照片?如果你是谷歌或Facebook,很容易得到10亿个有标签的例子,并训练出这些巨大的模型,效果很好。但如果你不是谷歌或Facebook,就很难得到10亿个例子。事实上,在政府关心的一些领域,10亿个例子甚至可能不存在。因此,该计划的重点是先进的研究人员如何开发这些算法,并证明对于像图像分类这样的任务,用数量级更少的标签也能获得同样的质量。"
"少标签学习 "涉及多个方面,重点是物体检测、图像分类和机器翻译。按照 DARPA 惯用的研究方法,各团队正在采取广泛的方法:有的团队试图将多种不同的机器学习算法结合起来;有的团队正在深入研究技术流程;有的团队正在使用海量计算,而有的团队正在努力让算法在一个云GPU 卡上良好运行。此外,还有一个独立的政府评估团队致力于找出成功的方法,并帮助每个团队根据共享的学习成果进行调整。
数据机器公司签约提供基础设施,支持世界各地的所有这些团队,包括澳大利亚、加拿大、以色列、荷兰和美国各地的研究人员。
这也是导致Data Machines找到Linode的原因。
"丹尼斯博士说:"今天,当你说到机器学习,那就意味着GPU。"所有研究人员都希望获得尽可能多的GPU 容量。我们确实在自己的数据中心运行了一些 GPU,但我们需要更多的 GPU 来支持世界各地的整个团队。因此,我们开始关注公共云提供商,看看是否有办法以合理的价格向这些研究人员提供资源。
"丹尼斯博士继续说:"我们受到了其他大型供应商的冲击,所以我看了看Linode,我已经和他们成为近十年的个人客户了。
丹尼斯博士承认,他的部分责任是为每个项目选择最佳的基础设施解决方案,因此他不断地寻找最佳选择,并评估其他供应商。"他说:"我们支持的每个项目都是一片雪花,所以我们必须留意个别最佳解决方案,平衡成本、弹性、灵活性和安全性。"但我所学到的,以及我想与其他人分享的建议是:"除了三大运营商之外,还有其他选择:除了那些大的三个字母的供应商之外,还有其他的选择,对你来说也同样有价值。像Linode这样的替代性云计算供应商可以很灵活,而且响应速度更快。你应该在联系其他供应商方面跳出框框。
"而根据我们在Data Machines的经验,我可以告诉你,Linode带来了许多资产,包括成本、可靠性、客户服务以及定价和部署的简单性。我们喜欢Linode提供了一套相对较小但重点突出的服务,而且很容易站起来。所有额外的东西只是拖累了我们的时间"。
丹尼斯博士补充说,Linode提供的可靠性和客户服务是巨大的卖点。"Linode的可靠性一直很好,这对我们所服务的世界级研究人员极为重要。而且,Linode的客户服务是一流的、及时的。你是在与一个真正的人合作。如果你有一个要求非常严格的客户,有好的服务在你身边是非常好的。"