斯坦福大学筹集了1500万美元用于优化机器学习

时间:2020-07-15 15:11:18来源:
导读 2014年,在副教授和MacArthur Fellow ChrisRé的建议下,计算机科学博士学位候选人Alex Ratner和斯坦福大学的一个博士团队正在该

2014年,在副教授和MacArthur Fellow ChrisRé的建议下,计算机科学博士学位候选人Alex Ratner和斯坦福大学的一个博士团队正在该大学着名的AI实验室从事一项研究项目。他们关注的主要问题是,由于机器学习模型从中学习的数据需要昂贵且费时的手动标记,因此公司无法像他们期望的那样广泛而有效地部署AI。

拉特纳说:“就像许多学术项目一样,那只是一个混乱的下午,还有一些数学的白板。”“很快,我们就开始了这个问题,即如果我们将范式从手工标记改为程序化标记,那么对于很多人来说,这是非常有趣的。”

在花了五年时间开发产品并将其部署到Google,Apple,Intel和司法与国防部等组织之后,研究团队于2019年从AI实验室中分离出来,创立了一家名为Snorkel AI的公司。

今天,这家企业摆脱了隐身模式,宣布已从Greylock Partners,GV和In-Q-Tel等投资者那里筹集了总计1500万美元(种子轮和A轮融资)。“我们的使命是激发我们的动力,不仅是发表有关这些有趣的算法或理论思想的更多论文,而且实际上是通过一个新的端到端平台使AI更广泛地实用,该平台集中关注数据标记问题,” Ratner,担任公司首席执行官的人说。

该公司的旗舰产品是称为Snorkel Flow的端到端机器学习平台,该平台允许以更快的速度通过编程方式部署AI应用程序。

Snorkel Flow可以代替人类标签制造商的军队,而后者现在是由手工完成的。这些手动过程的示例包括训练AI应用程序以帮助放射线医师对胸部X射线进行分类。放射科医生必须坐在一堆图像上,标记哪些是紧急的,哪些不是要教AI算法的。另一个例子是一家银行希望AI对某人的贷款组合进行分类,分类和提取信息。这些公司需要让他们的法律团队每一次要更改某些内容时,都要手工检查并标记成千上万个文档。

拉特纳说:“我们的重点一直放在手工标记数据的领域上,这不仅是一个缓慢或昂贵的选择,而且常常只是一个入门者。”

根据拉特纳(Ratner)的说法,这通常是由于以下三个因素中的一个或多个:数据是私有的,因此公司无法将其外包以使其在组织外部被标记,数据需要有需求的专家(医生或法律分析师),而且数据经常变化,因此公司总是发现自己在贴标签和重新贴标签。

Snorkel AI的平台启用了一种编程方法,因此用户可以编写功能(例如,如果他们在标题中看到“雇佣”一词,则可以将其标记为雇佣合同)而不是一次标记一个文档。

拉特纳说:“这样做的好处是,编写一打或十二打这些标签功能来标记您的AI解决方案比手工标记文档要快几个数量级。”

最新文章