自动化数据标记平台如何在大流行期间加速AI行业的发展

时间:2020-11-04 15:08:44来源:
导读 数据是任何AI ML开发的核心。数据的质量和深度决定了AI应用程序的级别。考虑到用于构建ML训练模型的数据越好,输出就越好。机器学习团

数据是任何AI / ML开发的核心。数据的质量和深度决定了AI应用程序的级别。考虑到用于构建ML训练模型的数据越好,输出就越好。机器学习团队需要进行适当的数据准备,例如数据收集,清理和标记。

数据标记是一个简单但困难的任务

当涉及数据标记时,这是处理原始数据(图像,文本文件,视频等)以用于计算机视觉的重要步骤,以便机器学习模型可以从标记的数据集中学习,一些数据标记公司被迫转移到由于大流行而导致的在家工作模式,这在通信,数据质量和检查方面提出了挑战。例如,Google Cloud正式宣布其数据标签服务有限或不可用,直至另行通知。用户只能通过电子邮件请求数据标记任务,而不能通过Cloud Console,Google Cloud SDK或API启动新的数据标记任务。

业内人士说,数据标记是一项简单但困难的任务。一方面,一旦制定了标签标准,数据标签商只需耐心和专业就直接遵守规则。但是,另一方面,数据标记是为了追求ML的高质量,而ML对于要标记的大量数据要求准确性,效率和高人工成本以及时间。

根据Alegion发布的一份报告,大多数AI组织表示,用数据训练AI的过程比预期的要困难。缺乏数据和数据质量问题已成为AI应用的主要障碍。

最新文章