人工智能为我们提供的机会和可能性

时间:2020-06-16 16:00:47来源:
导读在报纸,杂志和贸易杂志上,我们可以定期阅读人工智能为我们提供的机会和可能性。更确切地说,是关于它的危险。在讨论AI时,您几乎会自动想

在报纸,杂志和贸易杂志上,我们可以定期阅读人工智能为我们提供的机会和可能性。更确切地说,是关于它的危险。在讨论AI时,您几乎会自动想到确定偏见的图像识别技术。或是对数据精打细算的科技公司,他们对我们的个人生活一无所知。

当然,对新技术保持谨慎态度是完全可以的。但是没有必要夸大其词,而让有关AI可能存在的危险的讨论使对AI潜力的探索陷入瘫痪。我们不要坐下来等,而是首先进行实验并了解各种可能性。

实验

幸运的是,实验已经在荷兰进行。这带来了精彩的应用程序和宝贵的经验教训。Transkribus目前正在与各种档案馆合作,Transkribus是一种能够读取手稿并将其转换为计算机可读文本的系统。使用Transkribus,国家档案馆和北荷兰群岛档案馆使17世纪和18世纪VOC档案中的手稿成为可搜索的。

在荷兰国家图书馆目前正在使用自然语言处理出版物的半自动描述实验。荷兰声音与视觉研究所应用语音识别,以便能够更好地抓取电视节目。Noord-Hollands Archief计划使用图像识别来使Fotopersbureau De Boer的图像集变得可搜索:不仅借助元数据,而且借助照片本身的元素。

黑盒子

这些都是使用不同形式的人工智能的鼓舞人心的应用程序。神经网络是该领域中最复杂和难以捉摸的技术之一。我们不确切知道它们是如何工作的,我们经常看到这些“黑匣子”给出了很好的结果。这种难以捉摸的特性使神经网络的部署对于许多人来说尤其复杂,尤其是对于那些崇高数据伦理的人们。

那么,这是否意味着我们根本不应该使用它们?就我们而言。但是您确实需要仔细考虑何时使用它们以及用于什么目的。考虑到这一点,国家图书馆制定了AI原则,其中包括诸如“包容性”,“公正性”和“透明性”之类的元素。

偏压

但是也许比算法本身更重要的是用于训练算法的数据。尤其是数据的偏差至关重要。当我们首次在国家图书馆进行图像识别实验时,我们注意到现有的开源算法在识别现代照片的内容方面表现非常出色。

但是,历史照片中所识别的内容很少,而且这并不奇怪。Imagenet是构成许多图像识别算法基础的最大数据集,仅包含当代照片,因此偏向于此类照片。

输入数据

这将我们带到了遗产部门在AI领域中可以发挥的独特地位:我们可以将我们收集,描述和数字化了数百年的精美(数字)数据集“馈入”算法。

这带来了三个主要优点。首先,我们引入一种新型的偏差,使算法更加多样化。例如,我们介绍历史语言的使用和术语。这使我们的数据集有了第二生命,使我们能够在有关AI算法局限性的辩论中发挥重要作用。

标签:人工智能
最新文章