Home Bots & Brains MIT trekt dataset terug vanwege racistische en beledigende typeringen

MIT trekt dataset terug vanwege racistische en beledigende typeringen

door Marco van der Hoeven

MITR heeft zijn veelgebruikte dataset van 80 miljoen Tiny Images offline gehaald, na berichten dat er racistische en beledigende typeringen waren gekoppeld aan de afbeeldingen. De afbeeldingenset werd veel gebuikt om AI te trainen in het herkennen van mensen en voorwerpen. Om te voorkomen dat de gewraakte typeringen in AI terecht komen is de dataset niet meer raadpleegbaar, en roept MIT op om geen gebruik te maken van eerder gedownloade versies.

Technologiesite The Register ontdekte dat afbeeldingen van vrouwen waren gelabeld met termen als whore en bitch, terwijl zwarter mensen de typering nigger kregen in de dataset. In een verklaring biedt MIT daar excuses voor aan, en legt uit hoe dit kon gebeuren. In 2006 werd op basis van 53.464 woorden die uit Wordnet ware gekopieerd automatisch de afbeeldingendatabase gemaakt, door met die woorden beeldmateriaal te downloaden van internet met behulp van diverse gangbare zoekmachines.

Controleren

De database is met tachtig miljoen afbeeldingen in een formaat van 32×32 pixels niet effectief handmatig door mensen te controleren. Zelfs als dat zou gebeuren is er geen garantie dat beledigende termen volledig zijn geëlimineerd. Daarom heeft MIT besloten de gehele dataset terug te trekken, en ook in de toekomst niet meer te gebruiken. De AI-community wordt gevraagd de set niet meer te gebruiken, en gedownloade kopieën te vernietigen.

Waarden

De makers besluiten met  aanstootgevende en vooringenomen beelden en denigrerende terminologie vervreemden een belangrijk deel van onze gemeenschap – precies die mensen voor wie we ons inspannen. Het draagt ook bij aan schadelijke vooroordelen in AI-systemen die op dergelijke gegevens zijn getraind. Bovendien schaadt de aanwezigheid van dergelijke vooringenomen beelden de inspanningen om een cultuur van inclusiviteit in de technologiegemeenschap te bevorderen. Dit is buitengewoon jammer en druist in tegen de waarden die we nastreven.

Misschien vind je deze berichten ook interessant