Корпорация Майкрософт удалила базу данных распознавания лиц

微软删除人脸识别数据库

微软wēi ruǎn 一直yī zhí dōu 号称hào chēng 拥有yōng yǒu zuì de rén liǎn 数据shù jù 任何rèn hé rén dōu 可以kě yǐ 使用shǐ yòng lái 训练xùn liàn 面部miàn bù 识别shí bié 算法suàn fǎ 因为yīn wèi 媒体méi tǐ de 报道bào dào 引发yǐn fā le 关于guān yú 隐私yǐn sī 道德dào dé 问题wèn tí de 关注guān zhù 曾经céng jīng 公开gōng kāi 可用kě yòng de 数据shù jù 已经yǐ jīng 悄然qiǎo rán 消失xiāo shī xiàn 删除shān chú de 数据shù jù zhōng 包含bāo hán 超过chāo guò 1000 wàn zhāng 面孔miàn kǒng 这些zhè xiē 面孔miàn kǒng 来自lái zì Flickr děng 网站wǎng zhàn 这些zhè xiē 网站wǎng zhàn 储存chǔ cún de shì 根据gēn jù 知识zhī shí 共享gòng xiǎng 许可xǔ kě 上传shàng chuán de 照片zhào piàn —— zhè 意味yì wèi zhe 许多xǔ duō dōu 可以kě yǐ 免费miǎn fèi dàn 可能kě néng yǒu 版权bǎn quán 问题wèn tí 其中qí zhōng de 许多xǔ duō 面孔miàn kǒng 属于shǔ yú 名人míng rén —— 包括bāo kuò 记者jì zhě 隐私yǐn sī 研究yán jiū 人员rén yuán —— 并且bìng qiě 他们tā men 知道zhī dào 自己zì jǐ de 图像tú xiàng bèi 包括bāo kuò zài nèi

当然dāng rán 微软wēi ruǎn bìng 不是bù shì 唯一wéi yī jiā 通过tōng guò cóng 开放kāi fàng de 互联网hù lián wǎng shàng 抓取zhuā qǔ 照片zhào piàn lái 组装zǔ zhuāng 大型dà xíng 数据shù jù de 公司gōng sī 调查diào chá 显示xiǎn shì 很多hěn duō 创业chuàng yè 公司gōng sī 一直yī zhí zài 使用shǐ yòng 照片zhào piàn 收集shōu jí 应用程序yìng yòng chéng xù 暗中àn zhōng 收集shōu jí shù 百万bǎi wàn zhāng 面孔miàn kǒng ér 其他qí tā 公司gōng sī 一直yī zhí zài 扫描sǎo miáo 大量dà liàng de tóu zhào

微软 [wēi ruǎn] Microsoft
号称 [hào chēng] государство
[kù] Библиотека
媒体 [méi tǐ] средства массовой информации
引发 [yǐn fā] Спусковой крючок
隐私 [yǐn sī] конфиденциальность
关注 [guān zhù] внимание
可用 [kě yòng] Доступный
[jí] набор
悄然 [qiǎo rán] Тихо
面孔 [miàn kǒng] лицо
储存 [chǔ cún] Магазин
共享 [gòng xiǎng] делиться
许可 [xǔ kě] лицензия
意味 [yì wèi] означать
版权 [bǎn quán] авторское право
名人 [míng rén] знаменитость
研究 [yán jiū] учеба, исследование
图像 [tú xiàng] изображение
互联网 [hù lián wǎng] интернет
抓取 [zhuā qǔ] Захватить
组装 [zǔ zhuāng] Собрание
创业 [chuàng yè] Запуск
收集 [shōu jí] собирать
应用程序 [yìng yòng chéng xù] приложение
暗中 [àn zhōng] Тайно
扫描 [sǎo miáo] сканирующий
大量 [dà liàng] Масса

Microsoft всегда утверждала, что обладает самой большой базой данных лиц, и любой желающий может использовать ее для обучения алгоритмам распознавания лиц. Поскольку сообщения средств массовой информации вызвали обеспокоенность по поводу конфиденциальности и этических вопросов, наборы данных, которые были общедоступны, незаметно исчезли. Удаленный набор данных содержит более 10 миллионов лиц с таких сайтов, как Flickr, которые хранят фотографии, загруженные по лицензии Creative Commo s, что означает, что многие из них бесплатны, но могут иметь проблемы с авторским правом. Многие из этих лиц не являются знаменитостями, включая журналистов и исследователей конфиденциальности, и они не знают, что их изображения включены в список.

Конечно, Microsoft — не единственная компания, которая собирает большие массивы данных, используя фотографии из открытого Интернета. Опрос показывает, что многие стартапы используют приложение для сбора фотографий, чтобы тайно собирать миллионы лиц, в то время как другие компании сканируют множество крупных снимков.