seoded (seoded) wrote,
seoded
seoded

рассовый статистизм

Оригинал взят у bvlb в рассовый статистизм
Чрезвычайно любопытное эээ... исследование, с весьма неожиданными выводами.

Жаждущий справедливости и равенства автор задался вопросом: есть ли расизм в алгоритме гугловской рекламы? Для этого он сделал любопытную вещь: взял три набора имен, наиболее часто соответствующих черным, латина и белым американцам. Потом стал в джимейле делать следующее: создавать новое письмо, в поле From: писать расово-статистически значимое имя, а в поле сабжект заголовок типа "Срочно нужен адвокат" или "образование" и т.п. Соответственно справа появляются объявления, причем для "черных" имен на сабджет "образование" всё оказывается как-то больше про колледж, а для "белых" про PhD, для "белых" сабджект "адвокат" будет давать предложения какого-нибудь цивильного адвоката, а для "черных" - контору, отмазывающую от обвинения в вождении под наркотой и т.д. и т.п. Далее автор начинает ходить с ноутбуком по разным районам города и пробовать то же самое, получая столь же явно вопиющие и обличающие результаты.

Что тут можно сказать. Не считая того, что все это чудовищно, фундаментально антинаучно, что в сто раз менее грубые воздействия на исход эксперимента дают результаты, противоположные реальному положению дел, не считая того, что автор практически прямо признается в том, что заинтересован в полученом исходе эксперимента, и что мельком сам замечает, что выборка слишком мала и нерепрезентативна и при этом делает обличающие заявления, при всем при этом, идея эксперимента мне весьма нравится и где-то в своей задумке (но не реализации) она кажется мне довольно естественнонаучной.

Но тут есть и другое глубокое непонимание, хорошо иллюстрирующее переворот вещей в сознании, часто наблюдаемый у подобных людей. Например, автор пишет: "Some of the profiling results were just odd, more likely reflecting wayward racial profiling algorithms created by Google than by the advertisers themselves.". Там есть несколько таких фраз, рисующих картину того, как представляет это себе автор: вот сидят в гугле умнющие и злющие инженеры и перед ними таблица со ста параметрами: "возраст, национальность, цвет кожи, ...." и они такие говорят: "хаха, а давайте белым показывать вот такие результаты, а черным вот такие. Фиг с ними, с черными, зато сделаем больше миллионов долларов прибыли".

Мы конечно не знаем как именно _в точности_ работает AdSense/AdWords. Но зная совсем немного о подобных алгоритмах, будет естественным предположить, что все происходит противоположным образом: если 100 человек по фамилии "Вашингтон" из показанных им объявлений адвокатов выбрали не адвоката по корпоративным делам, а именно по вождению под веществами, то 101му вашингтону именно это объявление покажут на первом месте из равноценных по плате за клик и прочим факторам. Но не потому что буржуины из гугла углядели этот факт и получили от черного адвоката по веществам на карман. А потому что в какой-то ячейке чего-то-там что-то-там увеличилось. И сделано это не стараниями гугла, а стараниями тех, кто на это объявление кликает.

Т.е. если в обществе неравенство есть, то я вполне могу поверить, что оно будет отражено в контекстной рекламе на основе прафайлинга юзеров. Отражено. Не потому, что так захотел гугл. А потому что так захотели сами кликающие пользователи из определенного района города. Алгоритм обучился тому соответствию фамилий - выборам, кот. реально существует в обществе, и нечего на зеркало пенять, коли рожа крива.

Вобщем хорошее исследование - и по изначальной задумке и по демонстрации агрессивного технического невежества на дурной службе благим целям.

"Сколько бедных лачуг мы снесем, чтобы проложить Информационную Супермагистраль?".
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 0 comments