Даже обезличенные базы данных представляют опасность
В США действует Закон о свободном доступе к информации, согласно которому власти должны обеспечить беспрепятственное получение любой информации, если она не является секретной и ее раскрытие не наносит ущерб национальной безопасности. Власти Нью-Йорка в качестве эксперимента выложили базу данных о перемещениях такси в свободный доступ и очень скоро поняли, что сделали это зря.
База содержит номер лицензии таксиста, время и место загрузки пассажира, время и место выгрузки, количество пассажиров, стоимость проезда и т.д. Специалисты по Big Data посмотрели на данные, немного поколдовали над базой и начались настоящие чудеса.
Хотя имен в базе нет, аналитики очень быстро их вычислили, сопоставив координаты начала маршрута с адресной книгой. Далее удалось на каждого отдельного гражданина составить профиль: где обедает, с кем встречается, где развлекается.
Дальше — больше. Сопоставив протяженность маршрута с фактической оплатой можно вычислить размер оставляемых чаевых. Другими словами, можно вычислить зажиточных граждан. Учитывая, что известны их адреса и примерный распорядок дня, базой наверняка заинтересуются криминальные элементы, ведь это идеальный список претендентов на визит вора-домушника.
По конечным точкам маршрута можно вычислить ФИО завсегдатаев борделей и других злачных мест с целью последующего шантажа.
Не обошлось и без курьезов. Специалисты вдоволь посмеялись над тем, как власти «защитили» приватную информацию о номерах машин и водительских лицензий. Для каждого номера вычислялось значение хэш-функции MD5, которое и сохранялось в базе вместо фактического номера. Учитывая, что и диапазон номеров машин, и диапазон номеров водительских лицензий известен заранее, специалисты подсчитали MD5 для всего диапазона, а потом прошлись по базе в поисках совпадений. В результате легко удалось восстановить исходные значения.
Специалисты предупреждают: даже обезличенные данные в руках аналитиков легко превращаются в персонализированные, которые уже могут создавать угрозу для безопасности отдельной личности.
Комментарии
pomodor
12 ноября, 2014 - 02:56
Самое неприятное, что коммерсы кинулись накапливать свои базы, а надежно защищать их так и не научились. Чего стоят одни логи сотовых операторов, с детальным маршрутом перемещений с привязкой к ФИО. Хорошо, что данные получают только полицаи и чекисты. А если БД нечаяно или нарочно сольют в сеть? Будем знать друг о друге всё? А есть еще БД у провайдера, БД с портала госуслуг и т.д. Опытный спец по Big Data, если получит доступ, вытянет из массива цифр такое, о чем даже сам владелец данных не догадывался. ;)
Комментировать