«Ъ»: власти Москвы потратят 132 миллиона рублей на создание витрины с обезличенными данными горожан Статьи редакции
Пользователь через интерфейс сможет видеть данные об имуществе горожан, тратах на ЖКХ и другую статистику.
Подведомственное департаменту информационных технологий (ДИТ) Москвы государственное казённое учреждение «Информационный город» хочет создать интерактивную витрину с обезличенными данными о москвичах и систему обмена этими данными с «внешними потребителями». Об этом пишет «Коммерсантъ».
За 132 миллиона исполнитель контракта должен будет доработать «информационную систему управления данными в распределённой вычислительной среде», которая уже собирает в том числе информацию об объектах недвижимости жителей Москвы, их транспорте и счетах за коммунальные услуги. ДИТ хочет сделать систему визуализации собранных данных, сама же информация о москвичах будет собрана в специальные витрины.
Власти Москвы уточнили изданию, что система анализирует только обезличенные данные и к ней смогут подключаться только органы исполнительной власти. Опрошенные «Ъ» эксперты считают, что «внешними потребителями» обновлённой системы могут стать и компании, оказывающие услуги горожанам: у мэрии Москвы с июля 2020 года появилось право передавать персональные данные горожан без их согласия.
Ребята из комментариев, а Вы вообще в курсе, как работает современный анализ данных, да даже банальная статистика? Публикация обезличенных данных в рамках открытого дата-сета крайне полезна для социальных исследователей (включая экономистов). Вряд ли, конечно, этим будут активно пользоваться для планирования политик (хотя для этого все и задумывается), но как бывший аналитик могу сказать, что мне подобного очень сильно не хватало.
Потому что даже Росстат у нас работает по старинке: вбивает все вручную в Excel-таблички (это не по всем направлениям работы так, но такое все еще встречается). Про государственные органы я вообще молчу, там при слове "данные" делают круглые глаза и отправляют в бумажный, мать его, архив.
Проблема в том, что действительно "обезличить" данные сложно. Ну, т.е. действительно сложно. Особенно, когда они сразу по нескольким сферам.
2008 год
https://www.wired.com/2009/12/netflix-privacy-lawsuit/
2017 год
https://arxiv.org/abs/1712.05627
2019 год
https://www.nytimes.com/2019/07/23/health/data-privacy-protection.html
Добавьте сюда национальный долбоебизм публикующих эти данные органов, которые блокируют твиттер по регулярке *t.co* и при этом не несут никакой ответственности. Отсюда и скептицизм комментаторов.
Эффективный паркур
Это всё прекрасно, но российское государство успешно закрепило мнение о себе, как о сборище жуликов и лжецов. Никто не верит, что данные будут обезличены - вот и вся суть проблемы.
Вряд ли, конечно, этим будут активно пользоваться для планирования политик (хотя для этого все и задумывается)
Зато все мы знаем для чего эти "обезличенные" данные точно будут использоваться. И похуй с какой целью оно там изначально задумывалось. В современной России задумки правительства с реальностью практически никогда ничего общего не имеют.
На бумаге задумка хорошая, ты прав. Но эти "ребята из комментариев" отлично знают, что реализовано будет все через одно место и в итоге будет использовано только во вред населению. Как именно - никто не ответит, никто не разбирается из тех, кто язвит. Но это уже рефлекс - если государство что-то предпринимает, то значит станет еще хуже
Как именно - никто не ответит, никто не разбирается из тех, кто язвит.
В чём там разибраться? Данные по традиции нихуя не будут обезличенными, те же ведомства/чиновники, которые должны отвечать за их сохранность, сами же их и сольют за барыши, либо по тупости. Базы пополнятся, дальше, думаю, объяснять не нужно. Прецедентов уже целый вагон.
Ты мне про росстат вообще не говори - еще более бесполезные уебки, чем роскомпозор.
Я как ИП должен раз в пять лет отсылать им данные о доходах. Вручную. Зарегиться в их ЛК - тот еще квест.
А по факту они могли бы просто запрашивать у налоговой или вообще в автоматическом режиме подгружать. Пидоры.
ну по логике иного формата для хранения баз данных кроме SQL-ых пока нет.
Никакой excel этот объем не вывезет.
формата для хранения баз данных кроме SQL
А как же blob? А как же txt?
ну да, txt
что-то мне кажется что txt такой не вывезет.
А в чем txt будешь потом крутить?
Ну глупо отрицать, что кроме SQL в области баз данных ничего нет. Ну или я не слышал.
Ты рофла не понял.
Ладно, в word писать будут.
кроме SQL в области баз данных
*реляционных, среди них это самый популярный язычок.
Есть проприетарщина, тот же Q для хранения и обработки временных рядов, а тот же nosql
Вот Вам смешно, а я лично обрабатывал данные одного из ведомств, которые были присланы в виде таблички Ворда. Как потом оказалось, распространенная практика, особенно у надзорных органов.
а бывшие аналитики прост не думают, что на закрытой части данных ему лет через 5 например прикрутят более лучшую систему налогов, сборов и штрафов в особо жирных городах рфии, чтоб жить было веселее
Ее и так, и так прикрутят, а данные в любом случае будут сливать. Что теперь делать-то, когда что-то анализировать и писать исследования надо? И лучше это делать на открытых данных (но там выше уже верно сказали, что я слишком оптимистично посмотрел на ситуацию), чем на недоданных Росстата или внутренней ведомственной статистики. С дооценкой и прочей чушью, к которой вынуждены прибегать исследователи от безысходности.
Постоянный космос
Тут все эксперты в области жуликов и воров, не мешайте им своими дата саенсами
Чё ты начинаешь, нормально же общались. А что не так уже в комментах выше описали. Тут и не надо быть экспертом, достаточно понять где живёшь и как вся благая на первый взгляд идея, делается через жопу в итоге
Постоянный
делается через жопу в итоге
Как бэ есть проекты, которые нормально сделали, но тут о таком говорить не принято
Подозрительный
«Сделать нормально» за x20 типичных для проекта расходов — все еще пиздец если что.
Я имею ввиду проекты которые нормально сделали. Не имею ввиду те что властями Москвы, так не житель этого города, и хотя к ним аборигенам и приезжим будут вопросы наверняка, а к тем что в общем по стране. Конечно они есть, но как правило инициаторами будут не власти, а простые граждане. Но как только к ним прилагают руку чиновники всё идёт по пизде, как правило.
И этих, нормальных проектов, больше, чем те которые мы в итоге имеем?
Чуви. Я разрабатывал и внедрял все это 12 лет назад, да только воз и ныне там. Очередной попил бюджета.
Да, теперь вычислять анимешников будут методами численного анализа ;)
Чтобы начать нормально планировать инфраструктуру, развивать бизнес, собирать налоги, повышать качество госуслуг.
Для этого всего нужны данные. Нормальная тема продавать доступ к обезличеным данным и бизнесу, например.
Тут просто мамкины скептики, они не знают что им не нравится, но на всякий сучай бухтят.
132 миллиона это кому надо миллионы, а в результате "работы" сольют в интернет рандомный CSV датасет из какого-нибудь мейлсру