В «Яндексе» снова нашли личные документы пользователей Google Docs Статьи редакции
В компании по-прежнему говорят, что индексируют только те файлы, которые не защищены настройками приватности.
В поисковой выдаче «Яндекса» снова появились файлы пользователей сервиса Google Docs, которые не защищены настройками приватности. Когда в начале июля произошла аналогичная утечка, компания временно перестала выдавать любые результаты, связанные с Google Docs.
Как обратило внимание РБК, в поисковую выдачу вернулись документы по запросам «График» и «Зарплата». Проверка TJ показала, что «Яндекс» действительно выдаёт файлы Google Docs с этими словами. Владельцы таких документов разрешили просмотр или редактирование всем, кто получил ссылку.
Кроме графиков и зарплат, поисковик выдаёт документы и по старым запросам вроде «Пароли» и «Откаты».
Из поисковика можно открыть файлы пользователей сервиса Google, в том числе личную информацию.
Представитель «Яндекса» заявил TJ, что «ничего нового» не произошло, и поисковик по прежнему индексирует только документы, которые находятся в открытом доступе. После первой утечки компания скрывала файлы Google Docs из поиска.
На нашей стороне ничего не менялось. На документы, о которых идёт речь, стоят ссылки в интернете. Сами документы не запрещены для индексации.
В блоге Google также говорится, что в выдачу попадают пользовательские файлы, сделанные публичными.
Честно говоря удивлён, что Яндекс вместо того, чтобы уже принудительно отключить индексацию всех адресов связанных с Google Docs (нахер они в принципе нужны в поиске?) - рассказывает истории о том, что виноваты пользователи.
Пользователи то может и виноваты, но дело в том, что это показывает наплевательское отношение Яндекса к пользовательским данным. Я сильно не изучал тему, но был уверен, что они ещё с первого дня просто убрали всё из индекса. Пошли на встречу безопасности пользователей взяв инициативу в свои руки. Но нет.
Комментарий удален
Предыдущий франт
Яндекс виноват, что гугол разрешает индексировать доки?
Технически да, юридически нет. Яндекс просто спиздил ссылки у пользователей своего "браузера".
Удивленный Илья
Да никто и не спорит. Я же пишу, что понятно, что виноваты сами пользователи. И да, понятно что Google разрешает индексировать документы открытые по ссылке.
И концептуально Яндекс действительно не обязан ничего удалять из выдачи. Но раньше при похожих ситуациях у IT-рынка было единое отношение к безопасности пользователей и они готовы были ради этой безопасности делать исключения. Сейчас видимо этой лояльности уже нет.
Комментарий удален
Кривой спрей
То, что документ в Google Docs, совсем не значит, что он приватный, даже если доступен только по ссылке. И как, скажете, Яндексу разделять?
Необычный цвет
Пользователи виноваты только в том, что продолжают использовать браузер Яндекса после первого слива.
Громадный кофе
А как ты предлагаешь гуглу запретить индексировать доки? Через корневую инструкцию для робота? Это же будет документ весом несколько терабайт со всем, что нагенерили людишки за последнюю тысячу лет, робота просто загнет к хренам от такого количества исключений
Собачий жар
Чегось?
Disallow: /document
Disallow: /spreadsheets
И проблема решена
Предыдущий франт
Disallow: /document
Все такие умные, а что делать с теми доками, которые ДОЛЖНЫ быть публичными? И ХОЧЕТСЯ, чтобы их индексировали?
Единственное более-менее рабочее решение, которое я придумал для гугла требует времени и никак не повлияет на доки, у которых не меняли тип доступа с 2 на 1 или 3.
Комментарий удален
Громадный кофе
Ага, а еще Яндекс пусть начнет игнорировать robots.txt и будет индексировать все подряд, а ночью, когда нагрузка на сервера меньше - подбирать sha256 ключи к базам, которые не удалось заиндексировать днем.
Все правильно Яндекс делает. Ошибки учат. Хочешь хранить важные документы в интернете? Думай о последствиях и безопасности.
Яндекс никому ничего не должен, он просто поисковик и сканирует все что ему разрешили.
Зачем они там нужны? Еще как нужны. Есть масса интересных таблиц на любую тему, заполенных людьми сообща. И я зачастую приятно удивляюсь их информативности, находя в поиске.
Удивленный Илья
Это конечно правильно, но последствия так себе. Дело в том, что такой подход демонстрирует уровень отношения в том числе к данным, которые доверяются самому Яндексу. Это становится удобной отмазкой на будущее.
Выдающийся цвет
Ты пишешь неправильные вещи.
Если ты важные документы положил посреди улицы - нехуй пиздеть на тех, кто их прочитал. Пизди на того, кто их положил посреди улицы, на обзор всем (в т.ч. тем, кому это видеть не надо).
Следственный Кирилл
Я наоборот всеми руками за то, что выдача снова показывает эти документы. Идиоты должны страдать, а неидиоты смогут найти много полезного для себя. Если пользователи будут недовольны слишком сильно и начнут уходить с гуглдоков, гугл закроет возможность индексации.
Был, кстати, раньше интересный способ увеличения ссылочной массы сайта. Пишешь уникальную статью в гугл доке, фигачишь ссылки на свой сайт - получаешь норм ссылочной массы.
Не понимаю почему вообще этот вайн Поднялся? Доки индексируются уже кучу лет.
Одно дело когда яндекс закрывает от индекса файлы мегафона, когда был слив номеров телефона. И совсем другое когда пользователь делает документ публичным. И да, я как пользователь, когда ищу инструкцию к стиралке, я хочу её найти, её важно в пдф она или гугл докс.
Формальный чувак
всегда там было на 25-ых страницах
Чё?
Google возомнив себя единственным поисковиком забил хуи на robots.txt
Может быть, может быть и гугл сам выдал эти адреса документов. Но яндекс уже про это в курсе и не удалил документы из базы адресов кравлера. Теперь претензии только к нему если он снова проиндексировал документы по старым адресам
Комментарий удален
Формальный чувак
Уже разобрались в комментах. Яндекс это узнал через свой браузер-троян который сливает посещённые пользователем URL
«Яндекса» заявил TJ, что «ничего нового» не произошло, и поисковик по прежнему индексирует только документы, которые находятся в открытом доступе
Э не! Теперь такая отмазка не пройдёт. Был это баг гугла или нет, мы уже договорились что вы потрёте адреса документов из базы адресов своего кравлера. Гугл может только убрать путь по которому эти адреса утекли изначально, но менять адреса он не может иначе документы перестанут открываться же.
А ещё есть большой вопрос к яндексу почему при своей невиновности они не выложили адрес страницы с которой их кравлер добыл адреса документов. Уже месяц прошёл, могли бы разобраться. А если яндекс этой инфы не даёт то это больше похоже на взлом со стороны яндекса чем на дыру в гугле.
Формальный чувак
Кстати яндекс мог адреса документов надыбать из своей же почты например, его пользователи могли скидывать друг другу адреса документов для личного пользования а яндекс эти адреса передал кравлеру для индексации и привет. Тогда это сто процентная дыра яндекса
Громадный кофе
Выкладывали же уже, что робот яндекса повторно посещает все страницы, которые ты посещаешь из его браузера
Формальный чувак
Ну ахуевшие мудаки тогда, 100% вина яндекса и всё. Дело закрыто
Громадный кофе
то, что робот посещает, не значит, что он дает их в поиске, яндекс говорит, что они смотрят на исключения в robots.txt
Формальный чувак
Он не должен пиздить адреса страниц из браузера. Точка. Сначала яндекс установил на компы пользователей троян который пиздит и передаёт в яндекс персональные данные и адреса в том числе со всеми параметрами и паролями которые могут быть в адресе, а потом яндекс ещё и требует от админов сайтов чтото там указать в robots а ни то они сохранят эти адреса навсегда. Дважды ахуевшие мошенники и шантажисты.
Активный франт
У них в яндекс-браузере в соглашении прописано, что они сливают всю информацию о посещенных страницах, если только галочка "сливать данные" не снята
Предыдущий франт
Ващето это дыра в браузере, очевидная
Дак это блин в самом Яндексе дыра. 100% они не только в браузере делают. Чего только стоило приложение электрочек / метро ~5-6 лет назад
Формальный чувак
эти дыры
Только в первый раз. А теперь вопрос только к яндексу хули он не удалил адреса документы из индекса после предыдущего раза.
Формальный чувак
Кто сказал что им всё ещё можно законно сканировать? Гугл может прикрыл дыру. А менять адреса документов он не может, у пользователей всё сломается. У тех которые намеренно передавали адреса документов третьим лицам для ознакомления или публиковали гдето у себя на сайтах
Альтернативный
если доступ к сорсу закрывается, то даже имея тот же самый адрес, ты уже вряд ли что-то вытянешь оттуда
Формальный чувак
А схуяли гуглу закрывать доступ к документу? Яндекс узнал эти адреса через троян под названием "яндекс браузер". Гугл абсолютно не виноват. Предоставлять доступ по уникальному https адресу известному только узкому кругу лиц совершенно нормально и секьюрно. Это яндекс троян пользователям установил и адреса эти спиздил
Альтернативный
схуяли гуглу закрывать доступ к документу?
хотя бы потому, что это вопрос приватности, который гугл обязан обеспечить для пользователя, если тот не хочет открывать общий доступ к своим документам.
Яндекс узнал эти адреса через троян под названием "яндекс браузер"
а если бы это был не Яндекс? или было бы лучше, если бы это был не Яндекс?
Формальный
Гугл обеспечил приватность. Сам он эти уникальные и длинные адреса нигде не сливал. Яндекс поставил к пользователям троян который слил данные с их компьютеров. С таким же успехом они могут через свой браузер-троян сливать ещё и содержимое страниц в том числе когда пользователь почту читает на gmail, ты тоже тогда будешь гугл винить что он разрешил пользователю на gmail залогиниться?
Формальный
Не сливает а использует для своей же таргетинговой рекламы. Тоесть данные никому не передаются. Ну официально по крайней мере так.
Собственны
We do not process email content to serve ads
https://www.blog.google/technology/safety-security/ensuring-your-security-and-privacy-within-gmail/
Альтернати
мне интересно, каким образом мы перешли с работы поисковика на работу браузера, построенного к тому же на базе гугловского хрома?
может, не нужно путать тёплое с мягким?
Формальный
База гугловского хрома адреса не сливает в яндекс. Это уже яндекс "допилили" свой троян и начал сливать посещённые пользователем адреса в компанию. Просто тупо ворует пользовательские данные.
Альтернативный единорожек88
нам бы знать детали этой истории, чтобы объективно судить о том, что и почему..