Как показывает практика, многие компании выкладывают немалые деньги за то, чтобы их сайты находились на топовых позициях в поисковых системах Интернета. Но эксперты информационных технологий обратили внимание на то, что сразу после попадания файлов Google Docs в выдачу Yandex, фирмы стараются сделать все возможное, чтобы страницы с личными данными не попали в поисковую выдачу. В чем причина таких действий? Сегодня расскажем все об утечках личной информации в Интернете, а также о том, как этого избежать.

Зона риска: какая персональная информация может оказаться в поисковых системах и причины этого явления

На самом деле утечки непубличной информации в поисковые системы происходят регулярно по всему миру. Грешат этим всевозможные онлайн-магазины, банковские организация, государственные структуры, различные сервисы и т.д.

  • Почему так происходит? Потому что «не дорабатывают», забывают вносить правки или даже не подозревают, что такая угроза существует. Многие компании попросту не имеют в своем штате СЕО-специалистов, которые обычно занимаются этими вопросами.
  • Что мы имеем в итоге? Такие ситуации чреваты тем, что поисковые системы в Интернете могут проиндексировать информацию, которую нельзя размещать в свободной доступе.
  • О какой информации идет речь? Существует много данных, о которых не принято рассказывать всем, кому не лень. К примеру: логины с паролями, скан-копии документов, подтверждающих личность, данные банковских карт, базы клиентов, отчеты и т.д.

Приведем конкретный пример: в 2017-м поисковик Гугл проиндексировал тексты, которые люди перевели при помощи облачного ресурса Translate.com. Это оказалась документация международной корпорации Statoil: отчеты, пароли, планы и т.д. Кто виноват в сложившейся ситуации? Работники ресурса, которые не закрыли данные от индексации.

Риск утечки информации в Интернете через облачные технологии, конечно, есть, но намного чаще непубличные данные оказываются в поисковых системах прямо с сайтов конкретных компаний. К примеру, фирма переехала на новый сайт, а работники забыли запретить индексировать страницы. Как говорится, сами «налажали».

Причины попадания непубличных данных в поисковые системы: как избежать утечки

Как выявить утечку информации в Интернете и ликвидировать ее

  1. Необходимо проверить все служебные домены и поддомены

Запомните, под раздачу может попасть не только сам сайт, но и ряд рабочих доменов и поддоменов. Так, например, Yandex.metrika индексирует все страницы Интернет-ресурсов, на которые заходили юзеры. При этом в разделе дополнительных настроек счетчика этого поисковика предусмотрен специальный чек-бокс, запрещающий отправлять страницы на индексацию. Для того, чтобы защитить непубличные данные, просто активируйте этот чек-бокс.

  1. Надо изучить перечень страниц из индекса поисковых систем в Интернете

Следующий шаг – проверка проиндексированных страниц сайта, к примеру, в Yandex.

  • Для этого Вам понадобится специальный инструментарий – Yandex.Вебмастер. Как найти нужную информацию? Зайдите в категорию «Страницы, которые участвуют в поиске». Здесь представлен весь перечень страничек, которые ранее уже были проиндексированы.
  • Еще один вариант найти необходимые страницы – использовать парсеры: ComparseR, A-parser.
  • Также можно воспользоваться специальными программами-пауками: Screaming frog seo spider, Netpeak spider. Эти программулины занимаются анализом всех ссылок на Интернет-ресурсе без исключения, и позволяют получить всю необходимую информацию.
  1. Удаляем страницы из поиска

Идем простым путем. Необходимо скрыть все страницы сайта от индексации. В этом помогут файлы robots.txt. Как это сделать читайте в подсказках Yandex или Google.

После того, как закроете странички, то можно проверить, все ли сделано правильно. Для этого зайдите в категорию «Анализ Robots.txt» в Yandex.Вебмастер.

Причины попадания непубличных данных в поисковые системы: как избежать утечки

Какое время занимает ликвидация утечки непубличной информации в Интернете

Как показывает опыт, на решение проблемы уходит от 2 до 6 недель. Почему так много? Потому что поисковые системы должны переиндексировать правки, а на это необходимо определенные время. Есть возможность ускорить процедуру. Для этого можно воспользоваться следующими инструментами Яндекс и Гугл. Также Вы можете написать в службу техподдержки интересующей поисковой системы в Интернете с просьбой удалить проблемные страницы.

Послесловие

Чтобы не пропустить утечку личной информации в Интернете, систематически проводите аудит. Сделать это только один раз и навсегда не получится, потому что любые изменения на сайте могут стать причиной утечки.

(Visited 33 times, 1 visits today)

Добавить комментарий