Горячая линия Линия помощи

Некоторые соображения о защите несовершеннолетних пользователей от потенциально опасных и незаконных Интернет-ресурсов

При рассмотрении темы фильтрации контента с целью осуществления эффективной защиты от вредоносного содержания следует учитывать масштабы этой задачи. Объем ресурсов современного интернета составляет свыше 230 млн. сайтов (в октябре 2009г.), с приростом за предшествующие 12 месяцев свыше 48 млн. сайтов, при нарастающем темпе роста объемов интернет- ресурсов (источник – Британская корпорация Netcraft)

Немного о фильтрации контента

Фильтрация контента может осуществляться на основе динамического анализа (в процессе обращения к ресурсу) или предварительно составленных списков URL, разбитых по категориям - «порнография», «азартные игры», «вредоносный сайт» (вирусы или другой вредоносный контент) , «новостные», «образовательные», «бизнес-ресурсы» и пр.

Первый подход предполагает очень ограниченную защиту – на основе ключевых слов и других несложных методов, дающих не слишком достоверный результат. Дело в том, что осуществить глубокий анализ вызываемых сайтов динамически невозможно – слишком сложная задача, требующая времени и ресурсов. Любые мало-мальски серьезные попытки решить ее приведут к неприемлемым задержкам при работе с интернетом.

Гораздо более эффективной является фильтрация на основе списка сайтов, помеченных категориями. Но кто составит такой список? Произвести анализ контента интернета силами экспертов невозможно в виду его астрономического объема. Надеяться на «сигналы» пользователей также не продуктивно: например, список блокируемых ресурсов, составленный Австралийской правительственной организацией «Australian Communications and Media Authority’s (ACMA)» по обращениям пользователей, за 5,5 лет вобрал лишь немногим более 3 тыс. сайтов.

Но даже если будет составлен список из 300 тыс. сайтов, его использование не обеспечит надежной защиты в виду того, что составление подобного списка будет всегда очень сильно отставать от реальной картины, которая меняется ежедневно. Более того, при ближайшем рассмотрении задача управления доступом к ресурсам интернета оказывается значительно шире банального блокирования, поэтому наиболее продуктивным является именно подход категоризации, а не составления «черного» списка.

Автоматические системы категоризации контента – решают ли эту задачу?

Как показывает анализ существующих систем фильтрации контента, эффективный заслон на пути вредоносного содержимого могут поставить лишь системы, автоматически анализирующие содержимое «мировой паутины». Подобные системы существуют в мире, они поддерживают относительно актуальные базы данных по мировому содержимому интернета, и постоянно их обновляют, но следует учитывать, что эффективность подобных систем, хотя и высока (до 90 – 95% и выше даже при тестировании опытными тестировщиками, умеющими отыскать «бреши» в системе), тем не менее, не является абсолютной.

Фильтры контента, использующие автоматически составленные базы категорий ресурсов интернета, в реальной жизни могут ошибаться где-то на 1% в ту или иную сторону: пропускать вредоносные сайты и блокировать безобидные, а иногда даже весьма полезные ресурсы. Блокирование «невинных» ресурсов называется “overblocking”, т.е. избыточное блокирование. В случае как избыточного, так и недостаточного блокирования необходимо вмешательство людей – на уровне корректировки баз данных категорий у поставщиков таких баз, или на уровне локальных фильтров, когда оперативно вносятся необходимые коррекции. При любом внедрении систем фильтрации должен быть предусмотрен механизм быстрого внесения таких необходимых коррекций.

Важной особенностью систем фильтрации, основанных на базах данных категорий, составленных автоматически, является то, что их трудно отнести к малобюджетным и ожидать возможной «бесплатности» их применения, поскольку основную их стоимость составляет обслуживание, выражающееся в постоянном обновлении (для эффективных систем оно осуществляется не реже, чем один раз в сутки, а в некоторых случаях ежечасно).

«Генератором стоимости обслуживания» подобных систем является их «сердце» - мощные дата-центры, круглосуточно и с высокой скоростью «перелопачивающие» мировые ресурсы интернет для определения и подтверждения их категорий. Работа таких дата-центров во многом схожа с работой поисковиков типа Google или Yandex, которые также постоянно осуществляют индексирование (разметку) мировых интернет-ресурсов, однако у систем, осуществляющих категоризацию, есть своя специфика. В частности, от них требуется более высокая оперативность: реакция поисковиков на появление новых ресурсов составляет от нескольких дней до двух недель, в то время как от «категоризаторов» требуется существенно более быстрое реагирование.

Можно ли обойтись простыми мерами?

Очевидно, что задача фильтрации контента представляет собой очень серьезный технологический вызов, требующий привлечения самых передовых в мире технологий и огромных вычислительных мощностей. Поэтому эффективными могут быть только те решения, которые созданы в условиях высококонкурентной глобальной рыночной среды.

Некоторые негативные примеры попыток внедрения упрощенных систем фильтрации должны предостеречь от ошибочных подходов. Так, например, в Австралии несколько лет назад была предпринята кампания по распространению бесплатных персональных фильтров. Об их характеристиках ничего не сообщается, но имеющиеся сведения позволяют предположить, что они относились к разряду примитивных.

Надо сказать, что в целом население в Австралии обладает определенным уровнем компьютерной грамотности и проявляет внимание к активности детей в интернете: по данным одного из опросов, порядка 92% родителей в той или иной степени участвуют в интернет-активности детей. Тем не менее, сенатор Stephen Conroy (в настоящее время – Minister for Broadband, Communications and the Digital Economy) в феврале 2008 заявил, имея в виду программу бесплатной раздачи домашних фильтров: “При том, что 150000 фильтров были загружены, и только 20% из них используются, программа, безусловно, провалилась...”

Что делать, если подходить системно?

С учетом всего вышесказанного, если задача защиты подрастающего поколения от вредоносного содержимого интернета действительно войдет в один из государственных приоритетов, предлагается следующий примерный сценарий внедрения интернет-фильтрации в реальную практику:

A) Следует образовать группу экспертов и сделать грубую оценку возможной стоимости проекта оснащения необходимого количества компьютеров, имеющих доступ к интернет, контентными фильтрами за счет разных источников – средств семей, государственных средств и пр., опираясь на стоимость существующих систем фильтрации разных производителей. Оценить финансовую перспективу решения этой задачи. При положительном результате – продолжить эту работу.

B) Упомянутая группа экспертов должна выполнить первоначальное формулирование задачи фильтрации и определить требования к фильтрам контента (возможно, выделив несколько категорий таких систем) в качестве подготовки к тестированию существующих систем фильтрации.

C) На основе этих задач и требований разработать и утвердить (с привлечением коммерческих тестирующих лабораторий) программу и методику сравнительного тестирования существующих систем фильтрации контента - Российских и зарубежных, персональных (для индивидуальных компьютеров) и групповых (для участков сети или для сетей организаций).

D) Провести тестирование систем фильтрации одновременно силами нескольких тестирующих лабораторий (обязательно с согласия правообладателей, ознакомив их с основными положениями методик испытаний). Результаты довести до правообладателей и предложить им представить комментарии и планы усовершенствования систем (по их желанию).

E) Произвести классификацию (ранжирование) испытанных систем по их назначению, эффективности, стоимости, особым условиям применения. Опубликовать полученные результаты, которые помогут организациям и частным лицам ориентироваться в выборе систем фильтрации при использовании самофинансирования.

F) Оценить требуемые финансовые ресурсы и возможность их привлечения для использования систем фильтрации, обладающих приемлемыми характеристиками, в государственных проектах.

 

G) При наличии финансовых ресурсов определить планы внедрения систем фильтрации, заказчиков и контролирующие органы в рамках государственных проектов, провести конкурс по закупке систем и внедрить их.

Следует учитывать при этом, что попытка внедрения систем фильтрации «сверху» на уровне интернет сервис-провайдеров не только существенно затронет вопросы реализации конституционных прав на доступ к информации, но и технически не реализуема без внесения сумятицы и неразберихи – именно в связи с тем, что любая система категоризации не защищена от ошибок.

При добровольном внедрении систем фильтрации контента на уровне отдельных организаций и домохозяйств соответствующий администратор, который может исправлять эти ошибки, всегда будет в зоне досягаемости, и подобные отклонения серьезного урона нанести не смогут.

Не надо регуляторов!

Еще одна точка возникновения проблем – требование сертификации систем фильтрации контента, которое может быть немедленно выдвинуто соответствующими регуляторами, как только задача фильтрации попадет в центр их внимания.

Такое требование без накопления первоначального опыта использования систем фильтрации, выполнения работ по исследованию существующих систем будет представлять собой чистое администрирование на основе умозаключений, не имеющих под собой каких-либо оснований, что нанесет очень большой вред работе по повышению безопасности интернета.

Этот вред выражается в следующем. По существующей практике любая сертификация информационных систем связана с очень высокими затратами поставщиков на прохождение этой сертификации. При этом, с учетом вышесказанного, эти затраты будут произведены совершенно впустую. Однако производители перенесут такие затраты на покупателей, что может вызвать резкое повышение стоимости систем фильтрации и сужение круга поставщиков.

В результате задаче защиты детей от вредоносного контента может быть нанесен огромный ущерб. Мнимые благие намерения по защите местных производителей неминуемо негативно скажутся на качестве решения задачи.

В то же время некоторые Российские поставщики были бы способны решить задачу контентной фильтрации на высоком уровне именно при наличии конкуренции со стороны производителей мирового уровня. 

Не допусти! Молодежная интернет-палата