Вопрос о том, как Gmail фильтрует спам, вызывает много энтузиазма, поскольку спам-фильтр Gmail считается одним из лучших алгоритмов фильтрации спама, позволяющих избежать попадания нежелательной почты в почтовый ящик.
Gmail - один из крупнейших почтовых сервисов. Его пользовательская база составляет более 1 миллиарда человек, и он является одним из старейших продуктов Google. Запущенный в апреле 2004 года, сервис за эти годы значительно улучшился. Я знаю, что трудно вспомнить время, когда вы подписались на Gmail или кто вас направил на него, но одной из функций, которая привлекла множество первоначальных пользователей, была потрясающая возможность фильтрации спама.
Во времена Yahoo и Rediff это было то, что выделяло новый продукт, важно отметить, что Gmail, который изначально был 20-процентным проектом Googler.
Спам-фильтр Gmail с годами только улучшился. И поскольку это одна из тех вещей, которые делают вашу жизнь немного проще, мы подробно рассмотрим, как Gmail фильтрует спам и алгоритм спама Gmail.
Для начала, на абстрактном уровне, вы можете рассматривать фильтрацию как поэтапный процесс. И за этим процессом стоит сложная технология. Чтобы решить, является ли электронное письмо спамом или нет, к каждому электронному письму, которое проходит через центры обработки данных Google, применяется несколько сотен правил. Правила способны обнаруживать общий спам, в то время как другие пограничные сообщения помещаются в карантин для последующего использования.
Каждое правило описывает некоторые атрибуты спама и имеет некоторое числовое значение, связанное с ним, в зависимости от вероятности того, что атрибут является спамом. Затем формируется уравнение на основе взвешенной значимости каждого атрибута. Результирующее значение - это оценка сообщения за спам. Затем эта оценка сравнивается с порогом чувствительности, установленным индивидуальным спам-фильтром. Таким образом, он классифицируется как спам или действительное электронное письмо.
Интересно, как работает спам-фильтр Gmail изнутри, хотя был только один пользователь, который пометил сообщение как спам, он, в свою очередь, обучил систему, что все такие сообщения должны быть помечены, так что теперь каждый пользователь Gmail сеть испытает разницу, поскольку флаг учит систему, как дополнительно классифицировать такие сообщения. Сила Машинное обучение!!
Теперь, когда мы знаем, как служба становится все лучше, давайте посмотрим, какие типы спам-фильтров распространены и когда Gmail применяет эти фильтры.
Распространенные типы спам-фильтров
- В том случае, Явная блокировка включен для пользователя, наиболее очевидный спам отклоняется или удаляется еще до того, как попадает в почтовый ящик.
- У каждого пользователя также есть Массовый фильтр электронной почты который устанавливает базовый уровень агрессивности для фильтрации остального спама. (Обычно это помещается в карантин)
- Каждый пользователь может при желании настроить четыре других Категория Фильтры для фильтрации определенного вида спама, содержащего определенный вид контента, в зависимости от желаемого уровня агрессивности. (Эти сообщения, как правило, предназначены для быстрого обогащения или содержат откровенно сексуальный контент)
- Удаление нулевого отправителя позволяет выбрать способ удаления всех сообщений без адреса отправителя конверта SMTP. Обычно это отчеты о недоставке.
- Проверка тега заголовка нулевого отправителя - это процесс, с помощью которого система проверяет каждое входящее сообщение на наличие адреса отправителя конверта SMTP и на наличие цифровой подписи безопасности каждого сообщения.
См. также: Полезные вещи, которые можно делать с помощью Google Now »
Когда применяются эти фильтры?
Эти фильтры постоянно проверяют каждое сообщение, которое попадает в ваш почтовый ящик. Фильтры категорий спама обычно применяются в конце, когда все остальные фильтры выполнены. Явная фильтрация спама происходит раньше всех остальных фильтров, но не блокирует сообщения от утвержденных отправителей. Ниже приведены ключевые сценарии, когда фильтрация явного спама дает сбой и другие механизмы вступают во владение:
- В случае, если утвержденный отправитель обходит фильтр спама, даже если сообщение содержит схожее со спамом содержимое.
- В случае, если сообщение с одобренным содержанием не проходит фильтр категорий.
- В случае, если блокировка вирусов перекрывает фильтрацию спама. Блокировка вирусов сканирует все сообщения, проходящие через фильтры, и, если сообщение состоит из вредоносного файла или ссылки, отменяет процесс фильтрации спама. Это означает, что если файл помещен в карантин как нежелательный, но при этом определен как зараженный, то он будет обработан в соответствии с настройкой вирусного фильтра.
Если все это все еще кажется вам слишком сложным для понимания, вот видео, которое команда Gmail в Google создала, чтобы помочь лучше понять фильтрацию спама.
Заключение - как Gmail фильтрует спам
Итак, здесь мы обсудили, как Gmail фильтрует спам. Надеюсь, теперь вы поняли, как работает спам-фильтр Gmail.
Если у вас есть какие-либо вопросы или предложения, мы открыты для обсуждения в поле для комментариев ниже.
Стив
Google всегда вводит новшества и улучшает все свои продукты и, следовательно, остается на вершине своей игры. Yahoo крупно облажалась.
Усман Сахид
Мне приходилось перечитывать это снова и снова. Я ненавижу спам, но каждый день просыпаюсь, чтобы встретить сотни таких сообщений в своей почте.
Спасибо, что поделились этими полезными советами по фильтрации мусорной почты.
Энди Ле
Каждый день мне приходится удалять сотни спам-писем. Это раздражает!
Махеш Дабаде
Привет, Энди, это может помочь - https://www.techlila.com/avoid-spam-emails/
Энди Ле
Спасибо. Я надеюсь, что смогу решить эту проблему.
Энди С
Столько спама! Из Америки и т.д! Если спросить у меня реквизиты банковского счета, у вас есть получатель? Этого никогда не случится! Так что эти и другие мошенничества не должны даже попасть в мой ящик для спама! Gmail должен сделать это немедленно!