Разработана технология определения авторства анонимных электронных писем

Профессор Бенджамин Фанг

На свете существует много причин для отправки анонимных электронных писем - признание в любви к кому-то, анонимное обращение за помощью или советом, или просто шутка над другом. Но, так же существует и масса других, более злонамеренных, причин - рассылка вирусов, спама, порнографии и другие. В то время, как в некоторых случаях возможно определить по IP-адресу местоположение компьютера, с которого производилась рассылка, до сих пор было невозможно точно определить автора электронного сообщения таким образом, что бы это могло служить доказательством в расследовании и суде.

В попытке препятствовать увеличению числа киберпреступлений, использующих анонимные электронные письма, Бенджамин Фанг (Benjamin Fung), профессор из университете Конкордии, Квебек, и его коллеги разработали новую методику определения авторства любого текста, основанную на использовании распознавания набора ключевых фраз и оборотов речи. Этот подход полагается на уникальность некоторых особенностей речи и письма, которые содержатся в электронных письмах подозреваемого.

Но, вместо того, что бы выискивать в тексте уникальные фразы и сочетания, новая технология идет от обратного. Из исходного текста электронного письма исключаются общераспространенные и общеупотребляемые сочетания, хранящиеся в базе данных Enron Email Dataset, которая была составлена по результатам анализа более 200 тысяч реальных электронных писем 158 сотрудников компании Enron Corporation. Оставшаяся после исключения из текста сочетаний часть и является тем самым "электронным отпечатком пальца", уникальным для каждого человека.

"Используя данный метод мы можем не только с большой вероятностью определить кто именно является автором текста, но и определить пол, национальность и уровень образованности автора" - рассказал профессор Бенджамин Фанг. В проведенных тестах использовались 100 электронных писем, написанные десятью разными людьми, по десять на человека. С помощью разработанной технологии в каждом случае удалось идентифицировать авторство с точностью 80-90 процентов.

Советуем к прочтению:

Планшет Explay sQuad 7.81 с 4-ядерным процессором

LG анонсировала 21,5-дюймовый моноблок на базе Chrome OS

О ноутбуках временно забыли?

Абонентское обслуживание видеонаблюдения