垃圾邮件发送的商业模型是大规模的发出同样的邮件,通常几天或者几周内甚至几个月内发送数以百万计的邮件,这些邮件虽然可能在细微处有所变化,但是通过特定的算法,却可以将这些邮件的共同特征提取出来。为此,博威特公司设置了大量“蜜罐”,或者说诱骗邮件地址,是用于收集大量的垃圾邮件。再依靠特定的算法,将这些邮件的共同特征――邮件指纹提取出来,邮件指纹库。梭子鱼收到邮件后,发送相关的信息到远程的邮件指纹数据库中进行核对,从而迅速的确认这封邮件是否是垃圾。
这种指纹分析的方法和当前反病毒体系中病毒特征码的原理是一样的。在面对一些最新出现的或罕见的垃圾邮件时,它没有多大效用。但是对于哪些大量发送的相同的垃圾邮件,这种方法却具有最高的效率。而且这种方法几乎不会产生误判。梭子鱼(Barracuda)每天更新数百个邮件指纹信息。
意图分析技术
垃圾邮件技术如今变得愈加复杂,许多垃圾邮件变得与正常的邮件几乎一样,在这些邮件中含有URL链接,这个链接往往指向一些不健康的网站,或某个商品促销的网站。梭子鱼为此创建了意图分析技术,构建了全球最大、含盖了全球十几个语种的垃圾邮件URLS地址数据库。它检查邮件中的URL链接,确定邮件是否为垃圾邮件。

该数据库中的不良网址数量已经达到了135596个,并且每天增加或更新200余个。
贝叶斯过滤技术
贝叶斯分析:命名于著名数学家托马斯?贝叶斯(1702-1761),他发展了一个数学领域全新的可能性推论理论。贝叶斯分析采用过去事件的知识预测未来事件。
应用到反垃圾邮件领域,贝叶斯过滤与以前收到的垃圾邮件与合法邮件的中相同词语与短语出现的频率对比此邮件中有问题的词语与短语的来确定垃圾邮件的可能性。他能自动适应垃圾邮件变化。是一种动态的智能过滤技术。
贝叶斯过滤器是非常强大的,也是阻断垃圾邮件最为精确的技术。大多数报告显示,当贝叶斯过滤器被“有效培训”以后,过滤器过滤垃圾邮件的准确率达到99%。为了培训贝叶斯过滤器,需要该收件人大约200封有效邮件及200封垃圾邮件。在目标收件人中有越多的历史数据库,过滤器越准确。参见Paul Graham先生著作的“优化贝叶斯过滤器” http://www.paulgraham.com/better.html。
梭子鱼的贝叶斯过滤技术领先于其它产品,它采用了全新的分词技术,同时支持单字节和双字节语种,需要学习的样本数量更少。贝叶斯能保正系统始终具有较高的过滤率,其它的过滤技术是一种静态的技术,依赖于规则库或特征库的更新。而贝叶斯是智能的技术,他能自动学习新的垃圾邮件,调整自己的字词频度表,使得系统始终维持较高的过滤水准。
采用了分用户贝叶斯后,使得不同邮件用户个性化的需求得以真正的实现。一般反垃圾邮件分用户个性化设置仅限于个人黑白名单。无法满足不同用户对邮件的不同偏好,然而用户通过调整培训自己的分用户贝叶斯数据库,就可以简单的实现这一功能。
基于规则的评分系统
垃圾邮件制造者清楚反垃圾邮件的原理,因此也越来越狡猾,其中常用的一种办法经常将一些单词拼错,“Viagra”可能被有意地拼写为“V1agra”或者任何一种可能的变体,这样普通的词语过滤器就无法识别。
基于规则的评分系统也被称为人工智能(AI)系统,博威特网络基于海量邮件的分析,定义了近6000条垃圾邮件规则,每一条规则对应一定的评分,一封邮件与规则库进行比较,每符合一条规则加上该规则评分,获得的分数越高,该邮件是垃圾邮件的可能性就越高。如果一封邮件超过一定得分门槛(阈值),该邮件将被分类为垃圾邮件。
在这些规则中,可以用来识别变化的词语或短语,例如垃圾邮件引擎侦测到变化型文字,垃圾邮件引擎会自动回复到原先字词,例如V.I.A.G.R.A回复为VIAGRA。
这些规则不仅包括语义分析,还包括对垃圾邮件发送工具的检测、对邮件中含有图片形态和比重的检测,对于HTML格式的各种特征的规则等。通过对一封邮件所有相关的信息都进行相关的智能分析,最终能够准确的判定一封邮件。
由于垃圾邮件发送人及制造垃圾邮件的程序不是静态的,因此博威特持续追踪互联网上的垃圾邮件的变化,及时更新规则库。采用这项技术,可以清除90%的收到邮件中的垃圾邮件。梭子鱼还专门定义了中文简体、繁体、日语等规则分库,以适应双字节邮件的过滤。
| Digital Consultants Computerland |
 |
Digital Consultants公司的总裁兼CEO Gregory Sirakides先生说“这个产品易于安装,易学易用,几乎不用配置,很低的维护成本,优秀的价格性能比,博威特垃圾邮件防火墙非常适合我们的客户。” |
梭子鱼(Barracuda)还提供了丰富强大的自定义过滤策略:用户可以对邮件信头、主题、信体设立阻断、隔离、标记、关键字白名单等不同类型的关键字。再所有检查都进行完毕后,根据用户设立的评分策略,对邮件进行允许、标记、隔离、阻断等操作。梭子鱼(Barracuda)支持完全的正则表达式,为了方便用户使用,梭子鱼公司提供了不同语种的关键字模版。
|