你在这里

垃圾模块

原文链接:http://drupal.org/node/498092

 

这是垃圾邮件模块的文档页面文件正在收集问题#455066:用法和API文档需要放在这里时,一节完成。

简介

目前垃圾邮件模块处理垃圾评论,节点和用户。垃圾邮件模块为Drupal其他垃圾邮件模块不同,作为一个独立的插件,不依赖于第三方为处理垃圾邮件(虽然一个可选的过滤器模块,通过垃圾API创建的任何其他过滤器模块以及)。你得到控制会发生什么,以及它是如何发生的。

安装

垃圾模块的安装很简单:

  1. 下载最新版本的垃圾,从项目的页面
  2. 提取它,并移到垃圾邮件文件夹目录的<drupal /网站/ /模块/或<drupal目录的/网站/默认/模块/
  3. 在你的网站,去管理»网站建设»模块,使垃圾邮件模块,和所有要使用的过滤器模块。
  4. 调整中的设置管理»网站配置»垃圾,你就大功告成了

使用垃圾邮件模块

新的内容可以通过启用垃圾邮件过滤器。这些过滤器分配一个介于0和99,在更高的分数意味着内容是更多的垃圾邮件得分。

得分相等或更大的垃圾邮件的阈值,然后标记为垃圾邮件,并根据您的配置,是未发表的,发送垃圾邮件队列,或删除。

标记为垃圾邮件的内容(节点,注释,用户)上显示的管理»内容管理»垃圾页面从这里,你可以选择“标记为垃圾邮件”,将设置该项目的得分为零(和发布它,如果它是未发表的)。您还可以选择发布或取消发布的垃圾邮件。

反馈

“ 反馈 “选项卡允许您可以看到您的用户评论以及他们的论据,为什么它是不是垃圾。被错误地标记为垃圾邮件(假阳性),当用户的意见,他们可以提醒你在此,通过反馈表,您可以采取适当的行动,例如:调整你的过滤器。您还可以设置为“不是垃圾”,行政屏幕,这样可以节省时间反馈的意见。

评论

垃圾评论,也有一个额外的选项卡管理的内容,上海管理»评论,被称为垃圾。这个标签允许你删除的意见和直接查看它们。

进球

内容已被过滤前开始与得分为0。一旦它通过垃圾邮件过滤器时,它就会被分配一个介于1和99分,1表示最有可能不是垃圾邮件,和99是指最有可能的垃圾邮件。数量实际上是一个概率,所以1是1%的垃圾邮件的机会,99是一个99%的垃圾邮件的机会。

每个过滤器的内容通过,被分配一个分数,乘以滤波器的增益 -过滤器,所以如果有一个250的增益,内容是一个介于0和250分。如果一个过滤器给出了0分,过滤器将被忽略。所有其他的分数相加,和应用的过滤器的所有收益加在一起,最后的比分是表示过滤得分总和/过滤收益的总和

对于那些谁可以读取LaTeX的:

IsSpam_ {概率} = \压裂{\ sum_ {F = 1} ^ N {PERCENT \子弹增益}} {\ sum_ {F = 1} ^ N {获得}}

最后的比分,然后对垃圾邮件的阈值检查,并标记为垃圾邮件(大于或等于)或邮件(小)。

标记为垃圾邮件/非垃圾邮件

在每一个类型的垃圾邮件被检查的内容项的底部,有一个链接,说要么标记为垃圾邮件不是垃圾邮件标记为根据,对已标记的内容如何。的链接,让您迅速纠正,不是垃圾邮件(或“火腿”误报),或垃圾邮件的内容标记为垃圾邮件过滤器的工作。贝叶斯过滤器,特别是学习,更新内容项的得分,你手动纠正,从而降低了不正确的评估以后。

组态

垃圾邮件模块的配置发生在管理»网站配置»垃圾在这里你可以设定哪些内容类型发送尽管垃圾邮件过滤器,以及它们是如何处理。

每个过滤器还可以提供一些详细的设置。

内容进行过滤

默认情况下,被过滤的意见。如果您有您的网站上公开发布,你可能要筛选那些内容类型。请记住,垃圾邮件处理略有增加服务器上的负载(在速度和数据库空间),所以没有过滤的内容,只有受信任的用户可以创建点。

您还可以过滤用户,但通常这是超过正常含量的问题,因为用户不必大量的文本匹配。使用用户配置文件可能会增加 - 也就是说,如果你有一个“关于我”框为每个用户,那些用伟哥可能是垃圾邮件。

行动

在这里,您决定内容标记为垃圾邮件的处理,以及消息发送给用户,如果他们的内容被标记为垃圾邮件。它肯定建议静静地防止垃圾邮件被张贴,直到你确信你的过滤器设置,运作良好。

高级配置

垃圾门槛:垃圾邮件的门槛决定前标记为垃圾邮件的内容,需要什么成绩。较高的得分,减少垃圾邮件会被逮住,得分越低,你的风险更多的误报。一个好的经验法则是可能离开它相当高(80-85)开始,然后逐步把它作为Bayesian过滤器开始学习什么是,什么是不适合你的网站。

日志级别:决定什么记录的信息量。

  • 禁用不记录任何东西。
  • 重要的(默认)提供有关的事情,不工作(错误)信息。
  • 详细是非常有用的工作,什么样的收益水平,你的过滤器使用(我建议把调试级别和观看的意见,经过只是为了看看它是如何工作的。)
  • 调试,主要用于开发,它肯定会产生很多比你关心的日志。

丢弃的垃圾邮件日志,年纪比:保持多久有关垃圾日志。

过滤器

过滤器概述

过滤器概述页面上,您会看到目前可用的过滤器,按重量排序。

过滤器的重量

Drupal中的其他地方一样,较低的重量(更负),表示过滤器浮动更高 - 这意味着,他们先前得到应用。

滤波器的增益

一个过滤器的增益变量决定过滤器将最后的得分上有多少影响过滤器增益0没有任何效果(即它具有几乎相同的效果,禁用该过滤器在模块管理屏幕)。

具有较高的增益比其它过滤器的过滤器,有更多的最终得分影响。这可能是有用的,如果你找到了一个过滤器比别人更好的工作在您的网站上。

例如,当你开始训练Bayesian过滤器,你应该设置它的收益非常低的过滤器,将犯了很多错误。由于贝叶斯过滤器变得更加训练有素,从而更准确,你可以在过滤器上增加增益,决定给予其更多的整体垃圾邮件评分的影响。

贝叶斯过滤器

贝叶斯过滤器是在内容的统计分析,学习垃圾邮件和非垃圾邮件,它认为,以确定新的内容是或不是垃圾邮件的可能性。过滤出一无所知开始,到每一个错误的时间进行培训。这是通过标记为垃圾邮件的垃圾邮件内容在您的网站上,当你看到它。将记住每个字的垃圾邮件内容,并分配了一个垃圾邮件的概率。更多的时候一个字出现在垃圾邮件的内容,未来,用同一个词的内容也是垃圾邮件的概率更高。由于大部分垃圾评论包含链接到垃圾邮件发送者的网站(即以出售百忧解),贝叶斯过滤器提供了一个特殊的选项,快速学习和阻止包含已知的垃圾邮件网站的链接的内容。

自定义过滤器

自定义过滤器,黑名单,白名单或灰名单的基础上的单词,短语和正则表达式匹配

例如,可以定义自定义过滤器始终标记为垃圾邮件的内容,如果它含有“伟哥”或“[URL ='字。

同样,自定义过滤器可以被定义,如果它匹配的情况下不敏感的正则表达式/ /我增加内容是垃圾邮件的概率。

URL过滤器

便携机过滤器是用来限制总数的意见及其他内容允许的URL,以及相同的URL,可以在相同的内容重复的次数。这些限制可以是不同意见和其他类型的内容。例如,如果模块被设置为只允许完全相同的URL出现在评论的两倍,如果在同样的评论http://kerneltrap.org/~~V节目三次或三次以上的评论将被视为垃圾邮件。

SURBL过滤器

SURBL过滤器是目前国内唯一的过滤器,使用第三方服务。SURBL过滤器内容项目的身体检查,通常发现在垃圾邮件的URL。

看到http://en.wikipedia.org/wiki/SURBL 或http://www.surbl.org详细信息。

节点年龄滤波器

节点的年龄过滤器,允许你指定的年龄节点,在几周内(从1到24),您认为旧的内容真的老了内容该过滤器,然后分配一个概率(60%至99%)等节点的意见是垃圾。

重复过滤

重复的过滤器可让您决定多少次相同的内容可以发布到网站 - 垃圾邮件发送者往往简单的剪切和粘贴的内容,所以这可能是一个好办法赶上他们。如果你选择2为阈值,那么每重复后的第一个将标记为垃圾邮件。