如何在Gmail主题中过滤带有动画表情符号的邮件?


27

我正在浏览垃圾邮件文件夹(这很少这样做,因为Gmail很少有误报),并且发现了一些有趣的东西:

垃圾邮件样本清单

大约一半以上的消息在主题中至少包含一个动画表情符号。

我的朋友都不会使用这种废话。与我有业务往来的有效公司也不会这样做。

如何创建过滤器,以自动删除主题中带有动画表情符号的邮件?

使用下面的jamesmstone线索,我尝试了subject:=?UTF-8?subject:"=?UTF-8?"和其他几个排列进行搜索,但没有一个起作用。

这是来自这些蒸堆​​之一的标头的样本集:

Delivered-To: [redacted]@gmail.com
Received: by 10.107.28.200 with SMTP id c191csp1104992ioc;
        Sun, 24 Jan 2016 19:07:16 -0800 (PST)
X-Received: by 10.107.38.5 with SMTP id m5mr15068933iom.15.1453691236564;
        Sun, 24 Jan 2016 19:07:16 -0800 (PST)
Return-Path: <VivaLoan@mythirdxyz.xyz>
Received: from mythirdxyz.xyz ([2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11])
        by mx.google.com with ESMTP id o10si8722554igw.41.2016.01.24.19.07.15
        for <[redacted]@gmail.com>;
        Sun, 24 Jan 2016 19:07:16 -0800 (PST)
Received-SPF: pass (google.com: domain of VivaLoan@mythirdxyz.xyz designates 2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11 as permitted sender) client-ip=2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11;
Authentication-Results: mx.google.com;
       spf=pass (google.com: domain of VivaLoan@mythirdxyz.xyz designates 2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11 as permitted sender) smtp.mailfrom=VivaLoan@mythirdxyz.xyz;
       dkim=pass header.i=@mythirdxyz.xyz;
       dmarc=pass (p=REJECT dis=NONE) header.from=mythirdxyz.xyz
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=mythirdxyz.xyz; 
 i=@mythirdxyz.xyz; q=dns/txt; s=default; t=1453691229; 
 bh=GuM9JCP4yh7WfVbRBortR7UAr6DAtlgy0oTCna0iWQk=; h=MIME-Version : 
 Content-Type : Content-Transfer-Encoding : To : From : Subject : Date : 
 Message-ID : From : Subject : Date; 
 b=e/zS14UB4o5MhYlfbpsy0h2G/oZyoC5H3ouyhNh13zcSHSNXzI6uvJpIy9a+za2ng26Xe2
 NfAI7nenAMCdHJSGF4yfmtTi3+XrR2MqQPHQ1fzTXGhRy/ktCj4tEqt7DhSxnRCqkYFUNaLA
 wh3FMLr6IxPi2Z7xUXm3JBffhDcSU=
MIME-Version: 1.0
Content-Type: text/html; charset="utf-8"
Content-Transfer-Encoding: base64
To: [redacted]@gmail.com
From: "APPROVAL DEPARTMENT" <VivaLoan@mythirdxyz.xyz>
Subject: =?utf-8?q?=F3=BE=93=A0_Personal_loan_as_soon_as_tomorrow_=F3=BE=93=A0?=
Date: Sun, 24 Jan 2016 19:07:09 -0800
Message-ID: <A112ED51-1674-4902-BF73-F2EBCBA42CAF@mythirdxyz.xyz>

3
我想知道他们是否goomoji...
jamesmstone '16

@jamesmstone:我希望他们是。
ale

Answers:


9

简短答案

无需使用依赖于Gmail搜索功能的Gmail过滤器来搜索原始邮件中的编码表情符号,而是使用Google Apps脚本的GmailMessage :: getRawContent()方法创建脚本来处理邮件。

相关问题

以下是指向本网站中类似问题的答案的链接,包括使用引用方法的脚本。


2
值得一提的是,脚本无法完全删除邮件-它最多可以将邮件移动到垃圾箱或垃圾邮件文件夹中。而且,如果此类邮件已经成为垃圾邮件,则该脚本将无济于事。

@Minestrone:实际上,可以使用脚本完全删除一条消息。它应该使用Gmail API。请参阅developers.google.com/gmail/api/v1/reference/users/messages/…。要在Google Apps脚本中使用Gmail API,请参阅developers.google.com/apps-script/guides/services/advanced
鲁本

1
我对真正删除邮件的兴趣不大,因为我正在寻找一种过滤邮件的方法。我可能只是想给他们贴上标签。
ale

@AlE。我以为是这样,所以我没有在答案的正文中提到GMAIL API的使用。另一方面,幸运的是,我没有收到主题中带有表情符号的电子邮件。
鲁本

4

为此,我已经创建了一个Google Apps脚本。

它在Github上:https : //github.com/spamzero/spamzero

它使您可以创建可与垃圾邮件文件夹匹配的各种高级规则,因此绝对是垃圾邮件将被自动清除。


1
如果您包含脚本的简短说明,突出说明它将如何帮助处理主题中带有动画表情符号的消息,则答案会更好。
鲁文

4
我同意@Ru​​bén,越多的信息越好。由于它可以使读者审查答案的可行性,而不必经历太多的麻烦。
Michelfrancis Bustillos

感谢您的脚本!有时,最有用的解决方案是减少诸如动画垃圾邮件之类的日常烦恼的解决方案。我建议为Google Apps脚本快速入门将此链接添加到Github自述文件,以便对使用脚本没有任何经验的用户知道如何启用Gmail API和查看日志。

1

这并不是您所要的(过滤表情符号本身,而不是过滤带有表情符号的消息),但是您可能会发现其中一些内容对于构建更好的消息过滤器很有用。

现在有一个开源的Greasemonkey / Tampermonkey / Violentmonkey用户脚本可以消除那些令人讨厌的视觉蟑螂(只是字符,而不是消息本身):

Gmail主题行表情符号蟑螂汽车旅馆

查看该脚本源代码,您会发现在滥用营销者的电子邮件(可悲的是,如今包括eBay和Amazon)中可以找到两种通用的表情符号蟑螂:

  • 基于HTML图像的蟑螂(包括可怕的动画蟑螂)又称goomoji

  • Unicode蟑螂:仍有许多表情符号(以及其他生成图像的Unicode序列生成图片),垃圾邮件制造者和其他以前的营销人员已开始在电子邮件主题行中使用它们,并且gmail无法转换为HTML图像。在某些浏览器中,它们显示为粗体和彩色,几乎与动画一样糟糕。浏览器可以选择对它们进行动画处理,但是我不知道是否可以这样做。这些Unicode序列在浏览器中显示为Unicode文本,因此确切的外观(是否为彩色,是否为动画,...)取决于浏览器所使用的文本呈现系统。给定Unicode表情符号的外观还取决于任何Unicode变体选择器和表情符号修饰符在Unicode代码点序列中出现在它附近的字符。与基于图像的表情符号垃圾邮件不同,这些序列可以作为Unicode文本从浏览器复制粘贴到其他应用程序中。

对于后一种类型,用户脚本包括一个正则表达式,旨在捕获可能被营销人员滥用的Unicode序列。regex在ES6 Javascript中看起来像这样(用户脚本使用令人惊叹的ES6 Regex Transpiler将其转换为广泛支持的ES6之前的regex ):

var re = /(\p{Emoji_Modifier_Base}\p{Emoji_Modifier}?|\p{Emoji_Presentation}|\p{Emoji}\uFE0F|[\u{2100}-\u{2BFF}\u{E000}-\u{F8FF}\u{1D000}-\u{1F5FF}\u{1F650}-\u{1FA6F}\u{F0000}-\u{FFFFF}\u{100000}-\u{10FFFF}])\s*/gu

// which includes the Unicode Emoji pattern from
//   https://github.com/tc39/proposal-regexp-unicode-property-escapes
// plus also these blocks frequently used for spammy emojis
// (see https://en.wikipedia.org/wiki/Unicode_block ):
//   U+2100..U+2BFF     Arrows, Dingbats, Box Drawing, ...
//   U+E000..U+F8FF     Private Use Area (gmail generates them for some emoji)
//   U+1D000..U+1F5FF   Musical Symbols, Playing Cards (sigh), Pictographs, ...
//   U+1F650..U+1FA6F   Ornamental Dingbats, Transport and Map symbols, ...
//   U+F0000..U+FFFFF   Supplementary Private Use Area-A
//   U+100000..U+10FFFF Supplementary Private Use Area-B
// plus any space AFTER the discovered emoji spam
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.