表情符号的情绪数据

12

为了进行实验，我们希望将嵌入许多推文中的Emoji用作基本事实/训练数据，以便进行简单的定量分析。推文通常过于结构化，NLP无法正常工作。

无论如何，Unicode 6.0中有722个表情符号，Unicode 7.0中可能还会添加250个表情符号。

是否有一个数据库（例如SentiWordNet）包含针对它们的情感注释？

（请注意，SentiWordNet的确也允许模棱两可的含义。考虑一下例如funny，这不仅是肯定的：“这听起来很有趣”可能不是肯定的…… ;-)例如，同样适用。但是我不认为这更难表情符号比普通单词更适合...）

另外，如果您有使用它们进行情感分析的经验，我很想听听。

machine-learning classification parsing

— 埃里希·舒伯特（Erich Schubert）
source

不要相信当前存在这样的东西，但是如果您为此目的将它们放在一起，它会喜欢的！

— 印度2014年

埃里希·舒伯特（Erich Schubert），我正在寻找完全一样的东西！您是否有机会为其找到有用的资源？

— saeed mehrabi

Answers:

4

不能手动标记它们的总数972个表情符号确实不是那么大，但是我怀疑它们是否可以作为一个很好的基础。诸如Twitter之类的消息充满了讽刺，讽刺和其他棘手的环境，在这些环境中，情感符号（例如表情符号或表情符号）的含义不同于正常的解释。例如，某人可能会写“ xxx被骗了他们的客户，现在他们被骗了自己！哈哈哈！：D”。这绝对是负面评论，但作者很高兴看到xxx公司遇到麻烦，因此增加了正面表情。这些案件不是那么频繁，但绝对不适合地面事实。

更常见的方法是使用图释作为收集实际数据集的种子。例如，在本文中，作者使用表情符号和情感哈希标签来获取可用于进一步分类的单词词典。

— 朋友
source

1

其实我不同意。既然作者喜欢他们遇到麻烦，那是一种积极的情绪。这是对公司的负面评论，但作者对此是正面的看法。在这种简单的情况下（我并不是说这是完整的目标），预测用户将添加到其帖子中的表情符号听起来对我来说是一项合理的任务。实际上，您可以构造很多表情符号是必不可少的情况。考虑“ Got f_cked :-)”而不是“ Got f_cked。:-(”

— Erich Schubert

如果您尝试估计人的情感而不是人对主题的态度，那么是的，此示例不起作用。但是还有很多其他的。嘲讽很常见。考虑一下句子“哦，是的，您是真正的'主人';）”。人类可以捕捉负面情绪，但是正面表情会指向正面情绪。但是我还不是真的：您是要从推文中提取主观信息还是只是预测可能的表情符号？尽管它们听起来很相似，但第二项任务实际上并不是情感分析。至少不直接。

— ffriend

“眨眼”笑脸通常不被认为是“阳性”，而是“讽刺”……这就是为什么像SentiWordNet这样的优质词典才有意义的原因。如果您在SentiWordNet中查找可笑的内容，则还具有多个含义！sentiwordnet.isti.cnr.it/search.php?q=funny（所以这是不平凡的手动标注它们，因为它不是那么简单，正/负;但你应该做平常者间，协议验证等）

— Erich Schubert 2014年

现在我明白了你的想法。但是我真的不认为它会起作用，只是因为（大多数）表情符号对我来说听起来并不像是一个好的预测指标，而且您明确地不想使用其他功能。无论如何，这只是基于我的经验的观点，只有数据才能给出真实的答案。祝好运！

— ffriend

谁说我不想使用其他功能？但是对于这些，我看过数据库...

— Erich Schubert 2014年

0

我发现这个Github存储库很有用（一个好的开始）：https : //github.com/wooorm/emoji-emotion 表情符号列表，其价数的定级值为负5（负）到5（正）之间的整数。

请参阅受支持的unicode表情符号列表：https : //github.com/wooorm/emoji-emotion/blob/master/Support.md

请注意，某些表情符号由于可以用于正面和负面情绪，因此可以接受令人困惑的极性，例如sticked_out_tongue_closed_eyes（0）。

— 塔尔·魏斯
source

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.

Licensed under cc by-sa 3.0 with attribution required.