识别与段落中日期有关的事件


13

是否存在一种算法方法来确定段落中给定的日期与段落中的特定事件(短语)相关?

示例,请考虑以下段落:

1970年6月,这位伟大的领袖宣誓就职。但是直到1972年5月国务卿去世后,他才接管了国家的the绳。在1980年中期之前,他一直得到民众的支持,但此后,他的影响力开始下降。

是否有一种算法(确定性或随机性)#可以生成2元组(日期,事件),而该段落暗示该事件发生在该日期上?在上述情况下:

  • (1970年6月,伟大的领袖宣誓)
  • (1972年5月,接任the绳)

    甚至更好

  • (1972年5月,伟大的领导人接管了ins绳)
  • (1980年,影响力下降)

#后来加法


2
这个问题似乎包含三个阶段:1)提取日期,2)提取事件和3)关联两个数据集。1)当然是可行的,我可以想象3)有不错的启发法,但是您期望如何解决2)?
拉斐尔

1
@Raphael Nice改写我的问题!
check123 2012年

那么,您对2的一些信息),例如有限的一组有趣的活动(即字)?您是否要提取所有带日期的名词/动词对?
拉斐尔

您是否也要提取时间范围?在您的示例中,考虑(<= May 1972, death of the Minister of State)(<= Mid-1980, [the great leader] enjoyed popular support)
拉斐尔

@Raphael对不起(很晚)回复。关于2)否。我正在尝试一种通用方法。
check123 2012年

Answers:


4

通常,在文本中标识日期和其他时间标记的问题称为提取时间参考的问题。搜索链接将带您到与此相关的论文。


不知道问题有名字。将对此进行更多的查找,看看我是否可以找到有价值的东西。:)
check123 2012年

2

由于您要求使用算法方法,因此我将像算法一样固执。我很抱歉这样处理这个问题,但是由于它似乎并不复杂,因此我将综合可能的方法。

问题:您能给我一个日期和特定事件的算法定义吗?

如果可以:由于您的定义是算法定义的,那么这可能是某种形式的语法,而您的问题将是调整该语法以适应您需要考虑的每种情况。(如果您能给我一个不是正式语法的确切定义,我很感兴趣)

如果不能这样做,那么至少可以举一些例子。那好吧 最好的(也是我唯一想到的)方法是机器学习算法,您必须对其进行训练才能识别日期和事件。(使用人工注释的句子集)但是,与一些可能会完成这项工作的大型手工正则表达式相比,这是相当过高的。如果您真的想要这样做,我认为最有效的方法是将这种正则表达式作为学习算法的参数,但是最好问一下机器学习专家。

祝你好运,谈论它(在两种情况下)要容易得多。


1
就是说,我认为将日期和事件组合在一起肯定会需要一些随机模型。
拉斐尔

我可以使用正则表达式捕获的大多数格式的日期。通过一些编程逻辑,我可以提取日期附近的句子。然后的问题是,我需要一个模型或概率分布,当特定的句子模式出现时,例如:猫在8月25日吃了鼠标。[<article> <noun> <verb> <article> <noun> <preposition> <date>],然后出现该模式的(子)集,将鼠标(在本例中为猫)与该日期相关联y(8月25日),概率为z。
check123 2012年

@jmad如果您不介意,可以调整帖子的格式吗?对于非引号(或自引号?)使用引号样式会造成混淆。
乌里2012年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.