我在考虑以下问题:我想找到一个正则表达式,该表达式与一组特定的字符串(例如有效的电子邮件地址)匹配,而与其他字符串(无效的电子邮件地址)不匹配。
假设正则表达式是指定义明确的有限状态机,我对确切的术语并不熟悉,但让我们就一类允许的表达式达成一致。
我不想给它手工制作表达式,而是给它一些积极的例子和消极的例子。
然后,它应该提供一个与+匹配的表达式,拒绝-表达式,并且在某种明确定义的意义上是最小的(自动机中的状态数?)。
我的问题是:
- 是否考虑过这个问题,如何以更具体的方式定义它并有效解决?我们可以在多项式时间内解决吗?NP是否完整,我们可以以某种方式近似吗?它适用于什么类型的表达式?我希望能有任何指向讨论该主题的教科书,文章或类似文章的指针。
- 这与Kolmogorov的复杂性有什么关系吗?
- 这与学习有任何关系吗?如果正则表达式与我的示例相符,并且由于其极小,我们能否在尚未看到的示例中说出它的泛化能力?哪种最小标准更适合于此?哪一个效率更高?这和机器学习有关系吗?同样,任何指针都会有所帮助...
抱歉给您带来麻烦的问题……向我指出正确的方向以解决这个问题。谢谢 !