Answers:
是的,GAN可以用于文本。但是,GAN的工作方式以及神经网络通常如何生成文本的结合存在一个问题:
这两种情况不能很好地结合使用,因为您不能通过离散的随机单位传播梯度。有两种主要的处理方法:REINFORCE算法和Gumbel-Softmax重新参数化(也称为具体分布)。考虑到已知REINFORCE具有高方差,因此您需要大量数据才能获得良好的梯度估计。
作为文本GAN的REINFORCE的示例,您可以查看SeqGAN文章。冈贝尔-SOFTMAX的例子,你可以查看这篇文章。
另一个完全不同的选择是不使用离散的随机单位作为生成器的输出(例如,在嵌入式空间中确定性地生成令牌),从而消除了通过它们反向传播的原始问题。
关于此主题还有更具体的研究:
训练有素的生成器能够产生具有一定语法和逻辑水平的句子。
肖学荣,“使用生成式对抗训练生成文本”
这个问题与此有关:https : //linguistics.stackexchange.com/questions/26448/how-to-translate-pelevins-creative-unit-idea-to-a-scientific-problem
是的,GAN现在也可以用于离散数据。这种直觉的第一个实例是Wasserstein GAN(WGAN)诞生的时候。伊恩·古德费洛(Ian Goodfellow)在NIPS 2016大会上谈到了针对这一问题的强化学习方法。此外,本文还探讨了GAN在离散数据方面的进步。