从'69的数据中进行一般学习的最新状态


16

我试图了解1969年著名的Minsky和Papert所著的“ Perceptrons”的上下文,这对神经网络至关重要。

据我所知,除感知器外,没有其他通用的有监督学习算法:决策树仅在70年代后期才开始真正变得有用,随机森林和SVM都是90年代。似乎已经知道折刀法了,但k-cross验证(70s)或bootstrap(1979?)还不知道。

维基百科说,尽管上世纪40年代首次尝试描述混合理论,但内曼-皮尔森(Neyman-Pearson)和费舍尔(Fisher)的经典统计框架仍存在分歧。

因此,我的问题是:解决根据数据进行预测的一般问题的最新方法是什么?


6
逻辑回归在今天的70年代末开始被使用,参见Cramer,JS(2002)。p,“逻辑回归的起源”。12,papers.tinbergen.nl/02119.pdf
蒂姆

线性回归可能是一种“通用监督学习算法”,起源于1800年代初。概率回归,至少以某种形式,显然起源于1930年代。您在这里特别用“泛型”指什么吗?
Dougal

@Dougal:只是“发现适用于不同领域的大量问题”,而不是“旨在解决特定问题”。我试图了解60年代统计学家或AI科学家在遇到最简单的方法(例如,我想是线性回归?)无法解决的新的未知问题而又没有先验工作时将使用什么方法?因此寻找更复杂的工具是合理的。例如,随机森林现在是这样的算法之一:它们在来自各个领域的大量数据集上都可以很好地工作。
liori 2016年

当然可以。值得注意的是,概率回归实际上可能是比原始感知器更好的通用分类模型。我不知道当时是否使用了它。感知器当时被认为是不同的,因为它们与类似SGD的优化算法捆绑在一起,这可能使它们在当时的计算机上比Probit更具可伸缩性,尽管今天我们当然意识到这些选择是独立的。
Dougal

1
对于这里仍然对该主题感兴趣的任何人:我从科学社会学领域中对60年代感知器之争的话题进行了有趣的研究:Olazaran,“感知器之争的官方历史”。文本没有回答这里提出的问题,但是提供了明斯基和佩佩特这本书的社会学背景-在我看来,这本书比实际的科学状况更为重要。
liori

Answers:


12

我对此感到很好奇,所以我做了一些挖掘。令我惊讶的是,许多常见分类算法的可识别版本在1969年左右就已经可用。链接和引用如下。

值得注意的是,人工智能研究并不总是那么关注分类。对计划和符号推理的兴趣已浓厚,这已不再流行,而且很难找到标注的数据。也许并不是所有这些文章都可以广泛获得:例如,原始SVM的工作大部分以俄语发表。因此,这可能高估了普通科学家在1969年对分类的了解程度。


判别分析

Fisher 在1936年的《优生学年鉴》中的一篇文章中描述了一种寻找线性函数的程序,该函数根据花瓣和萼片的大小来区分三种鸢尾花。该论文提到,费舍尔已经与E. S Martin和Karl Pearson(jstor)合作,并在单独的颅骨测量项目中应用了类似的技术来预测在埃及挖掘的人类下颌骨(颚骨)的性别。和米尔德雷德·巴纳德小姐(我无法追踪)。

逻辑回归

自19世纪以来,逻辑功能本身就已广为人知,但主要是作为人口增长或生化反应等饱和过程的模型。Tim链接到上面的JS Cramer的文章,这是其早期的美好历史。但是,到1969年,考克斯(Cox)出版了第一版《二进制数据分析》我找不到原始版本,但是较新的版本包含一整章有关使用逻辑回归进行分类的章节。例如:

ÿ=01个Xÿÿ

ķ

ķķ

神经网络

布拉特发表的一份技术报告,在1957年描述的感知,并跟随它了一本书神经动力学原理在反向传播的1962年版本的连续从60年代初期已经出现,包括工作凯利,布赖森和布赖森和何(修订中1975年,但最初是1969年,但是直到后来才应用到神经网络,并且训练非常深的网络的方法也要更新得多,这本有关深度学习的学术文章提供了更多信息。

统计方法

我怀疑使用贝叶斯规则进行分类已被发现并重新发现了很多次-这是规则本身的自然结果。信号检测理论开发了一种定量框架,用于确定给定输入是“信号”还是噪声。其中一些来自第二次世界大战后的雷达研究,但很快就适应了感知实验(例如Green和Swets的研究)。我不知道谁发现假设预测变量之间的独立性很好,但是从1970年代初期开始的工作似乎已经利用了这一思想,如本文所概述。顺便提一句,该文章还指出,朴素贝叶斯曾经被称为“白痴贝叶斯”!

支持向量机

1962年,Vapnik和Chervonenkis描述了“通用肖像算法”(可怕的扫描,对不起),它看起来像是支持向量机(或者实际上是一类SVM)的特例。Chervonenkis撰写了一篇题为“支持向量机的早期历史”的文章其中更详细地描述了此过程及其后续工作。内核技巧(如内核内积)由Aizerman,布雷弗曼和Rozonoer于1964年svms.org描述有一点关于支持向量机的历史在这里


2
时间序列分析还解决了一些有趣的问题。ARMA和Kalman滤波器在50年代和60年代取得了不错的成绩。
EngrStudent-恢复莫妮卡

1
有趣!我对它或它的历史知之甚少,但是如果您写了一个答案,我会很乐意赞成!
马特·克劳斯

3

免责声明:这个答案是不完整的,但是我现在没有时间使它成为最新。我希望在本周晚些时候进行研究。


问题:
解决大约1969年的数据预测的一般问题的最新方法是什么?

注意:这不会重复“ Matt Krause”的出色回答。

“最先进”的意思是“最好和最现代的”,但不一定要沦为行业规范。相反,美国专利法寻求由“本领域普通技术”定义的“非显而易见的”。1969年的“最先进技术”很可能在接下来的十年中获得了专利。

在ECHELON (1) (2)中极有可能使用或评估了1969年“最佳和最聪明”的方法。它还将在对苏联时代另一个具有数学能力的超级大国的评价中进行展示。(3) 我花了几年的时间来制造卫星,因此人们也希望在接下来的5年内,通信,遥测或侦察卫星的技术或内容能够显示1969年的技术水平。一个例子是Meteor-2气象卫星始于1967年,初步设计于1971年完成。(4) 光谱和光度学有效载荷工程是通过当天的数据处理能力以及所设想的时间的“近将来”数据处理来告知的。处理此类数据是寻找该时期最佳实践的地方。

细读《优化理论与应用杂志》已经运行了几年,并且可以访问其内容。 (5) 考虑一下(6)最优估计量的评估,以及递归估计量的评估。(7)

SETI项目始于1970年代,很可能使用了预算较低的技术,并且使用了较旧的技术来适应当时的技术。对早期 SETI技术的探索也可以说服1969年左右的领先者。一种可能的选择是“ 手提箱SETI ” 的前驱。“手提箱SETI”使用DSP在约130k窄带通道中构建自相关接收器。SETI人员特别希望进行频谱分析。该方法首先用于离线处理Aricebo数据。后来,在1978年将其连接到Aricebo射电望远镜以获取实时数据,并于同年发布结果。实际的Suitecase-SETI于1982年完成。在此处(链接) 图1是示出该过程的框图。

该方法是使用离线长傅立叶变换(〜64k样本)搜索带宽段,包括处理线性调频和多普勒频移的实时补偿。该方法不是“新方法”,并且提供了参考,包括:例如,请参见

A. G. W. Cameron, Ed., 
In- terstellar Communication 
(Benjamin, New York,1963); 

I. S. Shklovskii and C. Sagan, 
In-telligent Life in the Universe 
(Holden-Day, San Francisco, 1966); 

C. Sagan, Ed., 
Communication with Extraterrestrial Intelligence 
(MIT Press, Cambridge, Mass., 1973); 
P. Morrison, J.

B. M. Oliver and J. Billingham, 
"Project Cyclops: A Design Study of a System for Detecting Extraterrestrial Intelligent Life," 
NASA Contract. Rep. CR114445 (1973). 

给定先前的状态,当时流行的用于预测下一个状态的工具包括:

  • 卡尔曼(及微分)滤波器(Weiner,Bucy,非线性...)
  • 时间序列(和导数)方法
  • 频域方法(傅里叶),包括滤波和放大

常见的“关键词”(或流行词)包括“伴随,变化,梯度,最优,二阶和共轭”。

卡尔曼滤波器的前提是将现实世界的数据与分析和预测模型进行最佳混合。它们被用来使导弹击中目标。


感谢您写下来-我喜欢您采用的应用程序驱动方法!
马特·克劳斯

@MattKrause-我还有一点话要说。我认为在这种情况下,应用程序驱动的方法将为“数学考古学”服务。我们会看到。这项工作使我想建立一个“手提箱SETI”,并用它环顾我的人生环境,以了解50年的工具正在做什么。
EngrStudent-恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.