Questions tagged «signal-processing»

数字化信号的数值分析

6
时间序列分类的功能
我考虑基于可变长度时间序列的(多类)分类问题,即找到函数 通过时间的全局表示,由固定大小为的一组选定特征独立于, 然后对该功能集使用标准分类方法。 我对预测不感兴趣,即预测˚F (X Ť)= ÿ ∈ [ 1 .. ķ ]TTTf(XT)=y∈[1..K]for XT=(x1,…,xT)with xt∈Rd ,f(XT)=y∈[1..K]for XT=(x1,…,xT)with xt∈Rd ,f(X_T) = y \in [1..K]\\ \text{for } X_T = (x_1, \dots, x_T)\\ \text{with } x_t \in \mathbb{R}^d ~, viviv_iDDDTTTϕ(XT)=v1,…,vD∈R ,ϕ(XT)=v1,…,vD∈R ,\phi(X_T) = v_1, \dots, v_D \in \mathbb{R}~,xT+1xT+1x_{T+1}。例如,我们可以分析人的行走方式以预测其性别。 我可能要考虑哪些标准功能? 例如,我们可以明显地使用序列的均值和方差(或更高阶矩),也可以查看频域,就像该序列的离散傅里叶变换(或离散小波变换)的某个间隔中包含的能量一样。

3
小波在基于时间序列的异常检测算法中的应用
我已经开始通过安德鲁·摩尔(Andrew Moore)编写的《统计数据挖掘教程》来工作(强烈推荐给初次接触该领域的任何人)。我首先阅读了这份非常有趣的PDF,标题为“基于时间序列的异常检测算法简介”,其中Moore跟踪了创建算法以检测疾病暴发时使用的许多技术。在幻灯片的中间,第27页,他列出了许多其他用于检测爆发的“最新方法”。列出的第一个是小波。维基百科将小波描述为 振幅从零开始的波状振荡,先增大后减小,然后回零。通常可以将其可视化为“简短振荡” 但并未描述它们在统计学中的应用,我的Google搜索结果获得了学术论文,这些论文都假设小波如何与统计数据或该主题的完整书籍相关。 我希望对小波如何应用于时间序列异常检测有一个基本的了解,就像Moore在他的教程中说明其他技术一样。有人可以提供有关使用小波的检测方法如何工作的解释,或者可以提供有关此问题的可理解文章的链接吗?

1
如何对齐/同步两个信号?
我正在做一些研究,但是一直停留在分析阶段(应该更多地关注我的统计讲座)。 我收集了两个同时发生的信号:对体积进行积分的流速和对胸部扩张的改变。我想比较这些信号,最终希望从胸部扩张信号中得出体积。但是首先我必须对齐/同步我的数据。 由于记录不是在同一时间开始,并且胸部扩展被捕获的时间更长,因此我需要在胸部扩展数据集中找到与我的体数据相对应的数据,并衡量它们的对齐程度。如果两个信号不是完全同时启动,或者不是在不同比例和不同分辨率的数据之间启动,我不太确定该如何处理。 我已经附上了这两个信号的示例(https://docs.google.com/spreadsheet/ccc?key=0As4oZTKp4RZ3dFRKaktYWEhZLXlFbFVKNmllbGVXNHc),请告诉我是否还有其他信息。


4
平滑时间序列数据
我正在构建一个Android应用程序,该应用程序在睡眠期间记录加速度计数据,以便分析睡眠趋势并有选择地在轻度睡眠期间将用户唤醒在所需时间附近。 我已经建立了收集和存储数据以及警报的组件。我仍然需要以一种非常有意义和清晰的方式来应对显示和保存睡眠数据的难题,最好也可以进行分析。 几张图片说了两千个字:(由于重复率低,我只能发布一个链接) 这是未过滤的数据,以30秒为间隔收集的移动总和 和相同的数据,通过我自己的移动平均平滑表现进行了平滑 编辑)这两个图表都反映了校准-有一个最小的``噪声''过滤器和一个最大截止过滤器以及一个警报触发电平(白线) 不幸的是,这些都不是最优的解决方案-第一个对于普通用户来说有点难以理解,第二个更容易理解,却隐藏了很多实际情况。特别是,平均消除了运动中尖峰的细节,我认为这些可能是有意义的。 那么,为什么这些图表如此重要?这些时间序列会在整个晚上作为对用户的反馈进行显示,并将在以后存储以供查看/分析。平滑处理将理想地降低内存成本(RAM和存储),并使这些资源匮乏的电话/设备上的渲染速度更快。 显然,有一种更好的方法来平滑数据-我有一些模糊的想法,例如使用线性回归来找出运动中的“尖锐”变化,并据此修改移动平均值的平滑度。在深入研究可以更优化地解决问题之前,我确实需要更多指导和意见。 谢谢!

4
检测音频记录中的峰值数量
我正在尝试弄清楚如何检测一个录音语料库中的音节数。我认为一个好的代理可能是wave文件中的峰值。 这是我尝试用英语说的文件的内容(我的实际用例是斯瓦西里语)。该示例录音的记录是:“这是我试图使用计时器功能。我正在查看暂停和发声。” 此段落共有22个音节。 WAV文件:https://www.dropbox.com/s/koqyfeaqge8t9iw/test.wav? dl = 0 seewaveR中的程序包很棒,并且有多个潜在功能。首先,导入wave文件。 library(seewave) library(tuneR) w <- readWave("YOURPATHHERE/test.wav") w # Wave Object # Number of Samples: 278528 # Duration (seconds): 6.32 # Samplingrate (Hertz): 44100 # Channels (Mono/Stereo): Stereo # PCM (integer format): TRUE # Bit (8/16/24/32/64): 16 我尝试的第一件事是timer()功能。它返回的内容之一是每次发声的持续时间。此功能可识别7个发声,远远少于22个音节。快速浏览情节表明,发声不等于音节。 t <- timer(w, threshold=2, msmooth=c(400,90), dmin=0.1) …

1
鼠标(或键盘)点击的模式并预测计算机用户的活动
仅基于鼠标单击的时间模式(单击时间),可以预测计算机用户的活动吗?[ Ť1个,Ť2,Ť3,… ][Ť1个,Ť2,Ť3,…][t_1,t_2,t_3,\ldots] 例如,工作:在Facebook上花费时间,在照片上观看照片,在电脑上玩游戏。 如果他们有更详尽的预测(例如玩《星际争霸》,《反恐精英》和《模拟城市》),那么我也很感兴趣。 虽然(可以说)有人听到有人在玩(由于快速而突然的点击)或正在观看照片(等间隔的点击),但我对此是否还有客观的发现(出版物,博客研究等)感兴趣, 。 编辑: 我同样对键盘单击(不区分正在敲击哪个键)或组合方法(鼠标+键盘)感兴趣。

1
MFCC是向检索系统表示音乐的最佳方法吗?
信号处理技术(梅尔频率倒谱)通常用于从音乐作品中提取信息,以用于机器学习任务。该方法给出了短期功率谱,并且将系数用作输入。 在设计音乐检索系统时,这些系数被认为是乐曲的特征(显然不一定是唯一的,而是有区别的)。有没有更适合通过网络学习的特征?诸如Elman网络之类的乐器所使用的随时间变化的特征(例如低音效果)会更有效吗? 哪些特征将构成可以进行何种分类的足够广泛的集合?

2
功能数据分析和高维数据分析有什么区别
在统计文献中,有很多关于“ 功能数据 ”(即曲线数据)的参考,也有许多关于“ 高维数据 ”(即当数据是高维向量时)的参考。我的问题是两种数据之间的区别。 当谈论在情况1中应用的应用统计方法时,可以理解为是从情况2通过投影到函数空间的有限维子空间中对方法进行的表述,它可以是多项式,样条,小波,傅立叶等。并将函数问题转化为有限维向量问题(因为在应用数学中,所有事情在某些时候都是有限的)。 我的问题是: 我们可以说适用于功能数据的任何统计程序也可以(几乎直接)适用于高维数据,而专用于高维数据的任何程序也可以(几乎直接)适用于功能数据吗? 如果答案是否定的,您能举例说明吗? 在Simon Byrne的答案的帮助下进行编辑/更新: 稀疏性(S-稀疏假设,球和弱升p球p &lt; 1)被用作在高维统计分析的结构的假设。升p升pl^p升p升pl^pp &lt; 1p&lt;1个p<1 “平滑度”在功能数据分析中用作结构假设。 另一方面,傅里叶逆变换和小波逆变换将稀疏性转换为平滑度,而通过小波和傅立叶变换将平滑度转换为稀疏度。这使得西蒙提到的关键差异不是那么关键吗?

6
可疑地使用信号处理原理来识别趋势
我建议尝试在一些非常嘈杂的长期数据中找到趋势。数据基本上是在大约8个月的时间内每周对大约5mm的物体进行测量。数据精确到1毫米,并且非常嘈杂,每周定期更改+/- 1或2毫米。我们只有到最接近毫米的数据。 我们计划使用一些具有快速傅立叶变换的基本信号处理来从原始数据中分离出噪声。基本的假设是,如果我们镜像数据集并将其添加到现有数据集的末尾,则可以创建数据的完整波长,因此我们的数据将以快速傅立叶变换显示,我们希望可以将其分离出来。 考虑到这对我来说有点怀疑,这是值得推荐的方法,还是镜像和附加我们的数据集的方法在某种程度上有根本性的缺陷?我们正在寻找其他方法,例如也使用低通滤波器。

1
我应该如何标准化加速度传感器的数据?
我正在处理大量加速度计数据,这些数据是由许多对象佩戴的多个传感器收集的。不幸的是,这里似乎没有人知道设备的技术规格,而且我认为它们从未进行过校准。我没有关于设备的大量信息。我正在研究硕士学位论文,加速度计是从另一所大学借来的,所以情况有点不透明。那么,在设备上进行预处理?没有线索。 我所知道的是它们是具有20Hz采样率的三轴加速度计。数字的,大概是MEMS。我对非语言行为和手​​势感兴趣,根据我的消息来源,这些行为和手势通常会在0.3-3.5Hz的范围内产生活动。 规范化数据似乎很有必要,但是我不确定该使用什么。数据的很大一部分接近于其余值(从重力开始,原始值约为1000),但有些极端,例如某些日志中的最大值为8000,而另一些日志中的最大值为29000。请参见下图。我认为用max或stdev进行归一化是一个坏主意。 在这种情况下,通常的做法是什么?除以中位数?百分位数值?还有吗 作为附带问题,我也不确定是否应该限制极端值。 感谢您的任何建议! 编辑:这是大约16分钟的数据(20000个样本)的图表,可让您大致了解数据的分布方式。

1
小波多分辨率分析中的边界效应
有什么方法可以减小小波分解中边界的影响? 我使用R和包wavelim。 我发现例如功能 ?brick.wall 但 我不太使用它。 我不确定最好的解决方案是删除一些系数。我在某处读到它存在一些不一样的小波,并且它们的形状在边界处改变。 有任何想法吗?
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.