我知道压缩方法可以分为两个主要组:
- 全球
- 本地
第一组工作与所处理的数据无关,也就是说,它们不依赖于数据的任何特征,因此不需要在数据集的任何部分上执行任何预处理(在压缩本身之前)。另一方面,局部方法分析数据,提取通常可以提高压缩率的信息。
在阅读其中一些方法时,我注意到一元方法不是通用方法,这使我感到惊讶,因为我认为“全局性”和“通用性”是同一件事。一元方法不依赖数据的特性来产生其编码(即,它是一种全局方法),因此它应该是全局/通用的,不是吗?
我的主要问题:
- 通用方法和全局方法有什么区别?
- 这些分类不是同义词吗?
2
您可以链接到/引用一元方法不是通用方法的地方吗?上下文可能会有所帮助。
—
航
我...不确定这与数据科学有何关系。似乎此堆栈交换不合时宜。您能否将其与数据科学联系起来?
—
Slater Victoroff 2014年
@Rubens看来,这是一个合理的讨论,在我看来,关于效率CS的讨论更适合理论CS之类的东西,而不是露骨的黑客技巧。在我看来,黑客技能与数据库,部署和工具知识等相关性更高。
—
Slater Victoroff 2014年
@SvanBalen有两点要点:1.信息论在数据科学的某些方法中很重要,但在许多其他方法中却无关紧要。2.基础知识本质上是不合时宜的,即使对有用的数据科学严格要求这两个问题,有关统计或线性代数的详细问题也同样不合时宜。
—
Slater Victoroff