Questions tagged «normalization»

14
标准化R中的数据列
我有一个数据集spam,其中包含58列和大约3500行与垃圾邮件相关的数据。 我计划将来在此数据集上运行一些线性回归,但我想事先进行一些预处理,并将列标准化为均值和单位方差为零。 有人告诉我最好的方法是使用R,所以我想问一下如何使用R实现归一化?我已经正确加载了数据,我只是在寻找一些软件包或方法来执行此任务。
209 r  normalization 



10
python-如何在python中更详细地规范二维numpy数组?
给定一个3乘3 numpy数组 a = numpy.arange(0,27,3).reshape(3,3) # array([[ 0, 3, 6], # [ 9, 12, 15], # [18, 21, 24]]) 为了规范二维数组的行,我想到了 row_sums = a.sum(axis=1) # array([ 9, 36, 63]) new_matrix = numpy.zeros((3,3)) for i, (row, row_sum) in enumerate(zip(a, row_sums)): new_matrix[i,:] = row / row_sum 必须有更好的方法,不是吗? 可能需要澄清:通过标准化我的意思是,每行条目的总和必须为1。但是我认为这对于大多数人来说都是显而易见的。

8
如何在python中规范化URL
我想知道我是否在python中标准化URL。 例如,如果我有一个网址字符串,例如:“ http://www.example.com/foo goo / bar.html” 我需要python中的库,该库会将多余的空间(或任何其他非标准化字符)转换为正确的URL。


3
MongoDB规范化,外键和联接
在我深入研究MongoDB几天之前,我想我会问一个非常基本的问题,即是否应该完全研究它。我基本上没有使用nosql的经验。 我确实阅读了一些有关文档数据库的好处,并且我认为对于这个新应用程序,它们将非常有用。对许多类型的对象(很多M-M关系)和子类进行收藏,评论等总是很麻烦-处理起来很麻烦。 我也有一个结构,很难用SQL定义,因为它是非常嵌套的,并且可以比15个不同的表更好地转换为文档。 但是我对一些事情感到困惑。 是否希望保持数据库正常化?我真的不想更新多个记录。人们还在用这种方式来处理MongoDB中的数据库设计吗? 当用户收藏一本书并且此选择仍存储在用户文档中但又删除该书时,会发生什么情况?没有外键如何分离关系?我自己负责删除所有链接吗? 如果用户偏爱一本已不存在的书并查询(某种连接),该怎么办?我必须在这里做任何容错吗?
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.