最近刚开始自学机器学习和数据分析,我发现自己对创建和查询大量数据的需求感到困惑。我想对自己在职业和个人生活中积累的数据进行分析,但是我不确定执行以下操作的最佳方法:
我应该如何存储这些数据?Excel?SQL???
初学者开始尝试分析这些数据的好方法是什么?我是一名专业的计算机程序员,所以复杂性不在于编写程序,而是或多或少地针对数据分析领域。
编辑:为我的含糊而道歉,当您第一次开始学习某些东西时,很难知道您不知道的内容,是吗?;)
话虽如此,我的目的是将其应用于两个主要主题:
软件团队指标(考虑敏捷速度,量化风险,在x个故事点数的情况下成功完成迭代的可能性)
机器学习(例如,在给定的一组模块中发生了系统异常),一个模块将在现场抛出异常的可能性是多少,代价是多少,数据可以告诉我哪些关键模块需要改进,从而获得最好的解决方案,预测用户接下来要使用哪个系统部分以开始加载数据,等等)。