8
如何遍历熊猫数据框的列以运行回归
我敢肯定这很简单,但是作为python的完整新手,我在弄清楚如何遍历pandas数据帧中的变量并对每个变量进行回归时都遇到了麻烦。 这是我在做什么: all_data = {} for ticker in ['FIUIX', 'FSAIX', 'FSAVX', 'FSTMX']: all_data[ticker] = web.get_data_yahoo(ticker, '1/1/2010', '1/1/2015') prices = DataFrame({tic: data['Adj Close'] for tic, data in all_data.iteritems()}) returns = prices.pct_change() 我知道我可以像这样进行回归: regs = sm.OLS(returns.FIUIX,returns.FSTMX).fit() 但是假设我要对数据框中的每一列执行此操作。特别是,我想在FSTMX上还原FIUIX,然后在FSTMX上还原FSAIX,然后在FSTMX上还原FSAVX。每次回归后,我想存储残差。 我尝试了以下各种版本,但语法一定有误: resids = {} for k in returns.keys(): reg = sm.OLS(returns[k],returns.FSTMX).fit() resids[k] = reg.resid 我认为问题是我不知道如何按键引用return列,所以returns[k]可能是错误的。 …
187
python
pandas
statsmodels