我正在使用该库来实现学习代理。
我已经生成了训练案例,但是我不确定是什么验证和测试集。
老师说:
70%应该是培训用例,10%是测试用例,其余20%应该是验证用例。
编辑
我有此训练代码,但我不知道何时停止训练。
def train(self, train, validation, N=0.3, M=0.1):
# N: learning rate
# M: momentum factor
accuracy = list()
while(True):
error = 0.0
for p in train:
input, target = p
self.update(input)
error = error + self.backPropagate(target, N, M)
print "validation"
total = 0
for p in validation:
input, target = p
output = self.update(input)
total += sum([abs(target - output) for target, output in zip(target, output)]) #calculates sum of absolute diference between target and output
accuracy.append(total)
print min(accuracy)
print sum(accuracy[-5:])/5
#if i % 100 == 0:
print 'error %-14f' % error
if ? < ?:
break
编辑
经过约20次训练迭代后,使用验证数据可以得到0.2的平均误差,应该是80%?
平均误差=给定验证数据输入/验证数据的大小,验证目标与输出之间的绝对差之和。
1
avg error 0.520395
validation
0.246937882684
2
avg error 0.272367
validation
0.228832420879
3
avg error 0.249578
validation
0.216253590304
...
22
avg error 0.227753
validation
0.200239244714
23
avg error 0.227905
validation
0.199875013416