我有一个Python脚本,该脚本导入一个大型CSV文件,然后计算该文件中每个单词的出现次数,然后将计数导出到另一个CSV文件。
但是发生的是,一旦计数部分完成并开始输出,它就会Killed
在终端上说。
我不认为这是内存问题(如果是的话,我认为我会遇到内存错误而不是Killed
)。
可能是这个过程花了太长时间吗?如果是这样,有没有办法延长超时期限,这样我可以避免这种情况?
这是代码:
csv.field_size_limit(sys.maxsize)
counter={}
with open("/home/alex/Documents/version2/cooccur_list.csv",'rb') as file_name:
reader=csv.reader(file_name)
for row in reader:
if len(row)>1:
pair=row[0]+' '+row[1]
if pair in counter:
counter[pair]+=1
else:
counter[pair]=1
print 'finished counting'
writer = csv.writer(open('/home/alex/Documents/version2/dict.csv', 'wb'))
for key, value in counter.items():
writer.writerow([key, value])
而且Killed
发生后finished counting
已打印,以及完整的信息是:
killed (program exited with code: 137)