以下代码段之间有什么区别?不会都使用线程池线程吗?
例如,如果我想为集合中的每个项目调用一个函数,
Parallel.ForEach<Item>(items, item => DoSomething(item));
vs
foreach(var item in items)
{
Task.Factory.StartNew(() => DoSomething(item));
}
以下代码段之间有什么区别?不会都使用线程池线程吗?
例如,如果我想为集合中的每个项目调用一个函数,
Parallel.ForEach<Item>(items, item => DoSomething(item));
vs
foreach(var item in items)
{
Task.Factory.StartNew(() => DoSomething(item));
}
Answers:
第一个是更好的选择。
在内部,Parallel.ForEach使用a Partitioner<T>
将您的集合分发到工作项中。它不会为每个项目执行一项任务,而是分批执行此任务以降低所涉及的开销。
第二个选项将安排一个 Task
您的收藏中的每个项目。尽管结果(几乎)是相同的,但是这将带来不必要的额外开销,尤其是对于大型集合而言,这将导致整体运行时间变慢。
仅供参考- 如果需要,可以通过对Parallel.ForEach使用适当的重载来控制使用的Partitioner 。有关详细信息,请参阅MSDN上的“ 自定义分区程序 ”。
在运行时的主要区别是第二个将异步执行。可以使用Parallel.ForEach通过执行以下操作来复制它:
Task.Factory.StartNew( () => Parallel.ForEach<Item>(items, item => DoSomething(item)));
这样,您仍然可以利用分区程序,但是在操作完成之前不要阻塞。
我做了一个小实验,使用“ Parallel.For”和“ Task”对象运行方法“ 1,000,000,000(十亿)”次。
我测量了处理器时间,发现并行效率更高。Parallel.For将您的任务划分为多个小的工作项,并以最佳方式在所有内核上并行执行它们。在创建许多任务对象时(FYI TPL将在内部使用线程池)将移动每个任务的每次执行,从而在框中产生更大的压力,这从下面的实验中可以明显看出。
我还制作了一个小视频,解释了基本的TPL,还演示了Parallel.For如何更有效地利用您的内核http://www.youtube.com/watch?v=No7QqSc5cl8与常规任务和线程相比。
实验1
Parallel.For(0, 1000000000, x => Method1());
实验2
for (int i = 0; i < 1000000000; i++)
{
Task o = new Task(Method1);
o.Start();
}
Mehthod1()
在此示例中做什么?
在我看来,最现实的情况是任务需要完成繁重的操作。Shivprasad的方法更多地关注对象创建/内存分配,而不是计算本身。我进行了一项研究,研究了以下方法:
public static double SumRootN(int root)
{
double result = 0;
for (int i = 1; i < 10000000; i++)
{
result += Math.Exp(Math.Log(i) / root);
}
return result;
}
执行此方法大约需要0.5秒。
我使用Parallel调用了200次:
Parallel.For(0, 200, (int i) =>
{
SumRootN(10);
});
然后我用老式的方法调用了200次:
List<Task> tasks = new List<Task>() ;
for (int i = 0; i < loopCounter; i++)
{
Task t = new Task(() => SumRootN(10));
t.Start();
tasks.Add(t);
}
Task.WaitAll(tasks.ToArray());
第一起案件在26656毫秒内完成,第二起案件在24478毫秒内完成。我重复了很多次。每当第二种方法稍快一些时。