Java线程的创建非常昂贵,因为其中涉及大量工作:
- 必须为线程堆栈分配并初始化一大块内存。
- 需要进行系统调用以在主机OS中创建/注册本机线程。
- 需要创建,初始化描述符并将其添加到JVM内部数据结构中。
从某种意义上说,只要线程处于活动状态,它就束缚资源,这也是昂贵的。例如线程堆栈,可从堆栈访问的任何对象,JVM线程描述符,OS本机线程描述符。
所有这些东西的成本是特定于平台的,但是在我遇到过的任何Java平台上,它们都不便宜。
谷歌搜索发现我有一个旧的基准,该基准报告在运行2002老式Linux的2002老式双处理器Xeon上,在Sun Java 1.4.1上线程创建速率约为4000每秒。一个更现代的平台将提供更多的数据……而且我无法评论该方法论……但至少,它为可能创建线程的成本提供了保证。
彼得·劳瑞(Peter Lawrey)的基准测试表明,从绝对意义上讲,如今的线程创建速度显着提高,但是目前尚不清楚其中有多少是由于Java和/或操作系统的改进或更高的处理器速度所致。但是,如果您使用线程池,而不是每次都创建/启动一个新线程,那么他的数据仍然表明可以提高150倍以上。(他指出这都是相对的...)
(以上假设“本地线程”而不是“绿色线程”,但是现代JVM出于性能原因都使用本地线程。绿色线程创建起来可能更便宜,但您可以在其他领域为此付费)。
我做了一些挖掘工作,以了解如何真正分配Java线程的堆栈。对于Linux上的OpenJDK 6,线程堆栈是通过调用分配给pthread_create
创建本地线程的。(JVM不会传递pthread_create
预分配的堆栈。)
然后,pthread_create
通过调用将栈内分配mmap
如下:
mmap(0, attr.__stacksize,
PROT_READ|PROT_WRITE|PROT_EXEC,
MAP_PRIVATE|MAP_ANONYMOUS, -1, 0)
根据man mmap
,该MAP_ANONYMOUS
标志使内存初始化为零。
因此,即使并非必须(根据JVM规范)将新的Java线程栈置零,但实际上(至少对于Linux上的OpenJDK 6)将它们置零。