计算科学

科学家使用计算机解决科学问题的问答

2
超级计算的通讯开销
我正在寻找可靠的参考资料,以说明超级计算机在协调与完成与任务相关的实际工作中所花费的资源。资源可能具有可用的处理能力,但即使瓦特也似乎是有效的单位。 我相信我的一位教授或教科书曾说过,在大规模并行系统中,多达一半的可用处理能力用于协调任务和消息传递。不幸的是,我似乎找不到此参考文献或有关此比例的任何其他材料。 我意识到这将取决于超级计算机体系结构,并且在这方面现代实现可能会更有效率,因此,跨多个体系结构或演进(在专用消息传递硬件之前和之后)的该指标概述可能会更好。
10 hpc  mpi 



5
整合到log-log空间
我正在使用的函数通常在对数-对数空间中更平滑,更好地表现---所以我可以在其中执行内插/外推等,并且效果很好。 有没有办法在对数-对数空间中集成这些数值函数? 即我希望使用某种简单的梯形规则来执行累积积分(例如在python中,使用scipy.integrate.cumtrapz),以找到一些 stF(r)F(r)F(r) F(r)=∫r0y(x)dxF(r)=∫0ry(x)dxF(r) = \int_0^r y(x) \, dx 但是我希望使用值和,而不是和(如果可能)。log(y)log(y)log(y)log(x)log(x)log(x)yyyxxx

3
您能举一些严重使用无网格方法的例子吗?
我想听听有关使用无网格方法(例如基于移动最小二乘函数的无网格Galerkin)的科学代码和商业软件包的信息。“严重”是指它们可用于解决与FEM解决的问题相当的问题。 自成立以来已经十五年了。开发它们的人认为它们非常有前途。我只是想了解当前的技术水平。

3
N维Delaunay镶嵌软件库
我有一组在N维空间(N> = 2)中不规则间隔的已知点/节点,并且我想一种生成这些点的Delaunay三角剖分并返回相应元素的方法。 是否有现有的网格划分库可以进行ND Delaunay三角剖分? (我之所以这样做,是因为我想将网格化的元素用作空间中任何一点的线性插值的基础。如果对建议有任何不同,我的维当前由在维上模板化的C ++类处理。)

2
RBF内核矩阵是否趋向于病态?
我使用RBF内核函数来实现一种基于内核的机器学习算法(KLPP),得到的内核矩阵 KKK K(i,j)=exp(−(xi−xj)2σ2m)K(i,j)=exp⁡(−(xi−xj)2σm2)K(i,j)= \exp\left({\frac{-(x_{i}-x_{j})^2}{ \sigma_{m}^2}}\right) 被证明病得很重条件。L2-范数的条件数为1017−10641017−106410^{17}-10^{64} 有什么办法使它适应良好吗?我猜想参数需要调整,但我不知道该怎么精确。σσ \sigma 谢谢!

1
为什么很难用数字方法求解与时间相关的多电子薛定ding方程
似乎人们通常使用单活性电子(SAE)近似来处理多电子系统,从而将问题转换为单电子问题。例如,在数值上解决氦原子与激光场相互作用的问题时,人们通常近似地包括由伪电势产生的电子-电子效应,并且本质上解决了一个电子问题。那么,为什么即使在数值上求解时间相关的多电子薛定ding方程也很困难?比经典的n体问题难得多吗?我已经看到,即使在实时上,也有很多巨大的经典体问题在天文学上得到了数值解决,例如,这里实时模拟两个涉及280000个粒子相互作用的星系的碰撞。ññn

2
如何在Fortran中设置双精度值
最近,我在FORTRAN95中遇到了一个奇怪的问题。我将变量X和Y初始化如下: X=1.0 Y=0.1 后来我将它们加在一起并打印结果: 1.10000000149012 在检查了变量之后,似乎没有以完全精度的双精度表示0.1。有什么办法可以避免这种情况?



3
LAPACK使用的原因是什么
LAPACK的QR例程将Q存储为Householder反射器。它缩放反射向量与,所以结果的第一个元素变成,所以它不具有被存储。并且它存储一个单独的向量,其中包含所需的比例因子。所以反射矩阵是这样的:vvv1 /v1个1/v11/v_11个11ττ\tauH= 我- τvvŤ,H=一世-τvvŤ,H=I-\tau v v^T, 其中未标准化。而在教科书中,反射矩阵是vvv H= 我− 2 伏vŤ,H=一世-2vvŤ,H = I-2vv^T, 其中,是标准化。vvv 为什么LAPACK 用缩放,而不是对其进行归一化?vvv1 /v1个1个/v1个1/v_1 所需的存储空间是相同的(而不是,必须存储),之后,应用可以更快地完成,因为不需要与进行乘法(可以优化教科书版本中与乘法,如果不是简单归一化,则将缩放为)。ττ\tauv1个v1个v_1HHHττ\tau222vvv2–√/ ∥v∥2/‖v‖\sqrt 2/\|v\| (我的问题的原因是我正在编写QR和SVD例程,并且我想知道此决定的原因,无论是否需要遵循它)

1
可以轻易理解的论点是,普通的Runge-Kutta方法不能推广到SDE吗?
解决随机微分方程(SDE)的一种简单方法是: 采取常规的多步Runge-Kutta方法, 对基础的维纳过程进行足够精细的离散化, 使Runge-Kutta方法的每个步骤都类似于Euler-Maruyama。 现在,这在多个级别上都失败了,我明白了为什么。但是,现在我的任务是说服这个事实的人们,他们对Runge-Kutta方法和随机微分方程一无所知。我所知道的所有论点都无法在给定的上下文中很好地传达。因此,我正在寻找一个容易理解的论点,即上述方法注定要失败。

4
最快的线性系统求解小平方矩阵(10x10)
我对通过线性系统求解小矩阵(10x10)(有时也称为小矩阵)来优化地狱非常感兴趣。有没有现成的解决方案?矩阵可以假定为非奇异的。 此求解器将在Intel CPU上执行超过1000000次(以微秒为单位)。我说的是计算机游戏中使用的优化级别。无论是在特定于汇编和体系结构的代码中进行编码,还是研究精度或可靠性方面的折衷并使用浮点hack(我都使用-ffast-math编译标志,这都没有问题)。解决甚至可能在大约20%的时间内失败! Eigen的partialPivLu在我当前的基准测试中是最快的,当使用-O3和良好的编译器进行优化时,性能优于LAPACK。但是现在我要手工制作一个定制的线性求解器。任何建议将不胜感激。我将使我的解决方案开源,并会在出版物等方面获得关键见解。 相关:用块对角矩阵求解线性系统 的速度什么是最快的方法来反转数百万个矩阵? https://stackoverflow.com/q/50909385/1489510

2
用来量化三角形网格不规则性的常用指标
假设您在平面上有一个三角形网格。例如,这是为了最终解决力学中的某些问题而绘制的。 由于顶点之间和质心之间的距离始终相同,所以等边三角形的网格是最好的。这使得插值和梯度计算变得简单而准确。但是,由于种种限制和情况,并非总是能够对所有等边三角形的网格进行加工。 因此,问题涉及任意形状的三角形元素的网格。 关于单个网格元素。通常使用哪些度量来量化一个通用三角形与某些潜在的理想等边形状的相异性? 关于整个网格。哪些指标用于量化整体上任意三角形网格的不规则性?这些指标应指示网格的混乱程度。 感谢您的配合。 注意 来自有限元社区的所有贡献都得到了极大的赞赏。对于此问题,请注意,仅对几何形状(任意三角形与等边三角形)中的差异进行量化是很有意义的。对插值和条件误差的后续影响不在范围内。鉴于这些可以洞察力和相关性,它们使数学处理变得复杂。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.