Questions tagged «blas»

4
BLAS,LAPACK和ATLAS之间是什么关系
我不了解BLAS,LAPACK和ATLAS之间的关系,以及如何将它们一起使用!我一直在浏览他们的所有手册,对BLAS和LAPACK以及它们在很少发现的示例中如何使用都有一个大致的了解,但是我找不到使用ATLAS的任何实际示例来了解它们与ALAS的关系这两个。 我正在尝试对矩阵做一些底层工作,我的主要语言是C。首先,我想使用GSL,但是它说如果要获得最佳性能,则应该使用BLAS和ATLAS。有没有一个很好的网页给出了一些很好的示例(如何在C中一起使用)?换句话说,我正在寻找使用这三个(或它们的任何子集!)的教程。总之我很困惑!
142 c  lapack  blas  atlas 

3
为什么在导入numpy之后多处理仅使用单个内核?
我不确定这是否更多的是操作系统问题,但是我想在这里问一下,以防有人对Python有所了解。 我一直在尝试使用并行化CPU繁重的for循环joblib,但是我发现不是将每个工作进程分配给不同的内核,而是最终将所有工作进程分配给相同的内核,并且没有性能提升。 这是一个非常简单的例子... from joblib import Parallel,delayed import numpy as np def testfunc(data): # some very boneheaded CPU work for nn in xrange(1000): for ii in data[0,:]: for jj in data[1,:]: ii*jj def run(niter=10): data = (np.random.randn(2,100) for ii in xrange(niter)) pool = Parallel(n_jobs=-1,verbose=1,pre_dispatch='all') results = pool(delayed(testfunc)(dd) for dd in …


4
基准测试(使用BLAS的python与c ++)和(numpy)
我想编写一个程序,该程序广泛使用BLAS和LAPACK线性代数功能。由于性能是一个问题,因此我做了一些基准测试,想知道我采用的方法是否合法。 可以说,我有三个参赛者,并希望通过一个简单的矩阵矩阵乘法来测试他们的表现。参赛者是: Numpy,仅使用的功能dot。 Python,通过共享对象调用BLAS功能。 C ++,通过共享库调用BLAS功能。 情境 我为不同的尺寸实现了矩阵矩阵乘法i。i为5的增量和matricies运行5-500 m1和m2设置了这样的: m1 = numpy.random.rand(i,i).astype(numpy.float32) m2 = numpy.random.rand(i,i).astype(numpy.float32) 1.脾气暴躁 使用的代码如下所示: tNumpy = timeit.Timer("numpy.dot(m1, m2)", "import numpy; from __main__ import m1, m2") rNumpy.append((i, tNumpy.repeat(20, 1))) 2. Python,通过共享库调用BLAS 具有功能 _blaslib = ctypes.cdll.LoadLibrary("libblas.so") def Mul(m1, m2, i, r): no_trans = c_char("n") n = c_int(i) one = …
107 c++  python  numpy  benchmarking  blas 

2
犰狳solve()线程安全吗?
在我的代码中,我有一个循环,在该循环中构造并确定了线性系统并尝试解决该问题: #pragma omp parallel for for (int i = 0; i < n[0]+1; i++) { for (int j = 0; j < n[1]+1; j++) { for (int k = 0; k < n[2]+1; k++) { arma::mat A(max_points, 2); arma::mat y(max_points, 1); // initialize A and y arma::vec solution = solve(A,y); …

10
MatLab错误:无法使用静态TLS打开
几天以来,我在使用MATLAB时不断收到相同的错误,该错误有时在发生dlopen。我对MATLAB很陌生,这就是为什么我不知道该怎么做的原因。Google似乎也没有帮助我。当我尝试制作特征向量时,得到以下信息: Error using eig LAPACK loading error: dlopen: cannot load any more object with static TLS 在进行乘法运算时,我也会得到这个: Error using * BLAS loading error: dlopen: cannot load any more object with static TLS 当然,我确实在寻找解决此问题的方法,但是我不太了解,也不知道该怎么办。这些是我发现的线程: 如何使用MATLAB提供的BLAS库? http://www.mathworks.de/de/help/matlab/matlab_external/calling-lapack-and-blas-functions-from-mex-files.html 有人能帮助我吗? 展示此错误的函数调用示例 >> randn(3,3) ans = 2.7694 0.7254 -0.2050 -1.3499 -0.0631 -0.1241 3.0349 0.7147 1.4897 …

16
TensorFlow:InternalError:Blas SGEMM启动失败
当我跑步时sess.run(train_step, feed_dict={x: batch_xs, y_: batch_ys})我得到InternalError: Blas SGEMM launch failed。这是完整的错误和堆栈跟踪: InternalErrorTraceback (most recent call last) <ipython-input-9-a3261a02bdce> in <module>() 1 batch_xs, batch_ys = mnist.train.next_batch(100) ----> 2 sess.run(train_step, feed_dict={x: batch_xs, y_: batch_ys}) /usr/local/lib/python2.7/dist-packages/tensorflow/python/client/session.pyc in run(self, fetches, feed_dict, options, run_metadata) 338 try: 339 result = self._run(None, fetches, feed_dict, options_ptr, --> 340 run_metadata_ptr) 341 if …
71 tensorflow  blas 

1
使用LAPACK分发基于Cython的扩展
我正在编写一个包含Cython扩展和用法LAPACK(和BLAS)的Python模块。我打开使用两种clapack或lapacke,或某种f2c或f2py解决方案,如果必要的。重要的是,我能够在紧密的循环中从Cython调用lapack和blas例程,而没有Python调用开销。 我在这里找到了一个例子。但是,该示例取决于SAGE。我希望我的模块无需安装SAGE就可以安装,因为我的用户不太可能需要SAGE或其他任何东西。我的用户可能安装了numpy,scipy,pandas和scikit Learn之类的程序包,因此这些程序包是合理的依赖项。使用的接口的最佳组合是什么?最小的setup.py文件看起来像什么,可以从中获取编译所需的信息(从numpy,scipy等)? 编辑: 这就是我最终在做什么。它可以在我的Macbook上使用,但我不知道它的便携性。当然有更好的方法。 from distutils.core import setup from distutils.extension import Extension from Cython.Distutils import build_ext import numpy from Cython.Build import cythonize from numpy.distutils.system_info import get_info # TODO: This cannot be the right way blas_include = get_info('blas_opt')['extra_compile_args'][1][2:] includes = [blas_include,numpy.get_include()] setup( cmdclass = {'build_ext': build_ext}, ext_modules = cythonize([Extension("cylapack", ["cylapack.pyx"], …
67 python  numpy  cython  lapack  blas 
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.