用Python在栅格上对点数据进行双线性插值?


12

我有一个栅格,想要对它进行点插值。这是我的位置:

from osgeo import gdal
from numpy import array

# Read raster
source = gdal.Open('my_raster.tif')
nx, ny = source.RasterXSize, source.RasterYSize
gt = source.GetGeoTransform()
band_array = source.GetRasterBand(1).ReadAsArray()
# Close raster
source = None

# Compute mid-point grid spacings
ax = array([gt[0] + ix*gt[1] + gt[1]/2.0 for ix in range(nx)])
ay = array([gt[3] + iy*gt[5] + gt[5]/2.0 for iy in range(ny)])

到目前为止,我已经尝试过SciPy的interp2d函数:

from scipy import interpolate
bilinterp = interpolate.interp2d(ax, ay, band_array, kind='linear')

但是,在我的32位Windows系统上,有317×301栅格时出现内存错误:

Traceback (most recent call last):
  File "<interactive input>", line 1, in <module>
  File "C:\Python25\Lib\site-packages\scipy\interpolate\interpolate.py", line 125, in __init__
    self.tck = fitpack.bisplrep(self.x, self.y, self.z, kx=kx, ky=ky, s=0.)
  File "C:\Python25\Lib\site-packages\scipy\interpolate\fitpack.py", line 873, in bisplrep
tx,ty,nxest,nyest,wrk,lwrk1,lwrk2)
MemoryError

我承认,我对SciPy函数的信心有限,因为bounds_erroror fill_value参数不能按文档所述工作。我不明白为什么我会出现内存错误,因为我的栅格是317×301,并且双线性算法应该不会很困难。

有没有人遇到过一个好的双线性插值算法,最好是在Python中,可能是用NumPy量身定制的?有任何提示或建议吗?


(注意:最近邻插值算法很容易:

from numpy import argmin, NAN

def nearest_neighbor(px, py, no_data=NAN):
    '''Nearest Neighbor point at (px, py) on band_array
    example: nearest_neighbor(2790501.920, 6338905.159)'''
    ix = int(round((px - (gt[0] + gt[1]/2.0))/gt[1]))
    iy = int(round((py - (gt[3] + gt[5]/2.0))/gt[5]))
    if (ix < 0) or (iy < 0) or (ix > nx - 1) or (iy > ny - 1):
        return no_data
    else:
        return band_array[iy, ix]

...但是我更喜欢双线性插值方法)


1
也许您会MemoryError因为NumPy尝试访问超出您的范围而得到band_array?您应该检查axay
2011年

1
如果完全旋转网格,ax,ay可能会有问题。将插值点转换为像素或数据坐标可能会更好。另外,如果它们之间存在一对一的问题,那么您的范围可能会超出范围。
戴夫X

正确的旋转网格需要转换为网格空间,然后再转换为坐标空间。这需要的仿射变换系数的倒数gt
Mike T

Answers:


7

我已经将下面的公式(来自Wikipedia)转换为Python语言,以产生以下算法,该算法似乎有效。

from numpy import floor, NAN

def bilinear(px, py, no_data=NAN):
    '''Bilinear interpolated point at (px, py) on band_array
    example: bilinear(2790501.920, 6338905.159)'''
    ny, nx = band_array.shape
    # Half raster cell widths
    hx = gt[1]/2.0
    hy = gt[5]/2.0
    # Calculate raster lower bound indices from point
    fx = (px - (gt[0] + hx))/gt[1]
    fy = (py - (gt[3] + hy))/gt[5]
    ix1 = int(floor(fx))
    iy1 = int(floor(fy))
    # Special case where point is on upper bounds
    if fx == float(nx - 1):
        ix1 -= 1
    if fy == float(ny - 1):
        iy1 -= 1
    # Upper bound indices on raster
    ix2 = ix1 + 1
    iy2 = iy1 + 1
    # Test array bounds to ensure point is within raster midpoints
    if (ix1 < 0) or (iy1 < 0) or (ix2 > nx - 1) or (iy2 > ny - 1):
        return no_data
    # Calculate differences from point to bounding raster midpoints
    dx1 = px - (gt[0] + ix1*gt[1] + hx)
    dy1 = py - (gt[3] + iy1*gt[5] + hy)
    dx2 = (gt[0] + ix2*gt[1] + hx) - px
    dy2 = (gt[3] + iy2*gt[5] + hy) - py
    # Use the differences to weigh the four raster values
    div = gt[1]*gt[5]
    return (band_array[iy1,ix1]*dx2*dy2/div +
            band_array[iy1,ix2]*dx1*dy2/div +
            band_array[iy2,ix1]*dx2*dy1/div +
            band_array[iy2,ix2]*dx1*dy1/div)

请注意,由于返回到NumPy的dtype('float64')数据类型,结果将以明显比源数据更高的精度返回。您可以使用返回值with .astype(band_array.dtype)来使输出数据类型与输入数组相同。

双线性插值公式


3

我在本地尝试了类似的结果,但是我使用的是64位平台,因此没有达到内存限制。也许像这样尝试一次插值数组的小块。

您也可以使用GDAL进行此操作,在命令行中将是:

gdalwarp -ts $XSIZE*2 0 -r bilinear input.tif interp.tif

要在Python中执行等效操作,请使用ReprojectImage()

mem_drv = gdal.GetDriverByName('MEM')
dest = mem_drv.Create('', nx, ny, 1)

resample_by = 2
dt = (gt[0], gt[1] * resample_by, gt[2], gt[3], gt[4], gt[5] * resample_by)
dest.setGeoTransform(dt)

resampling_method = gdal.GRA_Bilinear    
res = gdal.ReprojectImage(source, dest, None, None, resampling_method)

# then, write the result to a file of your choice...    

我想插入的点数据没有规则的间距,因此我无法使用GDAL的内置ReprojectImage技术。
Mike T

1

我过去曾遇到过确切的问题,但从未使用interpolate.interp2d解决它。我已经成功使用scipy.ndimage.map_coordinates。请尝试以下操作:

scipy.ndimage.map_coordinates(band_array,[ax,ay]],order = 1)

这似乎提供与双线性相同的输出。


我对此有些不满意,因为我不确定如何使用源栅格坐标(而不是使用像素坐标)。我看到它是“矢量化”的,可以解决很多问题。
迈克T

同意,我不太了解scipy。您的numpy解决方案要好得多。
马修·斯内普

0

scipy.interpolate.interp2d()在使用更现代的scipy时可以正常工作。我认为较旧的版本采用不规则网格,而没有利用常规网格。我收到与您使用scipy相同的错误。版本 = 0.11.0,但使用scipy。版本 = 0.14.0,它可以在1600x1600模型输出上愉快地工作。

感谢您提出问题的提示。

#!/usr/bin/env python

from osgeo import gdal
from numpy import array
import argparse

parser = argparse.ArgumentParser()
parser.add_argument("filename",help='raster file from which to interpolate a (1/3,1/3) point from from')
args = parser.parse_args()

# Read raster
source = gdal.Open(args.filename)
nx, ny = source.RasterXSize, source.RasterYSize
gt = source.GetGeoTransform()
band_array = source.GetRasterBand(1).ReadAsArray()
# Close raster
source = None

# Compute mid-point grid spacings
ax = array([gt[0] + ix*gt[1] + gt[1]/2.0 for ix in range(nx)])
ay = array([gt[3] + iy*gt[5] + gt[5]/2.0 for iy in range(ny)])

from scipy import interpolate
bilinterp = interpolate.interp2d(ax, ay, band_array, kind='linear')

x1 = gt[0] + gt[1]*nx/3
y1 = gt[3] + gt[5]*ny/3.

print(nx, ny, x1,y1,bilinterp(x1,y1))

####################################

$ time ./interp2dTesting.py test.tif 
(1600, 1600, -76.322, 30.70889, array([-8609.27777778]))

real    0m4.086s
user    0m0.590s
sys 0m0.252s
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.