我在我的虚拟实例上运行了Apache Geoserver,但我想知道Geoserver数据目录是否可以指向Amazon S3存储桶。这可能吗?这如何影响性能?
如果S3对于Geoserver的数据目录设置不佳,是否有建议将大量数据添加到我的Geoserver数据目录中?数据目录可能达到100 GB,甚至更多。我应该只购买一台具有大型硬盘的服务器,还是连接到更具扩展性的解决方案(如Amazon S3存储桶)?
我在我的虚拟实例上运行了Apache Geoserver,但我想知道Geoserver数据目录是否可以指向Amazon S3存储桶。这可能吗?这如何影响性能?
如果S3对于Geoserver的数据目录设置不佳,是否有建议将大量数据添加到我的Geoserver数据目录中?数据目录可能达到100 GB,甚至更多。我应该只购买一台具有大型硬盘的服务器,还是连接到更具扩展性的解决方案(如Amazon S3存储桶)?
Answers:
“直接”指向S3存储桶(例如,使用s3fs)“可能”是个坏主意。例如/programming/10801158/how-stable-is-s3fs-to-mount-an-amazon-s3-bucket-as-a-local-directory
EBS几乎可以肯定是存储数据以供GeoServer访问的正确位置。
根据EBS标准,非常容易管理100 GB。(最大卷大小为16 TB!)
我可能建议将原始数据存储在S3中,然后根据需要使用AWS CLI工具将S3文件夹的内容同步到本地实例,并复制到您的实例上。http://docs.aws.amazon.com/cli/latest/reference/s3/sync.html)。S3可以说是多余的,但我发现它增加了灵活性和便利性。
注意:如果您打算使用大型多核实例,并且您知道数据量不可能意外增长并且能够自动构建实例,则可以考虑使用实例存储(“临时存储” ),因为您的原始数据在S3中是安全的,因此您可以节省EBS费用,并且在某些情况下实例存储的速度可能比EBS稍快。
这是可能的: 这可以是适合于使用利用Geoserver S3为社区的GeoTIFF模块的GeoTIFF格式的数据来容易地实现- https://docs.geoserver.org/latest/en/user/community/s3-geotiff/index .html
这如何影响性能? 这很难回答,但是,我发现性能只相当于EBS / EFS存储的一部分,而价格却只是它的一小部分。