我知道https://wiki.apache.org/hadoop/AmazonS3的存在以及以下词语:
S3本机文件系统(URI方案:s3n)用于在S3上读写常规文件的本机文件系统。该文件系统的优点是您可以访问S3上用其他工具编写的文件。相反,其他工具可以访问使用Hadoop编写的文件。缺点是S3施加的文件大小限制为5GB。
S3A(URI方案:s3a)S3a:系统是S3本机s3n fs的后继产品,它使用Amazon的库与S3进行交互。这使S3a支持更大的文件(没有更多的5GB限制),更高性能的操作等等。文件系统旨在替代S3本机/作为S3本机的继任者:通过替换URL模式,从s3n:// URL可访问的所有对象也应可从s3a访问。
S3块文件系统(URI方案:s3)由S3支持的基于块的文件系统。文件存储为块,就像它们在HDFS中一样。这样可以有效地执行重命名。此文件系统要求您为文件系统专用存储桶-您不应使用包含文件的现有存储桶,也不应将其他文件写入同一存储桶。该文件系统存储的文件可以大于5GB,但不能与其他S3工具互操作。
为什么URI上的字母更改会产生这种变化?例如
val data = sc.textFile("s3n://bucket-name/key")
至
val data = sc.textFile("s3a://bucket-name/key")
此更改的技术差异是什么?有什么好的文章可以阅读吗?
s3a
方案从EMR作业写信给S3 。答案可能需要修改。