Answers:
几千兆字节不是很大。它更像是企业数据库的正常大小。只要您在连接表时检查PK,即使在将来(只要您一天不会获得TB的数据),它也应该能很好地工作。
在大数据环境中工作的大多数专业人员都将大于5TB作为大数据一词的开头。但是即使那样,也不总是安装次佳的nosql数据库的最佳方法。您应该始终考虑要与数据一起归档的任务(汇总,读取,搜索,挖掘,..),以找到解决问题的最佳工具。
即,如果您在数据库中进行了大量搜索,则可能最好运行一个solr实例/群集并不时将来自DBMS(如Postgres或SQL Server)的数据进行非规范化,然后将其放入solr中,而不是仅移动数据在持久性和性能方面从sql到nosql。
大数据实际上并不是关于“大数据量”。
首先,几GB根本就不大,几乎没有。因此,请勿打扰您,我认为您的系统将继续有效运行一段时间。
然后,您必须考虑如何使用数据。
如果您的应用程序使用存储的“功能性”数据,我建议您继续使用SQL。如果您存储数据是为了以后进行搜索或进行报告,并且此数据量可能会快速增加,那么我建议您使用大数据。我认为,当您处理必须连续收集和分析的真实数据时,大数据很有用。
我在stackoverflow上发布了一个非常详细的答案,关于何时使用关系vs文档(或NoSQL)数据库是合适的,在这里:
摘要: