程序设计 database-performance

15

MySQL数据库什么时候开始失去性能？物理数据库的大小重要吗？记录数量重要吗？性能下降是线性的还是指数的？我拥有一个大型数据库，大约有1500万条记录，几乎占用2GB。根据这些数字，是否有激励我清理数据，还是我可以放心地将其继续扩展几年？

302 mysql database database-performance

5

我正在做一个处理结构化文档数据库的项目。我有一棵类别树（〜1000个类别，每个级别上多达〜50个类别），每个类别包含数千个（最多，例如〜10000个）结构化文档。每个文档都是某种结构化形式的几千字节的数据（我更喜欢YAML，但也可能是JSON或XML）。该系统的用户执行几种类型的操作：通过ID检索这些文档通过文档中的某些结构化属性搜索文档编辑文件（即添加/删除/重新命名/合并）；每个编辑操作都应记录为带有一些注释的事务查看特定文档记录的更改的历史记录（包括查看更改文档的人员，时间和原因，获取较早的版本-如果需要，可以还原为该版本）当然，传统解决方案将使用某种文档数据库（例如CouchDB或Mongo）来解决此问题-但是，此版本控制（历史记录）使我产生了一个疯狂的主意-为什么我不应该将git存储库用作此应用程序的数据库后端？乍一看，可以这样解决：类别=目录，文档=文件通过ID获取文档=>更改目录+读取工作副本中的文件使用编辑注释编辑文档=>由不同的用户进行提交+存储提交消息历史=>正常的git日志和旧事务的检索 search =>这是一个比较棘手的部分，我想这需要定期将类别导出到关系数据库中，并为列提供索引，以便我们通过此解决方案还有其他常见陷阱吗？有没有人尝试过实现这样的后端（例如，对于任何流行的框架-RoR，node.js，Django，CakePHP）？该解决方案是否会对性能或可靠性产生任何潜在影响？即，是否证明git会比传统数据库解决方案慢得多，或者存在任何可伸缩性/可靠性陷阱？我认为，这种推/拉彼此的存储库的服务器集群应该相当健壮和可靠。基本上，告诉我，如果这个解决方案将工作和为什么它会或不会做？

119 database git database-performance database-replication document-database

1

如何配置MongoDB Java驱动程序MongoOptions以用于生产？

我一直在网上搜索有关为MongoDB Java驱动程序配置MongoOptions的最佳实践，除了API之外，我还没有提出其他建议。在我遇到“ com.mongodb.DBPortPool $ SemaphoresOut：信号量不足以获取数据库连接”错误之后，此搜索开始了，并且通过增加连接数/乘数，我能够解决该问题。我正在寻找配置这些选项的链接或您的最佳实践。 2.4驱动程序的选项包括：http : //api.mongodb.org/java/2.4/com/mongodb/MongoOptions.html autoConnectRetry connectionsPerHost connectTimeout maxWaitTime socketTimeout threadsAllowedToBlockForConnectionMultiplier 较新的驱动程序具有更多选择，我也将有兴趣了解这些。

100 mongodb production-environment database-performance database-tuning

Questions tagged «database-performance»