万维网的最大站点在哪些数据库上运行?[关闭]


67

该问题旨在作为主要网站使用的数据库及其配置的列表,对于任何想将其网站扩展到Twitter,Facebook甚至Google规模的人来说,都是一个很好的参考。

请尽量减少您的回答,并确保引用使用的任何资料。

编辑:

另外,请同时加粗网站名称和数据库,以方便扫描。


2
令我惊讶的是,除了如下所述的linkedIn之外,大多数大型著名站点都没有使用Oracle。是因为许可费用还是某些特定的缺点?
辛格

1
如果一个问题是否正确关闭,社区应该能够投票。
JordanBelf 2015年


相关阅读8bitmen.com/…–
弱者

Answers:


26

Facebook.com

  • MySQL与MyRocks。用于存储用户信息和社交活动,例如喜欢,评论和分享。
  • Hive(用于Hadoop的数据仓库,支持表和称为hiveQL的SQL变体)。用于“简单的摘要作业,商业智能和机器学习以及许多其他应用程序”
  • Cassandra(多维的分布式键值存储)。当前用于Facebook的私人消息传递。

当前具有Hive数据存储的单个群集中正在运行610个(即将达到1000个)Hadoop节点。Hive和Cassandra均已由Facebook开源。

Facebook统计:

  • 超过2亿活跃用户
  • 每天至少有1亿用户至少登录一次Facebook
  • 每天至少有3000万用户更新其状态
  • 平均用户在网站上有120个朋友

资料来源:



15

LinkedIn.com

  • Oracle(关系数据库)
  • MySQL(关系数据库)

数据库在多个服务器上复制以实现高可用性。每个特定的服务使用其自己的特定于域的数据库。

领英统计:

  • 2200万会员
  • 每月4+百万独立访客
  • 每天4000万页面浏览量
  • 每天200万次搜索

资料来源:


1
从那以后,LinkedIn已迁移到Voldemort(Dynamo的键/值实现)
David Simons 2014年

13

Flickr使用MySQL

YouTube使用MySQL,但他们正在迁移到Google的BigTable

Myspace使用SQL Server

维基百科使用MySQL


3
这是否意味着他们有一台数据库服务器处理着万事万物?怎么不炸?
bigpotato 2014年


11

Yahoo.com

  • PostgreSQL(已修改)-客户端可以连接到集群中的任何节点(或受策略限制的子集)。查询从客户端流向它选择连接的服务器。该节点上的SQL编译器可编译和优化该单个节点上的查询(无并行性)。

Yahoo.com统计:

  • 每天240亿个事件
  • 2 PB,声称是最大的数据库(2008年3月)

资源:


1
它被描述为“结构化数据,而不是像电子邮件和其他文档这样的非结构化数据。” 数据副总裁哈桑补充说:“这是从广告角度和消费者体验角度来说,人们如何使用我们的网站。”
KahWee Teng

9

Twitter.com

  • MySQL(关系数据库)。
  • Cassandra(多维的分布式键值存储)。Twitter只是“开始在Twitter上使用Cassandra”(请参阅​​第二个来源)。

在2008年5月,Twitter拥有1个用于写入的MySQL实例和多个用于读取的MySQL从属实例。

Twitter统计:

  • 总用户:1+百万
  • 活跃用户总数:每周200,000
  • Twitter消息总数:300万/天
  • 5%的Twitter用户占所有活动的75%
  • 在2009年的前五个月中,有72.5%的用户加入

资料来源:


9

掘客

  • MySQL(关系数据库)用于扩展读取
  • MemcacheDB(键值存储),用于扩展写入

这两个数据存储都分布在多个服务器上。

Digg统计:

  • 3000万用户
  • 每月26M独特身份
  • 每月20亿个请求
  • 13,000请求/秒,高峰时为27,000请求/秒。

资料来源:


Digg最近将“绿色徽章”功能迁移到了cassandra:blog.digg.com/?p=966
Vladimir,2009年


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.