답변:

  • 대부분의 히트는 애플리케이션이 아닌 캐시 레이어가 처리한다.
  • 애플리케이션은 초당 50,000 쿼리 정도만 생성한다.
  • 위키피디아 DB는 크게 “core” 와 “text storage” 로 구분한다.
  • “core” DB는 모든 메타데이터를 가진 곳이다.
    • 6개의 샤드.
    • 언어별로 구분. (그래서 request 가 여러 샤드를 읽어야 하는 경우는 정말 드물다)
    • 전부 500G 이하다.
    • 각 샤드의 활성 dataset 은 64GB 안에 fit 한다.
  • “text storage”
    • 변경사항을 담는 저장소인데. 이건 key-value 스토리지가 유리할지 모르겠다.
    • 하지만 우린 그냥 MySQL 쓴다.

http://www.quora.com/Wikipedia/Why-does-Wikipedia-use-MySQL-as-data-store-rather-than-a-NoSQL-database