왜 Wikipedia 는 NoSQL 대신 MySQL 을 사용하나요?
답변:
- 대부분의 히트는 애플리케이션이 아닌 캐시 레이어가 처리한다.
- 애플리케이션은 초당 50,000 쿼리 정도만 생성한다.
- 위키피디아 DB는 크게 “core” 와 “text storage” 로 구분한다.
- “core” DB는 모든 메타데이터를 가진 곳이다.
- 6개의 샤드.
- 언어별로 구분. (그래서 request 가 여러 샤드를 읽어야 하는 경우는 정말 드물다)
- 전부 500G 이하다.
- 각 샤드의 활성 dataset 은 64GB 안에 fit 한다.
- “text storage”
- 변경사항을 담는 저장소인데. 이건 key-value 스토리지가 유리할지 모르겠다.
- 하지만 우린 그냥 MySQL 쓴다.