[스터디9] 02. 개략적인 규모 추정

Notice

Recent Posts

Tags more

Archives

관리 메뉴

군만두의 IT 개발 일지

학습일지/시스템 설계

mandus 2025. 6. 20. 22:29

시스템 설계 면접에서는 시스템 용량이나 성능 요구사항을 개략적으로 추정해보라는 요구를 받게 된다.

개략적인 규모 추정(back-of-the-envelope esti-mation): 보편적으로 통용되는 성능 수치상에서 사고 실험을 행하여 추정치를 계산하는 행위로서, 어떤 설계가 요구사항에 부합할 것인지 보기 위한 것

개략적 규모 추정을 효과적으로 하려면 2의 제곱수나 응답지연(latency) 값, 그리고 가용성에 관계된 수치들을 기본적으로 잘 이해하고 있어야 한다.

분산 시스템에서 다루는 데이터 양은 엄청나게 커질 수 있으나, 계산법은 기본을 크게 벗어나지 않는다. 데이터 볼륨의 단위를 2의 제곱수로 표현하면 어떻게 되는지를 우선 알아야 한다.

데이터 볼륨 단위

구글의 제프 딘(Jeff Dean)이 2010년에 공개한 통상적인 컴퓨터에서 구현된 연산들의 응답지연 값이다. 더 빠른 컴퓨터가 등장하면서 일부는 유효하지 않지만, 아직도 이 수치들을 통해 컴퓨터 연산들의 처리 속도를 짐작할 수 있다.

주요 연산별 응답지연 시간

제시된 수치 분석 결과

고가용성(high availability): 시스템이 오랜 시간 동안 지속적으로 중단 없이 운영될 수 있는 능력
고가용성을 표현하는 값은 퍼센트로 표현하는데, 100%는 시스템이 한 번도 중단된 적이 없었음을 의미한다. 대부분의 서비스는 99~100%의 값을 갖는다.
SLA(Service Level Agreement): 서비스 사업자와 고객 사이에 맺어진 합의로, 서비스 사업자가 제공하는 서비스의 가용시간이 공식적으로 기술되어 있다. 대부분의 클라우드 사업자들은 99% 이상의 SLA를 제공한다.

가용성 수치별 장애 허용 시간

개략적인 규모 추정과 관계된 면접에서 가장 중요한 것은 문제를 풀어 나가는 절차다. '결과를 내는 것'보다 '올바른 절차를 밟느냐'가 중요하다.

근사치를 활용한 계산(rounding and approximation): 면접장에서 복잡한 계산을 하는 것은 시간 낭비다. 적절한 근사치를 활용하여 시간을 절약하자.
- 예) 99,987 ÷ 9.8 ≈ 100,000 ÷ 10 = 10,000
가정(assumption)들은 적어두라: 나중에 살펴볼 수 있도록 기록해두자.
단위(unit)를 붙이는 습관: 모호함을 방지할 수 있다.
많이 출제되는 문제들: QPS, 최대 QPS, 저장소 요구량, 캐시 요구량, 서버 수 등을 추정하는 연습을 미리 하도록 하자.

✔️ 복습하기

이 글은 『 가상 면접 사례로 배우는 대규모 시스템 설계 기초』 책을 학습한 내용을 정리한 것입니다.