2. 단일 vs 복합 vs 커버링 인덱스, 언제 어떻게 써야 할까?

Notice

Recent Posts

Recent Comments

Link

« 2026/07 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

군만두의 IT 개발 일지

2. 단일 vs 복합 vs 커버링 인덱스, 언제 어떻게 써야 할까? 본문

학습일지/CS

2. 단일 vs 복합 vs 커버링 인덱스, 언제 어떻게 써야 할까?

mandus 2025. 7. 27. 20:53

책 '주니어 백엔드 개발자가 반드시 알아야 할 실무 지식' 3장을 읽고, 데이터베이스 성능 최적화를 위해서 인덱스에 대해 공부했다. 단일 인덱스부터 복합 인덱스, 그리고 커버링 인덱스까지 언제 어떻게 활용해야 하는지 정리하려고 한다.

1. 인덱스가 필요한 이유

DB 서버 성능 문제의 주요 원인 중 하나는 풀 스캔이다. 호출 빈도가 높은 기능에 풀 스캔을 유발하는 쿼리가 있으면 사용자가 조금만 증가해도 DB 장비의 CPU 사용률이 90%를 넘긴다. DB에 문제가 생기면 전체 서비스에 영향을 주기 때문에 신경써야 한다.

풀 스캔: 테이블의 모든 데이터를 순차적으로 읽는 것
일반적인 시스템에서는 조회 기능의 실행 비율이 높다. (게시판 - 게시글 조회)
풀 스캔이 발생하지 않도록 하려면 조회 패턴을 기준으로 인덱스를 설계해야 한다.

책에서 나오는것과 같은 article 테이블을 예로 들어보자.

JPA Repository에서 다음과 같은 메서드들은 인덱스 없이 실행하면 풀 스캔이 발생한다.

@Repository
public interface ArticleRepository extends JpaRepository<Article, Long> {
    // 카테고리별 게시글 조회 -> 풀 스캔
    List<Article> findByCategory(Integer category);
    
    // 특정 작성자의 글 조회 -> 풀 스캔
    List<Article> findByWriterId(Long writerId);
    
    // 카테고리별 최신 글 조회 -> 성능 문제
    List<Article> findByCategoryOrderByRegdtDesc(Integer category);
}

2. 단일 인덱스

단일 인덱스: 하나의 컬럼에만 만드는 가장 기본적인 인덱스

게시판에서 카테고리별 게시글 목록 조회하는 패턴이 존재하므로 category 컬럼에 인덱스를 추가해서 조회 성능을 개선할 수 있다.

-- 카테고리 조회용 단일 인덱스
CREATE INDEX idx_article_category ON article(category);

-- 작성자 조회용 단일 인덱스 (내가 작성한 글 목록 보기용)
CREATE INDEX idx_article_writer_id ON article(writerId);

// JPA에서 인덱스 설정
@Entity
@Table(name = "article", indexes = {
    @Index(name = "idx_article_category", columnList = "category"),
    @Index(name = "idx_article_writer_id", columnList = "writerId")
})
public class Article {
    @Id
    @GeneratedValue(strategy = GenerationType.IDENTITY)
    private Long id;
    
    private Integer category;
    private Long writerId;
    private String title;
    
    @Lob
    private String content;
    
    private LocalDateTime regdt;
}

단일 인덱스의 특징

장점:
- 구현이 간단하고 이해하기 쉽다.
- 메모리 사용량이 적다.
- 단일 조건 쿼리에서 성능이 빠르다.
단점:
- 복합 조건 쿼리에서는 효과가 제한적이다.
- 여러 인덱스를 조합해서 사용할 때 비효율적일 수 있다.

3. 복합 인덱스

복합 인덱스: 여러 컬럼을 조합해서 만드는 인덱스
여러 조건을 함께 사용하는 쿼리나 WHERE + ORDER BY 조합에 효과적이다.

실제 서비스에서는 다음과 같은 복합 조건의 쿼리가 필요하다.

// 카테고리별 최신 글 조회 (WHERE + ORDER BY)
List<Article> findByCategoryOrderByRegdtDesc(Integer category);

// 특정 작성자의 특정 카테고리 글 조회 (WHERE + WHERE)
@Query("SELECT a FROM Article a WHERE a.category = :category AND a.writerId = :writerId")
List<Article> findByCategoryAndWriterId(@Param("category") Integer category, 
                                       @Param("writerId") Long writerId);

-- 카테고리 + 등록일 복합 인덱스 (정렬 쿼리 최적화)
CREATE INDEX idx_article_category_regdt ON article(category, regdt);

-- 카테고리 + 작성자 복합 인덱스 (복합 조건 최적화)
CREATE INDEX idx_article_category_writer ON article(category, writerId);

선택도를 고려한 인덱스 컬럼 선택

선택도(Selectivity): 인덱스에서 특정 컬럼의 고유한 값 비율
선택도를 고려해서 컬럼 순서를 결정해야 한다.

-- 선택도 분석
SELECT 
    COUNT(DISTINCT category) / COUNT(*) as category_selectivity,
    COUNT(DISTINCT writerId) / COUNT(*) as writer_selectivity,
    COUNT(DISTINCT title) / COUNT(*) as title_selectivity
FROM article;

Q. 항상 선택도가 높은 컬럼을 앞에 둬야 할까?

: 아니다. 선택도도 중요하지만 실제 쿼리 패턴이 더 중요하다. 작업 큐를 구현한 테이블처럼 선택도가 낮아도 인덱스 컬럼으로 적합한 상황도 있다. 예를 들어 status 컬럼이 PENDING, PROCESSING, COMPLETED 3개 값만 가져서 선택도가 낮지만, PENDING 상태의 작업만 주로 조회한다면 유효한 인덱스가 된다.

복합 인덱스에서 컬럼 순서

복합 인덱스는 전화번호부와 비슷하다. 전화번호부는 "성 → 이름" 순으로 정렬되어 있어서, "김"씨를 찾기는 쉽지만 "철수"라는 이름으로 찾기는 어렵다.

-- 좋은 예: WHERE 조건에 자주 쓰이는 컬럼을 앞에
CREATE INDEX idx_good ON article(category, regdt);

-- 나쁜 예: ORDER BY에만 쓰이는 컬럼을 앞에
CREATE INDEX idx_bad ON article(regdt, category);

4. 커버링 인덱스

커버링 인덱스: 특정 쿼리를 실행하는 데 필요한 컬럼을 모두 포함하는 인덱스

커버링 인덱스를 사용하면 실제 데이터를 읽지 않기 때문에 조회 시간을 단축할 수 있다. 게시글 목록 페이지에서는 보통 모든 데이터가 아니라 일부 정보만 필요하다.

// 목록용 DTO 설계
public class ArticleSummaryDto {
    private Long id;
    private String title;
    private Long writerId;
    private LocalDateTime regdt;
    
    public ArticleSummaryDto(Long id, String title, Long writerId, LocalDateTime regdt) {
        this.id = id;
        this.title = title;
        this.writerId = writerId;
        this.regdt = regdt;
    }
}

// DTO 프로젝션을 활용한 최적화된 쿼리
@Query("SELECT new com.example.dto.ArticleSummaryDto(a.id, a.title, a.writerId, a.regdt) " +
       "FROM Article a WHERE a.category = :category ORDER BY a.regdt DESC")
Page<ArticleSummaryDto> findArticleSummaryByCategory(
    @Param("category") Integer category, 
    Pageable pageable
);

-- 목록 조회에 필요한 모든 컬럼을 포함한 커버링 인덱스
CREATE INDEX idx_article_covering ON article(category, regdt, id, title, writerId);

커버링 인덱스는 다음과 같은 상황에서 사용한다.

목록 조회처럼 일부 컬럼만 필요한 경우
COUNT나 집계 쿼리
페이징 처리 시 성능 최적화

// COUNT 쿼리도 커버링 인덱스로 최적화 가능
@Query("SELECT COUNT(a) FROM Article a WHERE a.category = :category")
Long countByCategory(@Param("category") Integer category);

// 통계 조회
@Query("SELECT a.category, COUNT(a), MAX(a.regdt) " +
       "FROM Article a GROUP BY a.category")
List<Object[]> getArticleStats();

5. 인덱스 운영 전략

인덱스는 필요한 만큼만 만들기

인덱스 자체도 데이터이기 때문에 인덱스가 많아질수록 메모리와 디스크 사용량도 함께 증가한다.

// 나쁜 예: 과도한 인덱스 생성
@Table(name = "article", indexes = {
    @Index(name = "idx1", columnList = "category"),
    @Index(name = "idx2", columnList = "writerId"), 
    @Index(name = "idx3", columnList = "regdt"),
    @Index(name = "idx4", columnList = "category, writerId"),
    @Index(name = "idx5", columnList = "category, regdt"),
    // 너무 많은 인덱스는 메모리 낭비와 INSERT/UPDATE 성능 저하
})

// 좋은 예: 효율적인 인덱스 설계
@Table(name = "article", indexes = {
    @Index(name = "idx_category_covering", columnList = "category, regdt, id, title, writerId"),
    @Index(name = "idx_writer_date", columnList = "writerId, regdt")
    // 대부분의 쿼리 패턴을 커버하는 2개의 효율적인 인덱스
})

요구사항 조정을 통한 최적화

새로 추가할 쿼리가 기존에 존재하는 인덱스를 사용하지 않을 때는 요구사항을 일부 변경할 수 있는지 검토해보자. 작은 변경만으로 인덱스를 활용할 수 있다.

// 이전 요구사항: 복잡한 다중 조건 검색
@Query("SELECT a FROM Article a WHERE " +
       "(a.category = :category OR :category IS NULL) AND " +
       "(a.writerId = :writerId OR :writerId IS NULL) AND " +
       "(a.title LIKE %:keyword% OR :keyword IS NULL)")
List<Article> complexSearch(Integer category, Long writerId, String keyword);

// 변경된 요구사항: 단계별 검색으로 기존 인덱스 활용
// 1단계: 카테고리로 1차 필터링
// 2단계: 작성자로 2차 필터링  
// 3단계: 제목 검색은 별도 기능으로 분리

Q. 동일한 효율을 보이는 인덱스는 왜 피해야 할까?

: 인덱스는 INSERT, UPDATE, DELETE 할 때마다 함께 업데이트되어야 한다. 불필요한 인덱스가 많으면 쓰기 성능이 저하되고 메모리도 낭비된다. 또한 옵티마이저가 잘못된 인덱스를 선택할 가능성도 높아진다.

참고 자료

이성욱, "Real MySQL 8.0", 위키북스, 2021

이 글은 『 주니어 백엔드 개발자가 반드시 알아야 할 실무 지식』 책을 읽고 학습한 내용을 정리한 것입니다.

저작자표시 비영리 변경금지 (새창열림)

'학습일지 > CS' 카테고리의 다른 글

3. 외부 서비스 연동 안정성: 타임아웃, 재시도, 서킷 브레이커 (2)	2025.08.06
[스터디11] 1. 컴퓨터 구조 (3)	2025.08.01
1. 캐시와 CDN이란? (0)	2025.07.05
[스터디3] 디자인 패턴 - 09. 디자인 패턴과 프로그래밍 패러다임 (0)	2025.01.18
[스터디3] 자료구조 - 08. 비선형 자료 구조 (0)	2025.01.12

'학습일지/CS' Related Articles

Comments

군만두의 IT 개발 일지

2. 단일 vs 복합 vs 커버링 인덱스, 언제 어떻게 써야 할까? 본문

2. 단일 vs 복합 vs 커버링 인덱스, 언제 어떻게 써야 할까?

1. 인덱스가 필요한 이유

2. 단일 인덱스

단일 인덱스의 특징

3. 복합 인덱스

선택도를 고려한 인덱스 컬럼 선택

Q. 항상 선택도가 높은 컬럼을 앞에 둬야 할까?

복합 인덱스에서 컬럼 순서

4. 커버링 인덱스

5. 인덱스 운영 전략

인덱스는 필요한 만큼만 만들기

요구사항 조정을 통한 최적화

Q. 동일한 효율을 보이는 인덱스는 왜 피해야 할까?

참고 자료

'학습일지 > CS' 카테고리의 다른 글

티스토리툴바