Java Stream API | filter, map, reduce 완벽 정리
이 글의 핵심
Java Stream API: filter, map, reduce Stream 생성·중간 연산 (Intermediate Operations).
들어가며
Stream API는 Java 8에서 도입된 함수형 스타일로 컬렉션을 처리하는 도구입니다.
비유(컨베이어 벨트): 리스트·배열의 요소가 컨베이어 벨트 위를 지나가며 filter로 걸러지고 map으로 바뀌고, 마지막에 collect 등으로 최종 연산에서 꺼내 담습니다. 한 번 소비한 스트림은 다시 쓸 수 없다는 점도, 벨트 끝까지 간 물건을 같은 줄로 두 번 보낼 수 없다고 이해하시면 됩니다.
실전 경험에서 배운 교훈
이 기술을 실무 프로젝트에 처음 도입했을 때, 공식 문서만으로는 알 수 없었던 많은 함정들이 있었습니다. 특히 프로덕션 환경에서 발생하는 엣지 케이스들은 로컬 개발 환경에서는 재현조차 되지 않았죠.
가장 어려웠던 점은 성능 최적화였습니다. 처음엔 “동작만 하면 되겠지”라고 생각했지만, 실제 사용자 트래픽이 몰리면서 병목 지점들이 하나씩 드러났습니다. 특히 데이터베이스 쿼리 최적화, 캐싱 전략, 에러 핸들링 구조 등은 여러 번의 장애를 겪으면서 개선해 나갔습니다.
이 글에서는 그런 시행착오를 통해 얻은 실전 노하우와, “이렇게 하면 안 된다”는 교훈들을 함께 정리했습니다. 특히 트러블슈팅 섹션은 실제 장애 대응 경험을 바탕으로 작성했으니, 비슷한 문제를 마주했을 때 참고하시면 도움이 될 것입니다.
1. Stream 생성
다양한 생성 방법
import java.util.*;
import java.util.stream.*;
// 컬렉션에서
List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5);
Stream<Integer> stream1 = numbers.stream();
// 배열에서
String[] arr = {"a", "b", "c"};
Stream<String> stream2 = Arrays.stream(arr);
// 직접 생성
Stream<String> stream3 = Stream.of("a", "b", "c");
// 빈 스트림
Stream<String> empty = Stream.empty();
// 무한 스트림
Stream<Integer> infinite = Stream.iterate(0, n -> n + 1);
Stream<Double> random = Stream.generate(Math::random);
// 범위
IntStream range = IntStream.range(1, 10); // 1~9
IntStream rangeClosed = IntStream.rangeClosed(1, 10); // 1~10
2. 중간 연산 (Intermediate Operations)
filter - 필터링
조건에 맞는 요소만 선택하는 중간 연산입니다:
List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5, 6, 7, 8, 9, 10);
// filter: 조건을 만족하는 요소만 통과
// n -> n % 2 == 0: 람다 표현식 (짝수 판별)
// collect: 최종 연산, Stream을 List로 변환
List<Integer> evens = numbers.stream()
.filter(n -> n % 2 == 0) // 짝수만 필터링
.collect(Collectors.toList());
System.out.println(evens); // [2, 4, 6, 8, 10]
// 여러 filter 체이닝 가능
// 각 filter는 순차적으로 적용됨
List<Integer> filtered = numbers.stream()
.filter(n -> n > 3) // 3보다 큰 수 [4, 5, 6, 7, 8, 9, 10]
.filter(n -> n < 8) // 8보다 작은 수 [4, 5, 6, 7]
.collect(Collectors.toList());
System.out.println(filtered); // [4, 5, 6, 7]
// 복잡한 조건
List<Integer> complex = numbers.stream()
.filter(n -> n % 2 == 0 && n > 5) // 5보다 큰 짝수
.collect(Collectors.toList());
System.out.println(complex); // [6, 8, 10]
filter의 동작 원리:
- Stream의 각 요소에 대해 조건 함수(Predicate) 실행
- 조건이 true인 요소만 다음 단계로 전달
- 조건이 false인 요소는 제거됨
- 원본 컬렉션은 변경되지 않음 (불변성)
map - 변환
// 2배로
List<Integer> doubled = numbers.stream()
.map(n -> n * 2)
.collect(Collectors.toList());
// 문자열로
List<String> strings = numbers.stream()
.map(n -> "숫자: " + n)
.collect(Collectors.toList());
// 객체 변환
class User {
String name;
int age;
User(String name, int age) {
this.name = name;
this.age = age;
}
}
List<User> users = Arrays.asList(
new User("홍길동", 25),
new User("김철수", 30)
);
List<String> names = users.stream()
.map(u -> u.name)
.collect(Collectors.toList());
flatMap - 평탄화
List<List<Integer>> nested = Arrays.asList(
Arrays.asList(1, 2),
Arrays.asList(3, 4),
Arrays.asList(5, 6)
);
List<Integer> flattened = nested.stream()
.flatMap(list -> list.stream())
.collect(Collectors.toList());
System.out.println(flattened); // [1, 2, 3, 4, 5, 6]
distinct, sorted, limit, skip
List<Integer> numbers = Arrays.asList(3, 1, 4, 1, 5, 9, 2, 6, 5);
// 중복 제거
List<Integer> unique = numbers.stream()
.distinct()
.collect(Collectors.toList());
// 정렬
List<Integer> sorted = numbers.stream()
.sorted()
.collect(Collectors.toList());
// 역순 정렬
List<Integer> reversed = numbers.stream()
.sorted(Comparator.reverseOrder())
.collect(Collectors.toList());
// 상위 3개
List<Integer> top3 = numbers.stream()
.sorted(Comparator.reverseOrder())
.limit(3)
.collect(Collectors.toList());
// 처음 2개 건너뛰기
List<Integer> skipped = numbers.stream()
.skip(2)
.collect(Collectors.toList());
3. 최종 연산 (Terminal Operations)
reduce - 집계
Stream의 요소들을 하나의 값으로 줄이는(reduce) 연산입니다:
List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5);
// reduce: 누적 연산
// 첫 번째 인자(0): 초기값 (identity)
// 두 번째 인자: 누적 함수 (accumulator)
// a: 누적값, b: 현재 요소
int sum = numbers.stream()
.reduce(0, (a, b) -> a + b);
// 동작 과정:
// 1. a=0 (초기값), b=1 → 0+1=1
// 2. a=1 (이전 결과), b=2 → 1+2=3
// 3. a=3, b=3 → 3+3=6
// 4. a=6, b=4 → 6+4=10
// 5. a=10, b=5 → 10+5=15
System.out.println(sum); // 15
// 곱셈: 초기값을 1로 설정
int product = numbers.stream()
.reduce(1, (a, b) -> a * b);
// 1 * 1 * 2 * 3 * 4 * 5 = 120
System.out.println(product); // 120
// 최댓값: 초기값 없이 사용 (Optional 반환)
Optional<Integer> max = numbers.stream()
.reduce((a, b) -> a > b ? a : b);
// 동작: 두 값을 비교해서 큰 값을 누적
// 1과 2 비교 → 2
// 2와 3 비교 → 3
// 3과 4 비교 → 4
// 4와 5 비교 → 5
max.ifPresent(System.out::println); // 5
// 실전 예시: 문자열 연결
List<String> words = Arrays.asList("Hello", "World", "Java");
String sentence = words.stream()
.reduce("", (a, b) -> a + " " + b);
System.out.println(sentence.trim()); // Hello World Java
reduce의 세 가지 형태:
reduce(identity, accumulator): 초기값 있음, 결과 타입 확정reduce(accumulator): 초기값 없음, Optional 반환reduce(identity, accumulator, combiner): 병렬 스트림용 언제 사용하나:
- 합계, 곱셈, 최대/최소값 계산
- 문자열 연결
- 커스텀 집계 연산
collect - 수집
// List로
List<Integer> list = numbers.stream()
.collect(Collectors.toList());
// Set으로
Set<Integer> set = numbers.stream()
.collect(Collectors.toSet());
// Map으로
Map<String, Integer> map = users.stream()
.collect(Collectors.toMap(
u -> u.name,
u -> u.age
));
// 그룹화
Map<Integer, List<User>> byAge = users.stream()
.collect(Collectors.groupingBy(u -> u.age));
// 문자열 결합
String joined = numbers.stream()
.map(String::valueOf)
.collect(Collectors.joining(", "));
System.out.println(joined); // "1, 2, 3, 4, 5"
forEach, count, anyMatch
// forEach
numbers.stream()
.forEach(System.out::println);
// count
long count = numbers.stream()
.filter(n -> n > 3)
.count();
// anyMatch, allMatch, noneMatch
boolean hasEven = numbers.stream()
.anyMatch(n -> n % 2 == 0);
boolean allPositive = numbers.stream()
.allMatch(n -> n > 0);
boolean noNegative = numbers.stream()
.noneMatch(n -> n < 0);
4. 병렬 스트림
java 예제 코드입니다.
List<Integer> numbers = IntStream.rangeClosed(1, 1000000)
.boxed()
.collect(Collectors.toList());
// 순차 스트림
long start = System.currentTimeMillis();
int sum1 = numbers.stream()
.mapToInt(Integer::intValue)
.sum();
long time1 = System.currentTimeMillis() - start;
// 병렬 스트림
start = System.currentTimeMillis();
int sum2 = numbers.parallelStream()
.mapToInt(Integer::intValue)
.sum();
long time2 = System.currentTimeMillis() - start;
System.out.println("순차: " + time1 + "ms");
System.out.println("병렬: " + time2 + "ms");
5. 실전 예제
예제: 사용자 데이터 처리
class User {
String name;
int age;
boolean active;
User(String name, int age, boolean active) {
this.name = name;
this.age = age;
this.active = active;
}
}
List<User> users = Arrays.asList(
new User("홍길동", 25, true),
new User("김철수", 17, false),
new User("이영희", 30, true),
new User("박민수", 22, true)
);
// 활성 성인 사용자 이름
List<String> activeAdults = users.stream()
.filter(u -> u.active)
.filter(u -> u.age >= 18)
.map(u -> u.name)
.collect(Collectors.toList());
System.out.println(activeAdults); // [홍길동, 이영희, 박민수]
// 평균 나이
double avgAge = users.stream()
.filter(u -> u.active)
.mapToInt(u -> u.age)
.average()
.orElse(0);
System.out.println("평균 나이: " + avgAge);
정리
핵심 요약
- Stream 생성: stream(), of(), range()
- 중간 연산: filter, map, flatMap, distinct, sorted
- 최종 연산: reduce, collect, forEach, count
- 병렬 처리: parallelStream()
- Collectors: toList, toSet, toMap, groupingBy
다음 단계
관련 글
- Java 람다와 함수형 인터페이스 | Lambda Expression
- C++ 스트림 I/O |
- Java 시작하기 | JDK 설치부터 Hello World까지
- Java 변수와 타입 | 기본 타입, 참조 타입, 형변환
- Java 클래스와 객체 | OOP, 상속, 인터페이스
심화 부록: 구현·운영 관점
이 부록은 앞선 본문에서 다룬 주제(「Java Stream API | filter, map, reduce 완벽 정리」)를 구현·런타임·운영 관점에서 다시 압축합니다. 도메인별 세부 구현은 글마다 다르지만, 입력 검증 → 핵심 연산 → 부작용(I/O·네트워크·동시성) → 관측의 흐름으로 장애를 나누면 원인 추적이 빨라집니다.
내부 동작과 핵심 메커니즘
flowchart TD A[입력·요청·이벤트] --> B[파싱·검증·디코딩] B --> C[핵심 연산·상태 전이] C --> D[부작용: I/O·네트워크·동시성] D --> E[결과·관측·저장]
sequenceDiagram participant C as 클라이언트/호출자 participant B as 경계(런타임·게이트웨이·프로세스) participant D as 의존성(API·DB·큐·파일) C->>B: 요청/이벤트 B->>D: 조회·쓰기·RPC D-->>B: 지연·부분 실패·재시도 가능 B-->>C: 응답 또는 오류(코드·상관 ID)
- 불변 조건(Invariant): 버퍼 경계, 프로토콜 상태, 트랜잭션 격리, FD 상한 등 단계별로 문장으로 적어 두면 디버깅 비용이 줄어듭니다.
- 결정성: 순수 층과 시간·네트워크·스케줄에 의존하는 층을 분리해야 테스트와 장애 분석이 쉬워집니다.
- 경계 비용: 직렬화, 인코딩, syscall 횟수, 락 경합, 할당·GC, 캐시 미스를 의심 목록에 둡니다.
- 백프레셔: 생산자가 소비자보다 빠를 때 버퍼·큐·스트림에서 속도를 줄이는 신호를 어디에 둘지 정의합니다.
프로덕션 운영 패턴
| 영역 | 운영 관점 질문 |
|---|---|
| 관측성 | 요청 단위 상관 ID, 에러율·지연 p95/p99, 의존성 타임아웃·재시도가 대시보드에 보이는가 |
| 안전성 | 입력 검증·권한·비밀·감사 로그가 코드 경로마다 일관적인가 |
| 신뢰성 | 재시도는 멱등 연산에만 적용되는가, 서킷 브레이커·백오프·DLQ가 있는가 |
| 성능 | 캐시·배치 크기·커넥션 풀·인덱스·백프레셔가 데이터 규모에 맞는가 |
| 배포 | 롤백 룬북, 카나리/블루그린, 마이그레이션·피처 플래그가 문서화되어 있는가 |
| 용량 | 피크 트래픽·디스크·FD·스레드 풀 상한을 주기적으로 검증하는가 |
스테이징은 데이터 양·네트워크 RTT·동시성을 프로덕션에 가깝게 맞출수록 재현율이 올라갑니다.
확장 예시: 엔드투엔드 미니 시나리오
앞선 본문 주제(「Java Stream API | filter, map, reduce 완벽 정리」)를 배포·운영 흐름에 맞춰 옮긴 체크리스트입니다. 도메인에 맞게 단계 이름만 바꿔 적용할 수 있습니다.
- 입력 계약 고정: 스키마·버전·최대 페이로드·타임아웃·에러 코드를 경계에 둔다.
- 핵심 경로 계측: 요청 ID, 단계별 지연, 외부 호출 결과 코드를 로그·메트릭·트레이스에서 한 흐름으로 본다.
- 실패 주입: 의존성 타임아웃·5xx·부분 데이터·락 대기를 스테이징에서 재현한다.
- 호환·롤백: 설정/마이그레이션/클라이언트 버전을 되돌릴 수 있는지 확인한다.
- 부하 후 검증: 피크 대비 p95/p99, 에러율, 리소스 상한, 알림 임계값을 점검한다.
handle(request):
ctx = newCorrelationId()
validated = validateSchema(request)
authorize(validated, ctx)
result = domainCore(validated)
persistOrEmit(result, idempotentKey)
recordMetrics(ctx, latency, outcome)
return result
문제 해결(Troubleshooting)
| 증상 | 가능 원인 | 조치 |
|---|---|---|
| 간헐적 실패 | 레이스, 타임아웃, 외부 의존성, DNS | 최소 재현 스크립트, 분산 트레이스·로그 상관관계, 재시도·서킷 설정 점검 |
| 성능 저하 | N+1, 동기 I/O, 락 경합, 과도한 직렬화, 캐시 미스 | 프로파일러·APM으로 핫스팟 확인 후 한 가지씩 제거 |
| 메모리 증가 | 캐시 무제한, 구독/리스너 누수, 대용량 버퍼, 커넥션 미반납 | 상한·TTL·힙/FD 스냅샷 비교 |
| 빌드·배포만 실패 | 환경 변수, 권한, 플랫폼 차이, lockfile | CI 로그와 로컬 diff, 런타임·이미지 버전 핀 |
| 설정 불일치 | 프로필·시크릿·기본값, 리전 | 스키마 검증된 설정 단일 소스와 배포 매트릭스 표준화 |
| 데이터 불일치 | 비멱등 재시도, 부분 쓰기, 캐시 무효화 누락 | 멱등 키·아웃박스·트랜잭션 경계 재검토 |
권장 순서: (1) 최소 재현 (2) 최근 변경 범위 축소 (3) 환경·의존성 차이 (4) 관측으로 가설 검증 (5) 수정 후 회귀·부하 테스트.
배포 전에는 git add → git commit → git push 후 npm run deploy 순서를 권장합니다.
자주 묻는 질문 (FAQ)
Q. 이 내용을 실무에서 언제 쓰나요?
A. Java Stream API: filter, map, reduce 완벽 정리. Stream 생성·중간 연산 (Intermediate Operations)로 흐름을 잡고 원리·코드·실무 적용을 한글로 정리합니다. St… 실무에서는 위 본문의 예제와 선택 가이드를 참고해 적용하면 됩니다.
Q. 선행으로 읽으면 좋은 글은?
A. 각 글 하단의 이전 글 또는 관련 글 링크를 따라가면 순서대로 배울 수 있습니다. Java 시리즈 목차에서 전체 흐름을 확인할 수 있습니다.
Q. 더 깊이 공부하려면?
A. cppreference와 해당 라이브러리 공식 문서를 참고하세요. 글 말미의 참고 자료 링크도 활용하면 좋습니다.
같이 보면 좋은 글 (내부 링크)
이 주제와 연결되는 다른 글입니다.
- Java 컬렉션 | ArrayList, HashMap, Set
- Kotlin 컬렉션 | List, Set, Map 완벽 정리
- Java 변수와 타입 | 기본 타입, 참조 타입, 형변환
이 글에서 다루는 키워드 (관련 검색어)
Java, Stream, 함수형프로그래밍 등으로 검색하시면 이 글이 도움이 됩니다.