기술이해 시리즈 #9호

양자 머신러닝 — 과장과 실제 사이

양자컴퓨팅이 머신러닝을 혁명적으로 가속할 것이라는 기대감이 높습니다. 하지만 지난 2년간 발표된 연구들은 그 낙관론에 제동을 걸고 있습니다. 양자 머신러닝(QML)이 실제로 고전 머신러닝보다 빠를 수 있는지, 그리고 현재 기술로 그것이 가능한지 차근차근 살펴봅시다.

1. 시리즈 8편에서 NISQ(Noisy Intermediate-Scale Quantum) 단계의 응용 알고리즘들을 다뤘습니다.

2. VQE와 QAOA 같은 하이브리드 양자-고전 알고리즘이 분자 시뮬레이션과 최적화 문제에 쓰인다는 것을 배웠습니다.

3. 이번 글은 그 논의를 머신러닝 영역으로 확장하되, 마케팅 과장 뒤의 실제 한계를 정면으로 다룹니다.

quantum machine learning algorithm visualization with neural network circuits an — © 슈로의 양자 이야기

양자 머신러닝의 기본 아이디어

양자 커널 방법

고전 데이터를 양자 회로로 인코딩해 고차원 특성 공간을 만듦

양자 신경망(QNN)

파라미터화된 양자 회로를 학습 모델로 사용

고전 최적화 루프

양자 회로 결과를 고전 컴퓨터가 평가하고 파라미터를 조정

▲ QML의 세 가지 핵심 구성 요소

4. 양자 머신러닝의 핵심 아이디어는 간단합니다.

5. 고전 머신러닝이 데이터를 수치 벡터로 표현한다면, QML은 그 데이터를 양자 상태로 인코딩합니다.

6. 양자 상태는 중첩과 얽힘 덕분에 고전 벡터보다 훨씬 더 많은 정보를 동시에 담을 수 있다는 가정에서 출발합니다.

7. 이를 통해 고전 머신러닝이 수십 차원의 특성 공간에서 작동한다면, QML은 지수적으로 높은 차원의 공간에서 패턴을 찾을 수 있을 것이라고 기대했습니다.

데이터 로딩이라는 병목

핵심 병목

고전 데이터를 양자 상태로 변환하는 과정 자체가 지수적 시간이 걸릴 수 있음

▲ QML의 가장 큰 약점

8. 하지만 2022년부터 이론가들이 지적한 첫 번째 문제가 바로 '데이터 로딩'입니다.

9. 고전 데이터 N개의 샘플을 양자 상태로 인코딩하려면, 양자 회로가 각 샘플마다 여러 게이트를 거쳐야 합니다.

10. 만약 데이터 차원이 D라면, 이 인코딩 과정 자체에 O(D) 이상의 게이트가 필요할 수 있습니다.

11. 결과적으로 '양자 회로로 빠르게 계산한다'는 이득이, 데이터를 양자 상태로 준비하는 데 걸린 시간에 의해 상쇄되는 역설이 생깁니다.

12. 이를 '데이터 인코딩 병목(data encoding bottleneck)'이라고 부르며, QML이 고전 ML보다 실제로 느릴 수 있다는 증거가 되었습니다.

표현력 한계와 Barren Plateau

이론적 기대

지수적 특성 공간, 모든 패턴 학습 가능

실제 현상

그래디언트 소실, 파라미터 학습 불가

▲ 양자 신경망의 이론과 현실의 괴리

13. 2023년부터 더 심각한 문제가 드러났습니다.

14. 양자 신경망의 파라미터를 학습할 때, 회로가 깊어질수록 손실 함수의 그래디언트가 지수적으로 0에 가까워지는 현상이 관찰되었습니다.

15. 이를 'Barren Plateau(황무지 고원)' 현상이라고 부르는데, 마치 산 위의 넓고 평탄한 고원에서 길을 잃은 것처럼 그래디언트가 거의 없어 파라미터 업데이트 방향을 찾을 수 없다는 뜻입니다.

16. 고전 신경망에서는 경사 하강법(gradient descent)이 잘 작동하지만, 양자 신경망에서는 수십 개의 파라미터를 가진 회로도 학습이 거의 불가능해질 수 있습니다.

17. 이는 양자 회로의 구조 자체—중첩과 얽힘이 많을수록 측정 결과의 분산이 커지고, 그래디언트 정보가 희석된다는 기본 원리—에서 비롯된 근본적인 문제입니다.

2024년 현황: 실용성의 재평가

2024년 주요 발견

양자 커널 방법이 고전 커널 방법과 비교해 명확한 우위를 보이지 못함
NISQ 단계에서 QML의 실용적 이득이 매우 제한적임
오류 정정이 없으면 QML 알고리즘의 신뢰도가 급격히 떨어짐
양자 데이터(양자 센서 출력 등)를 다루는 경우에만 가능성 남음

▲ 최근 연구의 현실적 평가

18. 2024년 현재, 양자 머신러닝의 전망은 훨씬 현실적으로 재평가되고 있습니다.

19. 양자 커널 방법(Quantum Kernel Methods)은 이론적으로는 고전 커널보다 강력해 보였지만, 실제로는 데이터 로딩 비용과 노이즈 때문에 고전 SVM(Support Vector Machine)과 비교해 우위를 보이지 못했습니다.

20. 양자 신경망도 마찬가지로, Barren Plateau 문제를 우회하기 위해 회로를 얕게 유지하면 표현력이 떨어지고, 깊게 만들면 학습이 안 되는 딜레마에 빠졌습니다.

21. NISQ 단계의 노이즈(게이트 오류, 결어긋남 등)는 머신러닝 모델의 신뢰도를 심각하게 훼손합니다.

22. 특히 분류(classification) 작업에서 NISQ 양자 회로의 정확도가 고전 모델에 미치지 못하는 경우가 많았습니다.

23. 그렇다면 QML이 완전히 쓸모없는가 하면 그렇지 않습니다.

24. 한 가지 유망한 영역이 있는데, 바로 '양자 데이터'를 다루는 경우입니다.

25. 양자 센서나 양자 실험에서 나온 데이터는 본질적으로 양자 상태로 존재합니다.

26. 이 데이터를 고전 형식으로 변환하면 지수적 정보 손실이 발생하므로, 양자 회로에서 직접 처리하는 것이 논리적으로 이득입니다.

27. 또한 양자 오류 정정(QEC)이 성숙해져 논리 큐비트가 충분히 안정적이 되면, QML의 상황이 크게 달라질 수 있습니다.

결론: 기대와 현실의 거리

28. 양자 머신러닝은 2019~2021년 매우 낙관적으로 홍보되었습니다.

29. 그 당시 몇몇 논문들은 QML이 고전 ML을 지수적으로 능가할 것이라고 암시했습니다.

30. 하지만 2022년부터 발표된 후속 연구들은 그 주장을 체계적으로 검토하고 반박했습니다.

31. 데이터 로딩 병목, Barren Plateau, NISQ 노이즈라는 세 가지 근본적 문제가 동시에 작용하면서, 현재 기술로는 QML의 실용적 우위가 매우 제한적임이 밝혀졌습니다.

32. 이는 양자컴퓨팅이 '만능 해결사'가 아니라, 특정 문제에만 우위를 가진 도구임을 보여주는 사례입니다.

33. 양자 머신러닝이 진정으로 빛날 시점은 (1) 양자 오류 정정이 성숙하고, (2) 양자 데이터 소스가 풍부해지며, (3) 알고리즘 설계가 Barren Plateau를 회피하는 방식으로 진화할 때일 것입니다.

34. 지금은 그 전 단계이며, 현재의 QML 연구는 장기적 가능성을 탐색하되 단기 과장을 경계하는 균형 잡힌 자세가 필요한 시점입니다.

한줄 코멘트

양자 머신러닝은 이론적으로는 아름답지만, 데이터 로딩과 그래디언트 소실이라는 두 가지 병목 때문에 현재 NISQ 단계에서는 고전 머신러닝을 능가하기 어렵습니다.

슈로 🐾

Written by 슈로

📚 관련 글

양자컴퓨터로 신약을 개발한다고? — 제약 회사들이 IBM·Google에 투자하는 이유

제약사들이 양자컴퓨터에 투자하는 이유는 분자 시뮬레이션의 고전 한계를 넘을 수 있기 때문

schro.kr

QAOA·VQE — 최적화와 화학 시뮬레이션의 근거리 미래

NISQ 시대 양자 컴퓨터가 현실적으로 할 수 있는 일 — VQE와 QAOA의 원리와 한계

schro.kr

NIST가 선택한 포스트 양자 암호 — ML-KEM, ML-DSA가 뭔가요

NIST가 2024년 발표한 ML-KEM, ML-DSA 등 포스트 양자 암호의 원리와 도입 현황

schro.kr

양자 머신러닝 — 과장과 실제 사이

양자 머신러닝의 기본 아이디어

데이터 로딩이라는 병목

표현력 한계와 Barren Plateau

2024년 현황: 실용성의 재평가

결론: 기대와 현실의 거리

댓글 0개