이 글은 ‘에이전틱 AI와 추론 데이터’ 시리즈의 1편입니다.
세일즈포스·SAP·BCG의 최신 사례를 통해, AI가 ‘대답하는 존재’에서 ‘실행하는 존재’로 전환되는 지금, 기업이 준비해야 할 데이터 전략의 핵심을 짚어드립니다.
AI는 이제 대답하지 않는다. 실행한다.
불과 2~3년 전까지만 해도 기업에서 AI를 도입한다는 것은 챗봇을 붙이거나, 문서를 요약하거나, 데이터를 시각화하는 수준을 의미했습니다. AI는 사람이 질문을 던지면 대답을 내놓는 ‘반응형 도구’였습니다.
그런데 2026년 현재, 그 패러다임이 근본적으로 바뀌고 있습니다.
세계 최대 CRM 기업 세일즈포스(Salesforce)가 백오피스 전체를 자율 실행하는 에이전트 플랫폼을 공개했고, SAP는 공급망 병목을 스스로 해결하는 에이전틱 AI를 하노버 산업박람회 무대에 올렸습니다. BCG(보스턴컨설팅그룹)는 이 흐름이 2,000억 달러 규모의 신규 시장을 만들어낼 것이라고 분석합니다.
이 세 가지 사례를 관통하는 공통 키워드가 하나 있습니다.
추론 데이터(Reasoning Data).
AI가 ‘실행’하려면 단순한 정답을 기억하는 것이 아니라, 복잡한 상황에서 단계적으로 판단을 내리는 능력이 필요합니다. 그리고 그 능력은 결국 ‘어떤 데이터로 학습했느냐’에서 갑니다. 이 글에서는 글로벌 빅테크와 컨설팅 기관의 최신 사례를 통해, 에이전틱 AI 시대에 기업이 준비해야 할 AI 학습 데이터의 방향을 짚어보겠습니다.
사례 ① 세일즈포스 ‘에이전트포스 오퍼레이션’: 감사 추적이 가능한 자율 실행 AI (2026.04.29)
2026년 4월 29일, 세일즈포스는 ‘에이전트포스 오퍼레이션(Agentforce Operations)’을 공식 발표했습니다. 기존의 에이전트포스가 고객 상담·영업 지원 중심이었다면, 이번 신제품은 기업의 백오피스 전체를 자율 실행 대상으로 삼습니다.
핵심 기능은 크게 세 가지입니다.
- 문서 자율 해독: 계약서, 청구서, 규정 문서 등 비정형 문서를 스스로 분석해 핵심 데이터를 추출합니다.
- 신용 모델 자동 업데이트: 거래 패턴과 외부 데이터를 종합해 신용 평가 모델을 실시간 갱신합니다.
- 컴플라이언스 자율 점검: 규제 준수 여부를 자동으로 확인하고 리스크를 보고합니다.
여기서 주목할 것은 감사 추적(Audit Trail) 기능입니다. 세일즈포스는 이번 발표에서 “에이전트의 모든 판단 근거를 기록한다”고 강조했는데, 이는 단순한 자동화를 넘어 ‘근거 있는 자율성(Accountable Autonomy)’을 구현하겠다는 선언입니다.

데이터 관점에서 본 시사점
이 기능을 실제로 구현하려면 무엇이 필요할까요? 세일즈포스 내부 엔지니어링 블로그와 업계 분석에 따르면, 핵심은 비즈니스 로직 데이터와 컴플라이언스 추론 데이터입니다.
예를 들어, “이 계약서가 GDPR을 위반하는가?”라는 판단을 AI가 내리려면, 단순히 GDPR 조문을 외우는 것으로는 부족합니다. “A라는 조항이 있을 때 B 규정과 충돌하는지 여부를 판단하는 논리 흐름”이 데이터로 존재해야 합니다. 이것이 바로 추론 데이터입니다.
관련하여, 대규모 언어 모델의 추론 능력과 학습 데이터 구성의 관계를 분석한 Wei et al. (2022)의 연구 “Chain-of-Thought Prompting Elicits Reasoning in Large Language Models” (NeurIPS 2022) 는 “단계적 사고 과정(Chain-of-Thought)이 포함된 학습 데이터가 모델의 복잡한 추론 능력을 비약적으로 향상시킨다”는 것을 실험적으로 입증했습니다. 에이전트포스의 감사 추적 기능은 이 원리의 실전 적용이라고 볼 수 있습니다.
사례 ② SAP ‘에이전틱 공급망’: 다단계 추론이 현장을 바꾼다 (2026.04.22)
독일 하노버에서 열린 세계 최대 산업박람회 ‘하노버 메세(Hannover Messe) 2026’에서 SAP는 제조업의 고질적 문제인 공급망 병목을 자율 해결하는 에이전틱 AI를 공개했습니다.
시연 시나리오는 이렇습니다.
- 특정 부품의 수급 차질이 예측됨
- 에이전트가 글로벌 대체 공급처 목록을 자동 탐색
- 각 공급처의 납기, 단가, 계약 조건을 자동 검토
- 담당자에게 “이 공급처로 전환하시겠습니까? 승인만 해주세요”라고 보고
이 흐름에서 에이전트는 단 한 번의 판단으로 끝나지 않습니다. “A안이 불가능할 때 B안을 선택하는 논리 단계”, 즉 다단계 추론(Multi-step Reasoning)이 연속적으로 작동합니다.

데이터 관점에서 본 시사점
SAP의 사례에서 주목할 것은 활용된 데이터의 구조입니다. 단순한 재고 수치나 납기 데이터가 아니라, “공급 차질 발생 → 대안 탐색 → 조건 비교 → 최적안 선택”이라는 의사결정 논리 흐름 전체가 데이터셋으로 구성되어 있어야 합니다.
이는 Yao et al. (2023)이 발표한 “ReAct: Synergizing Reasoning and Acting in Language Models” (ICLR 2023) 에서 제시한 ReAct 프레임워크의 실전 구현과 맞닿아 있습니다. 이 연구는 추론(Reasoning)과 행동(Acting)을 교차하는 데이터 구조가 에이전트 성능을 결정한다는 것을 보여주었습니다.
결국 SAP의 에이전틱 공급망이 작동하려면, 실제 제조 현장의 공급 차질 사례와 그에 대한 전문가의 판단 과정이 고품질 AI 데이터 라벨링을 통해 정제된 형태로 존재해야 합니다. 기술이 아무리 정교해도, 데이터의 품질이 에이전트의 판단 수준을 결정합니다.
사례 ③ BCG 리포트: 2,000억 달러 시장과 전문가 라벨링의 부상 (2026.02)
BCG(보스턴컨설팅그룹)가 2026년 2월 발표한 시장 리포트는 수치로 이 흐름을 뒷받침합니다.
주요 통계:
- 에이전틱 AI가 창출할 신규 경제 가치: 약 2,000억 달러
- 대기업의 **40%**가 이미 에이전트 시스템을 실제 업무에 스케일업(Scale-up) 중
- 단순 챗봇 투자는 정체, 수익화 가능한 에이전트 구축 투자는 폭발적 증가

BCG 보고서가 특히 강조하는 것은 “고난도 전문가 라벨링(Human-in-the-Loop)” 시장의 폭발적 성장입니다. 기업들이 단순 응답형 AI에는 지갑을 닫고, 실제 비즈니스 성과를 만들어내는 에이전트에는 아낌없이 투자하기 시작하면서, 그 에이전트를 학습시킬 고품질 전문가 라벨 데이터 수요가 급격히 늘고 있습니다.
이 맥락에서 Ouyang et al. (2022)의 “Training language models to follow instructions with human feedback” (NeurIPS 2022) 는 중요한 참고점을 제시합니다. 인간 피드백 기반 강화학습(RLHF)에서 라벨러의 전문성과 라벨 데이터의 품질이 모델 성능을 직접적으로 좌우한다는 것을 실증한 연구입니다. BCG가 지목한 ‘전문가 라벨링 시장’의 성장은 우연이 아닙니다.
세 사례가 공통으로 요구하는 것: 추론 데이터
세일즈포스, SAP, BCG 업종도 다르고 발표 맥락도 다르지만, 세 사례는 하나의 결론으로 수렴합니다.
에이전틱 AI의 성패는 ‘추론 데이터’의 품질에 달려 있다.
추론 데이터란 무엇인가를 정의하면 다음과 같습니다.
| 구분 | 일반 학습 데이터 | 추론 데이터 |
|---|---|---|
| 형태 | 질문-정답 쌍 | 질문-사고 과정-정답 쌍 |
| 목적 | 지식 기억 | 상황 판단 및 실행 |
| 예시 | “GDPR 위반 여부: O/X” | “조항 A가 있을 때 → B 규정 확인 → 충돌 여부 분석 → 최종 판단” |
| 구축 난이도 | 상대적으로 낮음 | 도메인 전문가 필수 |

에이전트가 ‘승인만 하세요’라고 보고할 수 있으려면, 그 판단의 모든 단계가 논리적으로 구성된 데이터로 뒷받침되어야 합니다. 감사 추적이 가능하려면 추론의 근거가 명시된 데이터가 있어야 합니다. 대체 공급처를 스스로 찾으려면 공급 차질 → 탐색 → 비교 → 선택의 논리 흐름이 데이터로 존재해야 합니다.
이것이 바로 AI 데이터 가공 과정에서 단순 정제를 넘어 ‘추론 구조 설계’가 필요한 이유입니다. 고품질 AI 데이터 서비스는 이제 데이터를 모으고 정리하는 수준을 넘어, 도메인 전문가의 판단 과정 자체를 데이터화하는 방향으로 진화하고 있습니다.
다음 달 주목할 이벤트: AI TECH 2026
2026년 5월 개최 예정인 ‘AI TECH 2026’ 컨퍼런스의 메인 세션 주제가 “에이전틱 AI 기반 업무 혁신과 피지컬 AI 구현”으로 확정되었습니다. 기술 트렌드를 넘어 ‘어떻게 실행하고 어떻게 수익을 낼 것인가’에 대한 실전 데이터 전략들이 집중 논의될 예정입니다.
에이전틱 AI 구축을 위한 데이터 전략을 준비 중인 기업이라면, 이 컨퍼런스가 중요한 벤치마킹 기회가 될 것입니다.
마치며: 에이전트의 뇌는 데이터로 만들어진다
2026년, AI는 분명히 ‘실행’의 영역으로 넘어왔습니다. 세일즈포스는 백오피스를 자율화했고, SAP는 공급망 판단을 에이전트에게 맡겼으며, BCG는 이것이 2,000억 달러 규모의 현실이 되고 있다고 말합니다.
그 실행의 뇌는 모델 아키텍처가 아닙니다. 데이터입니다.
더 구체적으로는, 단계적 판단 과정이 정제된 형태로 담긴 추론 데이터입니다. 에이전틱 AI 도입을 검토하는 기업이라면, 지금 당장 “우리에게 에이전트를 학습시킬 수 있는 추론 데이터가 있는가?”를 점검해보시길 권합니다.
AI 학습 데이터 구축의 첫 단계는 생각보다 복잡하지 않습니다. 하지만 올바른 방향 설정 없이 시작하면, 나중에 되돌리기 어려운 비용이 발생합니다. AI 데이터 바우처를 활용한 정부 지원 프로그램도 적극적으로 검토해보실 만합니다.
시리즈 다음 편 예고
2편: 추론 데이터셋은 어떻게 설계하는가 – 도메인별 구축 방법론
제조, 금융, 법무 등 산업별로 추론 데이터를 실제로 어떻게 수집하고 구조화하는지 구체적인 방법론을 다룹니다.
