수강생 사례 #환경인증업무자동화 #셀레니움RPA #AI데이터추출 #엑셀자동화

매월 40시간씩 사람이 직접 찾아 입력하던
환경표지 인증제품 검토 데이터,
AI가 자동으로 수집하고 추출한 방법

공공 포털 자동 접속 → 최신 인증현황 파일 다운로드 → 조건별 필터링 → 내부 시스템에서 제품별 검토의견 자동 수집 → AI가 특정 인증기준 수치 추출까지,
수작업 없이 월 40시간 → 1시간 수준으로 단축한 실전 기록.

3단계
완전 자동화
처리 파이프라인
40h → 1h
월간 소요시간
대폭 단축
AI 추출
검토의견에서
수치 자동 파싱
외/내부망
분리망 환경도
자동화 가능

01 — 배경 · Problem

매월 반복되는 그 일,
언제까지 사람이 직접 해야 할까요?

환경인증 담당자가 복잡한 엑셀 파일을 수동으로 검색하며 인증제품 데이터를 직접 입력하는 모습

환경 인증 관련 업무를 담당하는 이 수강생은 매달 비슷한 루틴을 반복하고 있었습니다. 공공 포털 사이트에 접속해서 최신 환경표지 인증제품 목록 파일을 내려받고, 그 중 담당 제품군만 추려내고, 내부 시스템에서 인증서마다 검토 탭을 하나씩 열어 특정 기준 항목의 수치를 엑셀에 옮겨 적는 일이었습니다.

비개발자도 AI 자동화를 만들 수 있을까? 이 수강생의 대답은 코드로 나왔습니다. 문제는 단순하지 않았습니다. 외부망(인터넷)과 내부망이 분리된 환경이었고, 검토의견 텍스트는 제품마다 서술 방식이 달라서 단순 검색으로는 원하는 수치를 정확히 뽑아내기가 어려웠습니다.

기존 수작업 프로세스의 실제 과정

단계 작업 내용 문제점
STEP 1 포털 접속 후 최신 인증제품 현황 엑셀 파일 수동 다운로드 업데이트 주기마다 반복, 누락 위험
STEP 2 엑셀에서 담당 제품군 Ctrl+F로 찾아 수동 필터링 시트 다수, 열 구조 복잡 → 실수 발생
STEP 3 내부 시스템에서 인증서 번호 하나씩 입력 후 검토탭 열기 인증서 수에 비례해 시간 기하급수적 증가
STEP 4 검토의견 텍스트에서 특정 기준 수치를 눈으로 찾아 엑셀에 기재 제품마다 표기 방식이 달라 놓치기 쉬움
STEP 5 취합 완료 후 기초통계 및 시각화 작업 앞 단계 지연 시 전체 일정 밀림

⚠️ 검토 대상 인증서가 많을수록 단순 반복에 소모되는 시간이 늘어나고, 실무 분석은 뒤로 밀리는 구조였습니다

🔁 외부망에서 내려받은 파일을 내부망으로 옮기는 과정도 수동으로 처리해야 했습니다

📋 매달 40시간, 연간으로 환산하면 480시간 이상이 이 반복 작업에 소비되고 있었습니다


02 — 솔루션 · Solution

3단계 자동화 파이프라인으로
사람의 개입을 최소화하다

Python Selenium 코드가 공공 포털에 자동 접속해 환경표지 인증제품 목록을 다운로드하는 자동화 실행 화면

이 수강생은 전체 업무를 3개의 독립 단계로 나누어 자동화했습니다. 외부망에서 데이터를 수집하는 1단계, 내부 시스템에서 검토의견을 긁어오는 2단계, AI로 수치를 추출하는 3단계로 구성됩니다. 각 단계는 서로 다른 네트워크 환경에서 동작하며, 중간 결과물을 엑셀 파일로 연결합니다.

핵심 아이디어는 "각 단계는 최대한 단순하게, 연결은 파일로"입니다. 이렇게 하면 분리망 환경에서도 각 단계를 독립 실행할 수 있고, 오류가 생겨도 해당 단계만 다시 돌리면 됩니다.

전체 자동화 흐름 한눈에 보기
🌐 외부망 (인터넷)
1단계 — 인증제품 목록 자동 수집
포털 자동 접속 → 최신 엑셀 다운로드 → 조건 필터링 → 내부망으로 전송
🔒 내부망 (사내 시스템)
2단계 — 인증서별 검토의견 자동 수집
인증번호 순환 검색 → 검토서 탭 자동 접근 → 특정 기준항 텍스트 추출 → 엑셀 저장
🤖 AI 처리 (GPT API)
3단계 — AI로 수치 데이터 자동 추출
검토의견 텍스트 + 제품명 → GPT 분석 → 해당 기준 수치만 파싱 → 엑셀 신규 열 저장
✅ 분석 준비 완료된 엑셀 파일 자동 생성

03 — 기술 · Tech Stack

어떤 기술과 도구를
사용했나요?

언어 & 환경
Python (Jupyter Notebook)
코드를 단계별로 나눠 실행할 수 있어, 외부망용·내부망용 스크립트를 각각 독립적으로 관리하기 좋은 환경입니다.
웹 자동화
Selenium + Edge WebDriver
브라우저를 코드로 제어하는 도구입니다. 포털 접속, 파일 다운로드, 내부 시스템 탐색까지 마우스 클릭 없이 자동 처리합니다.
데이터 처리
pandas + openpyxl
엑셀 파일을 읽고, 조건에 맞는 시트·열만 남기고, 결과를 다시 저장하는 역할입니다. 기존 업무 파일 형식을 그대로 유지합니다.
AI 모델
GPT-3.5-turbo (OpenAI API)
서술 방식이 제품마다 다른 검토의견에서 원하는 수치만 골라냅니다. 퓨샷(Few-shot) 예시를 함께 제공해 일관된 추출을 이끌어냅니다.
GUI
tkinter
키워드 입력 팝업창을 코드 없이 띄워줍니다. 비개발자도 조건을 직접 입력하고 버튼 하나로 실행할 수 있습니다.
설계 방식
퓨샷(Few-shot) 프롬프팅
AI에게 제품명·기준항·검토의견을 함께 주고, 5개 이상의 예시 쌍을 제공해 출력 형식을 일관되게 고정합니다.

04 — 실제 화면 · In Action

자동화가 만들어낸
최종 결과물

3단계 자동화가 끝나면 아래 파일이 바탕화면에 저장됩니다. 사람이 매달 손으로 옮겨 적던 수치가 “데이터” 열에 자동으로 채워진 상태입니다.

📊 최종 결과물 — AI가 수치를 채워 넣은 엑셀 파일 (예시)

2단계에서 수집한 “검토의견” 텍스트를 GPT가 읽고, 제품마다 다른 서술 방식에서 해당 기준 수치만 골라 “데이터” 열에 자동으로 채워넣습니다. 기존엔 이 열 전체를 사람이 눈으로 읽으며 직접 입력했습니다.

📈 붙임. 환경표지 인증제품 현황(20260609)_EL312_수정_final_AI추출.xlsx
세부 현황 (EL312)
← 1단계: 포털에서 자동 수집한 기본 정보 ← 2단계 수집 ← 3단계 AI 추출 ✓
대상제품군 업체명 제품명(상표명) 제품구분 검토의견 (2단계) 🤖 데이터 (3단계 AI)
EL312 비데 ○○ 전자 BS-65D61E Y 시험성적서 결과 확인
BS-65D61E : 21 kWh/월…
21
EL312 비데 ☆☆ 코퍼레이션 DB-5500E Y 월간소비전력량 결과 / 기준
21.5 / 23 이하…
21.5
EL312 비데 □□ 산업 BD-GCS4-03ESB YBY 기준값(23 이하) / 결과값
(20.1)…
20.1
EL312 비데 ◆◆ 주식회사 SBD-930 Y 월간 소비전력량
(kWh/월) : 19…
19

✅ AI 기반 데이터 추출 완료
 › Desktop\붙임. ...(20260609)_EL312_수정_final_AI추출.xlsx

📌 “검토의견” 열의 텍스트는 제품마다 표현 방식이 다릅니다. GPT가 문맥을 읽고 해당 기준 수치만 정확히 골라 “데이터” 열에 넣어줍니다. 이 파일에서 바로 통계 분석과 시각화를 시작할 수 있습니다.


05 — 결과 · Before vs After

자동화 전후, 업무가
어떻게 달라졌나요?

비현코/김우현 강사의 파이썬 업무자동화 바이브코딩 교육을 수강한 뒤, 3단계 자동화 파이프라인 구축에 성공한 담당자가 환경표지 인증제품 현황 엑셀 파일을 확인하고 있음

항목 Before (자동화 전) After (자동화 후)
월 소요 시간 약 40시간 약 1시간 수준
인증제품 목록 확보 포털 수동 접속 → 파일 다운로드 코드 실행 1회로 완료
제품군 필터링 Ctrl+F 수동 검색 키워드 입력 후 자동 처리
검토의견 수집 인증서마다 탭 열어 수동 복사 전체 인증서 자동 순환 수집
수치 데이터 추출 텍스트 눈으로 읽어 수동 입력 GPT가 자동 파싱 후 저장
오류 가능성 피로도에 따라 누락·오기재 빈번 동일 기준으로 일관 처리

06 — 의미 · Insight

이 사례가 주는
진짜 의미

"분리망 환경이라서 자동화가 불가능하다"는 것은 편견입니다.
단계를 나누고, 파일로 연결하면 얼마든지 가능합니다.

이 사례에서 가장 주목할 점은 네트워크 분리 환경을 단계 분리로 해결했다는 것입니다. 외부망/내부망이 나뉘어 있어도, 각 단계를 독립적으로 실행하고 엑셀 파일 하나로 연결하면 전체 자동화가 완성됩니다.

또 하나의 포인트는 AI를 "전체"가 아닌 "가장 어려운 부분"에만 투입했다는 점입니다. 수집과 필터링은 코드가 처리하고, 제품마다 다른 서술 방식을 이해하는 부분만 GPT가 담당합니다. 이렇게 역할을 나누면 비용은 줄이면서 정확도는 높일 수 있습니다.


07 — 확장 · More Use Cases

비슷한 구조로 자동화할 수 있는
다른 업무들

이 자동화의 핵심 구조는 "포털/시스템에서 데이터 수집 → 조건 필터링 → AI로 비정형 텍스트 분석"입니다. 이 패턴은 다양한 업무에 그대로 적용할 수 있습니다.

📋 정기 보고서 데이터 자동 수집
공공 포털이나 내부 시스템에서 정기적으로 업데이트되는 통계·현황 자료를 자동으로 내려받고, 담당 항목만 추려 취합 엑셀을 자동 생성합니다.
🔍 심사/검토 문서에서 항목별 결과 추출
심사 보고서, 검토서, 감사 결과 등 서술형 텍스트 문서에서 특정 항목의 합격 여부나 수치를 AI가 자동으로 읽어내 엑셀로 정리합니다.
📦 제품 사양서·성적서 데이터 취합
제조·품질 부서에서 수십~수백 종의 제품 성적서 PDF나 엑셀에서 특정 규격 수치를 자동으로 수집하고 비교 분석 테이블을 만드는 데 활용할 수 있습니다.
📊 분리망 환경의 내부 데이터 파이프라인
보안상 인터넷과 내부망이 분리된 기관·기업에서도, 단계별 파일 전달 방식으로 완전 자동화 파이프라인을 구성할 수 있습니다.
💡 마무리하며

이 수강생은 개발 경험 없이 교육에서 배운 Python과 AI API만으로, 매달 40시간씩 쌓이던 반복 업무를 자동화했습니다. 복잡한 분리망 환경도, 형태가 제각각인 서술형 데이터도 모두 해결했습니다. 실무 자동화는 완벽한 코드가 아니라, 문제를 나누는 시각에서 시작됩니다.