데이터와 금융 도메인을 연결하는 인공지능 연구에 꾸준히 관심을 가져왔습니다. 서울대학교 빅데이터·핀테크 AI 과정에서 Lending Club 데이터를 활용한 연체 예측 시계열 모델링을 수행하며 금융 데이터와 AI의 접점을 직접 경험했습니다. 나이스 평가정보에서 AX 프로젝트를 참가하여 금융 공시자료(IFRS 감사보고서)를 활용한 비정형 문서 처리 파이프라인을 설계한 경험이 있습니다. GPT 기반 감사보고서 자동 정규화 프로젝트를 통해 LLM 응답 구조 설계, 데이터 정제, 정량적 평가 지표 개발을 담당하며 대규모 언어모델의 가능성과 한계를 깊이 이해할 수 있었습니다.
이 과정에서 특히 언어모델 파인튜닝과 금융 특화 데이터셋 구축에 대한 강한 흥미를 갖게 되었고, 앞으로는 LLM을 실제 산업 환경에 맞게 최적화하는 연구를 이어가고 싶습니다. LG Data Intelligence Lab 인턴십은 SEC 공시 문서와 금융 데이터를 다루며 이러한 관심사를 구체적으로 탐구할 수 있는 기회라 생각하여 지원하게 되었습니다.
교육 기간: 7개월
주요 학습: 통계 알고리즘, 머신러닝, 자연어처리, 금융 데이터 분석, AI 시스템 개발
주요 핀테크 프로젝트 경험:· Lending Club 금융 데이터 기반 연체 예측 모델 개발· 금융 도메인 특화 Feature Engineering 및 시계열 예측 모델링 수행
캡스톤 프로젝트: NICE평가정보와 협업하여 AI 기반 감사보고서 자동 정규화 시스템 개발
- Python (Pandas, NumPy, scikit-learn, PyTorch, TensorFlow), SQL, MATLAB
- Git/GitHub 기반 협업 및 형상 관리 경험
- 비정형 문서 데이터 파싱 및 정형화 (HTML 기반 감사보고서/공시자료)
- 금융 데이터 분석 및 핀테크 프로젝트 경험 (Lending Club, 나이스 평가정보 캡스톤 프로젝트)
- 시계열 예측 모델 설계 및 하이퍼파라미터 튜닝
- LLM 기반 문서 처리 파이프라인 설계 및 Prompt Engineering
- NLP 기법: TF-IDF, LDA, SBERT 임베딩, Attention 기반 모델 활용 경험
- LLM 응답 평가 지표 설계 (Semantic Similarity, BLEU, 정합성 검증 로직)
- Streamlit 기반 데이터 시각화 및 프로토타입 서비스 구현
- 한국어(원어민), 영어(영문 금융 문서 독해 가능 수준), 중국어(업무 활용 가능)