Automating Construction Safety Management Documentation through Integration of Retrieval Augmented Generation with Large Language Models

1 minute read

by Byunghee Yoo¹, Sungwon Ahn², and Changbum R. Ahn^{3, *}

¹ Department of Architecture and Architectural Engineering, Seoul National University, Gwanak-gu, Seoul 08826, Republic of Korea
² Department of Architecture and Architectural Engineering, Seoul National University, Gwanak-gu, Seoul 08826, Republic of Korea
³ Department of Architecture and Architectural Engineering, Seoul National University, Gwanak-gu, Seoul 08826, Republic of Korea
^* Authors to whom correspondence should be addressed.

검색 증강 생성과 대규모 언어 모델의 결합을 통한 건설 현장 안전관리 서류작업 자동화

최근 건설 현장은 중대재해처벌법의 시행과 안전관리자 선임 자격의 조건 강화로 인해 구인난과 고령화 문제를 겪고 있다. 이로 인해 현장에서의 안전관리가 어려워지고 있다. 이와 관련해, 다양한 연구들이 자연어 처리(Natural Language Processing: NLP)와 기계학습 방법을 활용해 건설 현장의 문서 정보를 효율적으로 관리하고 지식을 추출하는 방향으로 진행되었다. 그러나 이러한 연구들은 문서 간 상관관계를 충분히 고려하지 않는다는 한계가 있다. 최근에는 대규모 언어 모델(Large Language Model: LLM)의 맥락 이해와 추리 능력이 주목받으며 기존의 한계를 극복할 수 있을 것이라는 기대가 커졌다. 하지만 건설 분야에서 LLM을 적용하는 시도는 LLM이 가질 수 있는 환각 현상 때문에 크게 성공하지 못하였다. 이 문제를 해결하기 위해, 검색 증강 생성(Retrieval Augmented Generation: RAG) 기술을 이용해 LLM의 건설 안전 관리 지식을 강화하고, 안전관리 문서 작업을 자동화하는 새로운 프레임워크를 제안한다. 이 방법은 1) 안전관리 서류 작성 지침 문서를 벡터화하고 데이터베이스에 임베딩하는 과정, 2) 단어 빈도-역 문서 빈도(Term Frequency-Inverse Document Frequency: TF-IDF) 유사도 비교를 통해 사용자가 입력한 건설 현장 작업내용과 관련된 지식을 검색 및 추출하는 과정, 그리고 3) 추출된 지식을 바탕으로 필요한 내용을 판단하여 문서를 작성하는 과정을 포함한다. 또한, 건설 현장에서 빈번히 발생하는 위험 작업 내용을 미리 목록화하여 이 프레임워크를 활용, 위험성 평가표 작성 작업을 수행하였다. 프레임워크의 신뢰성을 검증하기 위해, 전문가 5명을 섭외하여 인간 전문가와 프레임워크가 생성한 문서를 구분하는 실험을 진행하고, 분산분석을 통해 결과를 검증하였다.

Citation

Copyright

Automating Construction Safety Management Documentation through Integration of Retrieval Augmented Generation with Large Language Models

검색 증강 생성과 대규모 언어 모델의 결합을 통한 건설 현장 안전관리 서류작업 자동화

You may also enjoy

KOSAS 2024 Spring Jeju Conference