NEWS

생성형 AI 한계 해결하는 지식그래프…핵심은 ‘온톨로지’ 자동화

  • 작성자 관리자
  • 조회 312

출처 : https://digitalchosun.dizzo.com/site/data/html_dir/2025/09/08/2025090880196.html




데이터 관계 정의하는 ‘온톨로지’, 지식그래프 실용화의 마지막 퍼즐


생성형 AI가 업무 혁신의 해법으로 주목받고 있지만, 현실은 기대와 달랐다. MIT Sloan Management Review와 BCG가 지난 7월 발표한 ‘GenAI Divide’ 보고서에 따르면, AI를 도입한 기업의 95%가 기대했던 투자 수익(ROI)을 거두지 못한 것으로 나타났다. 국내 상황도 크게 다르지 않다. 2023년 삼성SDS의 ‘국내 AI 활용 현황 조사’에서는 생성형 AI를 도입한 기업들이 가장 큰 어려움으로 데이터 부족과 품질 문제(52.9%)를 꼽았다.


원인은 비교적 단순하다. 생성형 AI는 토큰 제한과 메모리 제약 탓에 긴 문서를 끝까지 이해하지 못한다. 앞부분 몇 장만 참고하거나 “파일이 너무 커 처리할 수 없다”며 답변을 포기하는 경우가 많다. 같은 질문에 서로 다른 답변을 내놓는 것도 이 때문이다.




RAG와 지식그래프, 그리고 온톨로지


이 같은 한계를 보완하기 위해 등장한 기술이 RAG(검색증강생성)다. 외부 문서를 검색해 답변에 반영하는 방식으로, 2020년 연구에서 개념이 정립됐고 2023년 ChatGPT 열풍 이후 현실적 대안으로 주목받았다. 그러나 실제 구현에서는 검색된 문장을 단순히 나열하는 수준에 머물러 맥락 이해가 부족했고, 정확도는 여전히 60~70%대에 머물렀다.


이에 대안으로 주목받은 것이 지식그래프다. 데이터 간 관계를 구조적으로 연결해 맥락을 보존하는 기술로, 넷플릭스의 추천 시스템이나 구글 검색 알고리즘 개선에 활용됐다. 하지만 지식그래프가 제대로 작동하려면 선결 조건이 있다. 데이터를 의미 있게 연결하려면 먼저 개념과 관계를 정의해야 한다. 단순히 ‘펀드’와 ‘수익률’을 연결하는 것이 아니라, 이들 간의 논리적 관계를 규정해야 정확한 추론이 가능하다. 이를 가능하게 하는 것이 바로 온톨로지(Ontology)다.


온톨로지는 특정 분야의 개념과 관계를 체계적으로 정리한 ‘도메인 사전’으로, 컴퓨터가 지식을 이해하고 추론할 수 있도록 하는 기준표 역할을 한다. 그러나 지금까지는 전문가들이 수개월에서 수년간 수작업으로 구축해야 했고, 이에 따라 지식그래프 활용은 더디게 진행됐다.




온톨로지 자동화 시도들


최근에는 이러한 한계를 극복하기 위한 온톨로지 자동화 시도가 이어지고 있다. 마이크로소프트의 GraphRAG도 그중 하나지만, 지식그래프 생성·활용 과정에서 질의당 응답 시간이 수 분 단위에 이르는 등 실용성에서 제약이 있었다.


국내에서는 인포시즈가 개발한 지식그래프 기반 솔루션 ‘GORAG(고래)’가 주목된다. 인포시즈는 파트너사인 Neo4j의 그래프 데이터베이스에 자체 온톨로지 자동 생성 기능을 더해, 기업 문서 업로드만으로 온톨로지를 구축할 수 있도록 했다. 회사에 따르면, 보험 약관 분석 사례에서 GORAG는 기존 RAG 대비 정확도가 60~70%에서 90% 이상으로 향상됐으며, 응답 속도도 0.5초대를 기록했다. 에너지 기업의 사례에서는 130여 장의 도면 검토 작업을 단시간에 마친 것으로 보고됐다.




산업적 파급 효과와 과제


온톨로지 자동화 기술이 성숙하면 산업 전반에 큰 파급효과를 미칠 것으로 전망된다. 현재 보험 약관, 제조업 클레임 처리, 금융 상품 안내에서 시작된 활용이 의료 기록·검사 결과 분석, 판례·법령 상호 참조 분석 등으로 확대될 가능성이 있다.


이런 흐름은 기업들의 데이터 현대화 투자와도 맞물린다. KB국민은행은 2024년 투자은행(IB) 시스템 통합 플랫폼 구축에 약 100억 원을 투입해 15개월 일정으로 추진 중이고, 삼성증권 역시 데이터 분석 플랫폼 등 전사 데이터 체계 고도화를 진행 중이다. 실제로 철강·반도체 대기업과 정부 기관이 관련 파일럿 프로젝트를 진행하거나 도입을 검토하고 있으며, 한 증권사는 이번 하반기 중 지식그래프 기반 지식 검색 서비스를 별도 페이지로 공개할 예정이다.


물론 온톨로지 자동화가 완전한 해답은 아니다. 자동 생성된 온톨로지의 품질 검증, 도메인 특수성 반영, 지속적 업데이트는 여전히 풀어야 할 과제다. 지금까지의 성과가 대부분 개별 기업의 자체 검증에 기반한 만큼, 산업 전반으로 확산하려면 외부 검증과 장기적 실증이 요구된다.


그럼에도 온톨로지 자동화는 생성형 AI의 정확도와 신뢰성을 높이는 핵심 기술로 자리 잡아가고 있다. 업계는 이제서야 이 퍼즐의 중요성을 본격적으로 인식하기 시작했다.


지식그래프가 AI의 구조적 한계를 극복할 수 있는 기술로 인정받고 있지만, 그 실용화는 결국 온톨로지 자동화에 달려 있다. 앞으로 이 기술의 성숙 속도와 외부 검증 여부가 생성형 AI의 신뢰성 혁신을 좌우할 전망이다.