이재명 대통령은 2025년 12월 11일 기관별 업무보고에서 정부 문서를 기계가 읽을 수 있는 형태로 개선하라고 지시했다. 공공 부문에서 문서가 아래아한글로 작성된 뒤 PDF로 변환되고, 이를 다시 분석하기 위해 재변환하는 관행이 반복되는 문제를 꼬집은 것이다. 이는 단순한 프로그램 교체 주문이 아니라 정부가 생산하는 데이터 자산을 AI 기술에 즉시 적용할 수 있도록 체질을 바꾸라는 전략적 요구다.
기계가 읽는 문서의 핵심은 문서 구조
컴퓨터가 문서를 읽는 방식은 사람이 글을 읽는 것과 근본적으로 다르다. 사람은 맥락으로 내용을 파악하지만, 컴퓨터는 내용에 앞서 문서의 구조를 먼저 확인한다. 제목은 제목으로, 표는 행과 열의 관계 데이터로 명확히 정의되어 있어야 기계가 오차 없이 정보를 추출하고 반복적인 작업을 수행할 수 있다.
구조 정보가 약하면 컴퓨터는 이미지를 통해 글자를 추정해 인식하는 과정을 거쳐야 한다. 이 과정에서 표의 열이 섞이거나 숫자의 단위가 누락되는 오류가 발생한다. 문서 가독성이 낮은 상태에서 AI를 도입하면 사람이 일일이 오류를 검수해야 하는 비용이 발생하므로 AI 도입 효과가 반감될 수밖에 없다. 따라서 문서 구조화는 AI 적용을 위한 필수 전제 조건이 된다.
병목 현상의 원인은 소프트웨어가 아닌 업무 관행
전환이 더딘 이유는 아래아한글이라는 프로그램 자체의 문제보다 공공 부문의 뿌리 깊은 업무 프로세스에 있다. 공공 부문에서 이 프로그램은 단순한 편집 도구를 넘어 결재, 보고, 감사, 기록관리까지 이어지는 행정 체계의 기반으로 작동해 왔다.
기관마다 정해진 템플릿에는 표지 규칙, 목차, 글꼴, 결재란 등 엄격한 모양의 규칙이 담겨 있다. 담당 공무원들에게는 데이터의 재활용성보다 형식이 흐트러지지 않은 완벽한 결재 문서를 만드는 것이 더 중요하다. 표 한 줄만 밀려도 결재가 반려되는 경직된 문화 속에서는 기계가 읽기 좋은 유연한 구조보다 깨지지 않는 형식을 최우선으로 선택하게 된다. 결국 문서 혁신은 업무 방식 전반의 재설계와 교육이 동반되어야 하는 어려운 과제다.
단계적 전략을 통한 연착륙이 필요
아래아한글은 한국어 환경에 최적화되어 공공 부문의 요구사항을 안정적으로 처리해 온 성공 사례다. 따라서 무조건적인 배제보다는 단계적인 전환 전략이 현실적이다.
먼저 단기적으로는 내부 작성 방식은 유지하되 외부 공개 단계에서 구조가 살아 있는 형태의 제공을 의무화하는 방안이 있다. 이는 행정 현장의 저항을 줄이면서도 국민과 기업, AI가 데이터를 즉시 활용할 수 있게 하는 효율적인 방법이다. 실제 행정안전부도 온나라 문서시스템의 첨부파일을 HWPX 같은 개방형 문서 형식으로 단계적으로 전환하는 정책을 추진하고 있다.
중장기적으로는 국제표준을 중심으로 원본 생산 방식을 바꾸어 특정 업체에 대한 종속을 줄여야 한다. 유럽 등 주요국에서 공공 문서의 데이터 통제권과 보안을 위해 표준 규격을 요구하는 것과 같은 맥락이다. 이 과정에서 중요한 것은 단순한 규격 공개를 넘어 서로 다른 시스템 간에 정보가 막힘없이 유통되는 상호운용성을 확보하는 일이다.
결론은 국가 지식 자산의 설계
이 논의의 본질은 특정 프로그램을 지키느냐 마느냐의 문제가 아니다. 정부가 만드는 정책과 예산, 통계 자료들이 AI 시대에 반복적인 가공을 요구하는 낡은 형태로 남을지, 아니면 처음부터 재사용 가능한 공공 자산으로 관리될지의 문제다.
결국 정부는 외부 공개 단계에서 기계가독성을 확보해 즉각적인 성과를 내고, 점진적으로 핵심 시스템의 개방형 체계를 구축하며, 최종적으로는 국제표준 기반의 생산을 늘려가는 단계적 로드맵을 걸어야 한다. 기준은 도구의 종류가 아니라 정부 문서가 국민과 시장, 그리고 AI에게 얼마나 직관적으로 읽히고 가치 있게 재사용되는가가 되어야 한다.



