바른 맞춤법 검사기
바른 맞춤법 검사기의 원리
맞춤법 검사 API는 텍스트에서 오류를 탐지하고 수정하며, 이를 근거와 함께 출력하는 전반적인 과정으로 구성되어 있습니다. 이 과정은 탐지, 교정, 설명, 출력의 네 가지 주요 단계로 나누어집니다. 각 단계의 세부 설명은 아래와 같습니다.
graph TB
subgraph 오류탐지
T1[띄어쓰기 자동보정]
T2[분절단계 오류탐지]
T3[미등록단어 오류탐지]
T4[비표준어 여부판단]
end
subgraph 교정
C1[띄어쓰기 후보정]
C2[활용오류 교정]
C3[표준어 대체]
C4[미등록단어 검색 보정]
C5[표기오류 보정]
end
subgraph 설명
E1[어법 띄어쓰기 관련 설명 부착]
E2[어법 음운 및 형태 관련 설명 부착]
E3[표준국어대사전 기반 표준어 설명 부착]
E4[미등록단어 인정]
end
subgraph 출력
O1[JSON]
O2[웹 맞춤법 검사기]
end
오류탐지 --> 교정
교정 --> 설명
설명 --> 출력
T1 --> C1 --> E1 --> O1
T2 --> C2 --> E2
T3 --> C4 --> C5 --> E2
T4 --> C3 --> E3 --> O1
T3 --> C4 --> E4 --> O1
E2 --> O1
O1 --> O2
오류탐지
오류탐지 단계는 입력된 텍스트에서 다양한 오류를 찾아냅니다. 이 과정에서 다음과 같은 작업이 수행됩니다:
- 띄어쓰기 자동보정
텍스트에서 띄어쓰기 및 붙여쓰기 오류를 자동으로 탐지합니다. - 분절단계 오류탐지
형태소 분석기가 단어를 분석할 때 분절 모델을 이용하여 단어(어절) 내부를 분리하는 과정에서 발생하는 오류를 탐지합니다.
이는 활용, 축약, 탈락, 생략 등의 조건에 따라 단어 내에서 적절히 나뉘어야 할 부분이 잘못된 경우를 교정 대상으로 표시합니다. - 미등록단어 오류탐지
사전에 없는 단어, 신조어, 오탈자 등을 탐지하여 처리합니다. - 비표준어 여부판단
표준어가 아닌 단어나 표현을 탐지하여 교정 후보로 지정합니다.
교정
교정 단계에서는 탐지된 오류를 기반으로 수정 작업이 이루어집니다:
- 띄어쓰기 후보정
띄어쓰기 오류를 수정하여 정확한 어절 구분을 생성합니다. - 어법 오류 교정
잘못된 사용된 어미나 조사, 용언의 활용형 등을 교정합니다. 예를 들어, "벼르고 벼러" → "벼르고 별러"와 같은 형태를 올바르게 변환합니다. - 표준어 대체
비표준어를 표준어로 교체합니다. 예: "글장이" → "글쟁이". - 미등록단어 검색 보정
사전에 없는 단어를 대체하거나 보정합니다. 적절한 단어 후보를 제안합니다.
설명
설명 단계는 교정된 결과에 대한 이유와 근거를 제공합니다. 사용자에게 교정 과정의 맥락을 이해시키기 위해 다음과 같은 정보를 제공합니다:
-
어법 띄어쓰기 관련 설명 부착
띄어쓰기 교정 이유를 설명합니다.
예시: "한글맞춤법, 제 1장 총칙, 제 2 항 문장의 각 단어는 띄어 씀을 원칙으로 한다.". -
어법 음운 및 형태 관련 설명 부착
활용 오류나 표기 오류 교정에 대한 음운적, 형태적 근거를 제시합니다.
예시: "벼르고 벼러" → "‘르’로 끝나는 어간 뒤에 어미 ‘-아/-어’가 결합하여 ‘ㅡ’가 탈락하고 ‘ㄹ’이 덧붙는 경우, 바뀐 대로 적는다." -
표준국어대사전 기반 표준어 설명 부착
표준어로 교정된 경우, 표준국어대사전에 기반한 설명을 제공합니다.
예시: '오늘은 철이네서 알타리무 다듬던데.' - ‘알타리무’는 비표준어이고 ‘총각무’가 표준어이다. 이는 고유어 계열의 단어가 생명력을 잃고 그에 대응되는 한자어 계열의 단어가 널리 쓰이면, 한자어 계열의 단어를 표준어로 삼는다는 규정(표준어 사정 원칙 제22항)에 따른 것이다. ‘알무’도 비표준어이다. -
미등록단어 인정
사전에 없는 단어를 인정하거나 수정한 이유를 설명합니다.
출력
출력 단계에서는 교정된 결과와 함께 상세 정보를 반환합니다:
- JSON 출력
교정된 문장과 세부 정보를 JSON 형식으로 출력하여 개발자가 후처리할 수 있도록 지원합니다. - 웹 맞춤법 검사기
JSON 결과를 웹 환경에서 사용자가 시각적으로 확인할 수 있도록 렌더링합니다.
전체 과정의 흐름
- 오류탐지 단계: 입력된 텍스트에서 오류를 탐지합니다.
- 교정 단계: 탐지된 오류를 바탕으로 적절한 교정을 수행합니다.
- 설명 단계: 교정된 결과에 대한 근거와 설명을 부착합니다.
- 출력 단계: 교정된 내용을 JSON 및 웹 환경에서 제공하여 사용자와 개발자 모두 쉽게 활용할 수 있도록 합니다.
도움이 되었나요?