사유(思惟)

존재론적 개념분류의 인식론적 문제*

나뭇잎숨결 2022. 11. 24. 12:11

존재론적 개념분류의 인식론적 문제*

이 유 선(고려대)


[한글 요약]

이 논문은 세계내 사물의 존재질서를 반영하는 인간 언어의 개념망이 과연 어떤 인식론적인 근거위에서 성립될 수 있는가를 고찰한 것이다.

최근 언어학 및 전산언어학적인 연구에서 주목을 받고 있는 연구분야가 바로 개념망에 근거한 어휘 데어터베이스의 구축이다. 이와 같은 작업은 개별 언어의 특수성과 보편성을 일목요연하게 비교 검토해 볼 수 있는 틀을 만든다는 언어학적인 의의를 가지고 있지만, 과연 인간의 언어가 보편적인 세계인식의 구조를 반영하고 있는가하는 철학적인 문제거리도 동시에 제시해 준다고 생각된다.

논자는 이 글에서 여러가지 존재론적인 개념분류가 과연 어떠한 인식론적인 근거 위에서 성립되었는가를 고찰했다. 논자가 드러내 보이고자 한 것은 그 어떤 언어적 존재론도 인간의 선험적인 인식구조 같은 것을 가정하지 않은 상태에서 실용적인 방식으로 제안되고 있다는 점이다. 언어학자들의 이같은 생각은 촘스키 류의 보편주의자 보다는 로티나 브랜덤 류의 반표상주의자들의 생각을 반영하고 있는 것이라고 생각한다.

한국문화의 고유함을 담지하고 있는 존재론적인 장소를 한국어라고 볼 때, 한국어의 개념적 특성을 반영하는 존재론을 구성해야 한다면 그것은 한국어 말뭉치(corpus)를 가지고 화용론적인 기반위에서 이루어지는 것이 바람직하다고 생각한다.


주제분야 : 언어철학, 언어학, 인지과학
주 제 어 : 존재론, 인식론, 개념망, 워드넷, 반표상주의
1. 들어가며 - 몇 가지 존재론적 범주

인터넷과 정보통신기술의 발달은 사회, 경제, 정치의 영역에서 뿐만 아니라 문화적인 부분에서도 소위 세계화내지 지구화의 경향을 가속시키고 있다. 지구상의 다양한 문화가 접촉할 기회가 많아진다는 것은 문화의 다양성을 확보한다는 문제와 관련해서 보면, 위기일 수도 있고 기회일수도 있다. 문제는 지역문화가 세계화 지구화되어 가는 방향을 거스를 수 없는 상황 속에서 우리가 살고 있다는 것이며, 그런 경향이 긍정적인 쪽으로 나아가도록 하는 것이 피할 수 없는 과제가 되고 있다는 사실이다.

문화적 정체성을 확보하는 문제는 그 지역문화의 언어적 특성을 확보해내는 일과 관련이 있다고 생각한다. 왜냐하면 우리의 언어야말로 전통적인 요소가 전승되어 내려오는 장소이며, 우리자신의 문화적 의식을 구성하는 중심이라고 생각하기 때문이다.

지역의 문화가 교류하는 양식에는 여러 가지가 있을 수 있겠지만, 요즘의 정보화 추세와 관련해서 두드러지는 것은 사이버 공간에서의 문화접촉이다. 인터넷의 발달을 통해서 우리는 세계의 모든 문화를 접할 수 있는 가능성 속에서 살고 있다. 그러나 현실적으로 그런 일이 쉽게 이루어지지 않는 이유는 언어의 다양성으로 나타나는 문화적 특성들이 기술적 장애물로 등장하기 때문이다.

EU통합은 이런 문제와 관련해서 여러 가지 시사점을 던져준다. 유럽의 여러나라는 경제적인 통합에 앞서서 지역문화의 특수성을 포괄할 수 있는 기반을 마련하고자 시도한 것으로 보인다. 그런 노력의 일환이 바로 유로워드넷(Euro- Wordnet)의 구축이다. 유로워드넷은 유럽의 다양한 언어를 통합하는 단일한 개념망을 구축하고자 한 야심찬 기획이다. 언어의 고유한 특성을 살리면서 다양한 언어를 하나의 데이터베이스로 통합한다는 것은 언어적 소통의 문제를 해결하면서 동시에 언어에 함축되어 있는 문화적 차이들을 일별할 수 있게 해준다는 점에서, 세계화과정에서 문화적 다양성이 보존될 수 있는 방향을 제시하고 있다.

그런데 필자가 보기에 이러한 언어학적 작업에는 먼저 고려되어야 할 철학적인 요소들이 있다. 먼저 인간의 사유구조에 대한 보편성과 특수성의 문제이다. 만약, 인간의 보편적인 사유형식을 제시할 수 있다면 언어적 개념의 관계를 일목요연하게 그려내는 것은 어려운 일이 아닐 것이다. 그러나 언어학적 고찰은 그런 특권적인 개념구조의 지도는 존재하지 않는다고 보고하고 있다. 여러 언어를 통합해야 할 경우 보편적인 존재론을 어떤 근거에서 확보할 수 있는가가 고려되어야 한다. 그리고 우리가 어떤 존재론을 획득했다고 했을 때, 그와 같은 존재론은 인식론적으로 정당화 될 수 있는 근거를 가지고 있는지를 물어보아야 한다.

논의를 진전시키기 전에 먼저, 언어학에서 말하는 존재론과 철학에서 말하는 존재론의 의미가 다르다는 것을 밝힐 필요가 있다. 언어학에서는 존재론이 어휘사이의 개념적 관계를 의미하는 것으로 보인다. 반면 철학에서 말하는 존재론은 언어적 개념사이의 관계가 아니라 존재하는 사물간의 위계질서, 내지는 존재 그 자체와 존재자의 관계, 또는 전체 우주의 존재질서에 대한 형이상학적 담론 등을 포함한다.

박우석은 Guarino와 Giaretta의 존재론 자체에 대한 분류를 소개하면서 인공지능 연구가들이 철학사 상의 존재론의 정의들과 독립적으로 존재론을 정의해 왔음을 지적하고 있다. 그가 소개하고 있는 Guarino와 Giaretta의 존재론 구분은 다음과 같다.

1. 철학적 학문 분야로서의 존재론
2. 비형식적 개념 체계로서의 존재론
3. 형식 의미론적 해명으로서의 존재론
4. "개념화"의 상술로서의 존재론
5. 논리 이론을 통한 개념 체계의 표상으로서의 존재론
5.1 특수한 형식적 속성들에 의해 특징지워지는 존재론
5.2 그것의 특수한 목적들에 의해 특징지워지는 존재론
6. 한 논리 이론에 의해 사용되는 어휘로서의 존재론
7. 한 논리 이론의 (메타수준) 상술로서의 존재론

워드넷과 유로워드넷, 그리고 이글스 레포트의 다국어 데이터베이스를 위한 존재론의 경우 위의 분류에 비추어 보자면 2에 해당한다고 할 수 있을 것이다. 필자의 관심은 존재론을 개념적인 의미론의 대상으로 파악하는 이런 존재론이 어떠한 인식론적 정당성을 얻을 수 있을 것인가의 문제이고, 위 분류의 1에서 논의될 수 있는 문제를 2의 영역에서 고찰해보고자 하는 것이다.

필자가 보기에 워드넷, 유로워드넷, 이글스 레포트의 존재론은 존재론적 범주 구분에 대한 명확한 근거를 제시하고 있는 것으로 보이지 않았다. 이 존재론들은 모두 소위 개념망을 구성하기 위한 것이다. 이런 시도는 언어를 사용하는 인간이 공통의 개념망을 소유하고 있어서 자신이 사용하는 어휘의 의미를 그와 같은 전체 망 속에서 이해한다는 함의를 가지고 있다. 여기서 문제 삼을 수 있는 것은 인간에게 보편적인 개념망이 존재하는지, 또 그 개념망이 사물의 질서를 반영내지는 표상한다고 볼 수 있는 것인지 하는 것 등이다. 전자에 대해서는 위에 언급한 개념망이 전부 차이를 보이고 있다는 점만으로도 쉽게 부정할 수 있을 것이다. 단일한 존재론을 가지고 자연언어의 다양성을 포괄할 수 없다는 것을 예상하기는 어려운 일은 아닐 것이다. 문제는 후자인데 설사 언어에 따라서 개념망을 달리 구성할 수 있다고 하더라도 그 개념망이 세계의 질서를 표상한다고 말할 수 있느냐 하는 것이다. 이 물음에 대해서 긍정적인 대답을 한다면, 이들 개념망이 보여주고 있는 존재론적 범주의 구분 근거에 대한 논증이 뒤따라야 할 것이고, 부정적인 대답을 한다면 그와 같은 범주 구분에 대해 객관적인 인식론적 정당화를 할 수 없는 이유를 언급해야 할 것이다.

이와 같은 문제의식은 존재론을 자연언어 개념 분류로 보는 관점과 자연언어로부터 독립해 있는 세계에 대한 지식의 체계로 보는 관점 사이의 구분과도 관련지어 생각해 볼 수 있다. 자연언어는 역사적인 우연성에 의해 지배되기 때문에 존재론을 자연언어의 개념 분류로 본다는 것은 언어간에 공통적인 존재론을 설정할 수 없을 뿐 아니라 한 언어 안에서도 존재론은 끊임없이 변할 수밖에 없다는 것을 의미한다. 반면 후자의 관점에서 보자면, "존재론의 기능은 '어휘적, 통사적, 의미론적 과정에 세계 지식'을 제공하는 것이고, 사실상 우리는 다국어 기계번역을 위해 동일한 존재론을 사용하고 있다"는 것을 의미한다. 이것은 자연언어의 특수성을 포괄하는 근본적 존재론을 상정한다는 점에서 마치 하버마스가 자연언어 속에서 보편적 화용론의 규칙들을 이끌어내려는 시도를 하고 있는 점을 상기시킨다.

필자가 보기에 후자의 관점을 취하기 위해서는 우리의 세계지식과 세계내에 존재하는 사물의 질서 사이에 거울관계 내지는 표상관계가 성립한다는 것을 전제해야 할 것으로 보인다. 그런데 이런 전제는 인식론적으로 정당화하기 힘든 형이상학적 관점에 근거해야 한다.


2. 존재론적 범주의 구분근거

필자가 가지고 있는 관심은 존재론적 의미분류가 갖는 언어학적 의의나 목적이 아니라 그 철학적 정당화의 문제이기 때문에 소위 언어가 표상하는 것으로 생각되는 실재와 언어의 관계를 드러내주는 부분만을 골라내서 고찰해 보고자 한다. 여기서는 워드넷, 유로워드넷, 이글스 레포트의 존재론을 우리말로 번역해서 살펴보고 각각의 존재론이 어떤 근거에 의해서 도출된 것인지를 짚어 볼 것이다.

1) 워드넷의 경우

밀러는 "그 누구도 어휘화된 개념의 계층적 패밀리가 존재하며 명사가 그것을 표현하기 위해 사용될 수 있다는 것을 부정하지는 못할 것"이라고 단언하면서 워드넷의 계층구조가 언어이해의 유용한 도구라고 주장하고 있다. 다음은 워드넷의 존재론에서 최상위 계층구조를 예시한 것이다.

워드넷의 존재론

실재(객체) 유기체(유기물) 동물
사람
식물
대상(물건,물체) 인공물(가공물)
자연물 신체
실체 음식
추상 속성

관계 의사소통
시간
심리적 자질 인지(지식)
감정
동기
자연현상 과정
행위
사건
집단
장소
소유
형태
상태

주지하다시피, 워드넷의 기본적인 의미관계는 유의어이다. 밀러는 유의어는 단어 형태간의 의미론적 관계이긴 하지만, 명사를 정리하는 데 가장 중요한 의미론적 관계는 어휘화된 개념들간의 관계로 보고 있다. 워드넷의 존재론적 범주 구분은 이러한 관점에서 이루어지고 있음을 알 수 있다. 워드넷은 단어의 유의어를 단위로 하는 시소러스라고 할 수 있겠지만 이 유의어 집합이 개념적인 상하위 관계를 통해서 네트워크를 형성하게 된다는 것에 특징이 있다고 할 수 있다. 워드넷에서 상의어는 특정한 단어의미들간의 관계 즉, 어휘화된 개념들 사이의 관계로 형성된다.

워드넷의 존재론적 범주 구성은 모든 어휘가 단일한 트리로서 네트워크를 형성하고 있다고 가정할 때 이상적인 형태로 이루어질 수 있을 것이다. 그래서 개념적인 네트워크의 최상위에 위치할 유의어 집합(synset)을 찾아내고 모든 어휘를 그것의 하위어로 삼을 수 있다면 가장 바람직할 것이다. 그러한 개념이 존재한다면 그것은 모든 것을 포괄할 수 있는 가장 일반적이고 추상적인 어떤 개념이 되어야 할 것이다. 철학자들은 그러한 존재를 이데아(플라톤), 신(스피노자), 절대정신(헤겔), 존재(하이데거) 등등으로 명명해 왔다. 그러나 그런 개념들은 그것을 주장하는 철학자의 개념체계를 받아들일 때 그와 같은 존재론적 위상을 긍정할 수 있는 것이다. 말하자면 전문영역의 전문어로서 독특한 의미를 가질 뿐이다. 철학자들의 사상체계 속에서 사고하고 있지 않은 우리로서는 자연언어에서 그런 개념이 최상위어라는 데 대해서 아무런 거부감이 없이 동의할 수는 없는 일이다. 워드넷의 제작자들도 이러한 문제점들을 잘 인식하고 있다.

"원칙적으로 공허한 유의어 집합(synset)을 맨 위에 위치시키는 것이 가능하다…이런 생각은 의미론적 거리를 평가하기 위해 계층구조를 이용할 때 편리하다. 그렇지만 사전적인 정당화의 가능성은 희박하다. 왜냐하면, 이런 추상적인 일반 개념은 의미론적 정보를 거의 담고 있지 않기 때문이다. 사람들이 그것을 표현할 적합한 단어에 대해 동의할 수 있을지 의문이다.

사실 이러한 지적은 철학자들의 개념이 어느 정도로 추상적인 수준에 머물고 있는지를 보여준다는 점에서 철학자들이 주목할 만한 대목이다. 밀러의 지적에 의하면, "의미론적인 내용이 없는" 공허한 개념들을 철학자들은 말하고 있는 셈이다. 그러나 비트겐슈타인에 의해서 충분히 지적되어 온 이런 문제들에 대해 여기서 다시 거론할 필요는 없을 것이다. 문제는 워드넷의 개념적인 계층구조는 어떤 방식으로 정당화될 수 있겠는가를 검토해 보는 일이다.

개념적인 계층구조를 존재론이라고 할 때 이런 존재론이 정당화될 수 있으려면 고려되어야할 몇 가지 점이 있다. 존재론은 언어간의 공통적인 개념적 관계를 뒷받침해 주는 것이므로 언어사용자 사이의 차별성, 언어간의 차별성을 뛰어넘는 보편성을 갖추어야 한다는 점이다. 일단 워드넷은 단일언어의 개념적 관계를 문제 삼고 있기 때문에 후자의 문제는 발생하지 않는다. 그렇더라도 개별적인 언어사용자들이 가지고 있을 어휘사용의 차별성에 대해 공통적인 근거를 마련하는 것에 대한 정당화의 문제는 여전히 안고 있다. 어떤 요소가 개별적인 언어사용자들로 하여금 개념들을 구분하게 하고 그 개념들을 계층적 구조로 인식하게 하는지에 대해서 밀러는 분명한 답을 제시하고 있지 않다. 그는 그저 "개념적인 세부사항들이 하나의 개념을 다른 개념으로부터 구별해주는 특색에 의해 주어져 있다고 가정하는 것이 그럴듯해 보인다"고 주장할 뿐이다.

밀러는 인지과학의 고전적인 관점이 반박되었다는 사실을 언급하고 있긴 하지만 별다른 대안을 찾은 것 같지는 않다. 예를 들면, "개똥지빠귀는 새이다"를 검증하는데 걸리는 시간이 "개똥지빠귀는 동물이다"를 걸리는 시간보다 더 짧다는 증거를 들어 고전적인 관점에서는 개똥지빠귀와 새의 의미론적 거리를 개똥지빠귀와 동물의 의미론적 거리보다 더 짧은 것으로 주장할 수 있다. 그런데 "개똥지빠귀는 새이다"가 "닭은 새이다"를 검증하는데 걸린 시간보다 현저하게 길게 측정되었다는 것은 위의 고전적인 관점을 의심스럽게 만들 만한 증거라는 것이다.

밀러가 여기서 워드넷의 존재론적 범주구분에 대한 특별한 정당화를 제시하고 있지 않은 점에 주목할 필요가 있다. 만약 인지과학의 고전적인 관점이 별 심각한 예외적인 관찰보고를 내놓지 않았다면 워드넷의 존재론은 경험적 정당화를 얻을 수 있었을 것이다. 그리고 만약 그런 일이 이루어졌다면 이것은 철학적으로는 플라톤주의적인 본질주의가 승리하는 결과를 낳았을 것이다. 그러나 경험적인 관찰보고가 이론에 의존적이라는 테제는 이미 과학철학의 고전적인 관점이고 이 점이 인간의 언어이해의 문제에서도 표면에 드러났다고 생각한다. 워드넷의 제작자들이 그와 같은 철학적 정당화의 문제에 매달릴 필요는 없을 것이다. 그러나 인간의 개념 지도가 세계의 질서에 어느 정도로 부합하는가에 관심을 갖는 사람에게는 이것은 그리 간단히 짚고 넘어갈 문제는 아니다.

밀러의 경우는 워드넷의 존재론에 대한 경험적 정당화에 문제가 있음을 지적하지만 근본적인 대안적 정당화의 작업에 대해서는 심각하게 고려하고 있지 않은 것으로 보인다.

2) 유로워드넷의 존재론

다국어의 의미론적 범주를 제시해야 하는 유로 워드넷의 경우는 워드넷의 경우보다 존재론의 문제에 있어서 더 복잡한 문제를 안고 있다. 위에서 언급한 개별적인 언어사용자의 차이와 더불어 언어간의 차이에 대해서도 고려해야 하기 때문이다.

초기에 유로워드넷은 네덜란드어, 이태리어, 스페인어, 영어로 구성되었으나, 이후에 독일어, 불어, 에스토니아어, 체코어가 추가되었다. 현재 우리의 관심에서 문제가 되는 것은 이렇게 다양한 언어들이 하나의 데이터베이스에 통합되면서 개념망을 형성해야 할 경우 언어들 간의 차이를 뛰어넘는 보편적인 존재론의 구성이 가능한가 하는 점이다. 유로워드넷은 이 문제를 해결하는데 있어서 워드넷의 존재론을 기반으로 삼는 편의적인 방식을 택한 것으로 보인다. 유로워드넷을 구축하는 쪽의 입장에서는 그 정당화의 문제보다는 어떻게 하는 것이 언어간의 차별성을 장애물이 되지 않게 하면서 통합적인 데이터베이스를 얻어내느냐 하는 문제가 일차적인 관심사였을 것이다. 그러나 워드넷의 존재론을 기반으로 하더라도 언어간의 차별성을 해결할 장치가 필요했기 때문에 유로워드넷은 독특한 몇 가지 개념을 제시하고 있다. 상층 존재론(Top Ontology)와 다국어 연결 인덱스(ILI; Inter Lingual Index) 등이 그것이다. 다음은 유로워드넷의 존재론의 최상위 어휘들이다.

유로워드넷의 top ontology, 63개의 개념구분과 1024개의 ILI레코드로 구성)

1st Order Entity
(3차원 공간내의 감각이나 장소를 통해 지각가능한 구체물, 명사 491개로 구성)

기원 자연물 유정물 식물
인간
creature
동물
인공물
형태 실체 고체
액체
기체
대상

구성 부분
집단

기능 탈것
표상 화폐표상
언어표상
이미지표상
software
장소
직업
도구
의복
가구
덮개(covering)
용기
식료품
건물

2nd Order Entity
(독립적인 물리적 사물로서 지각될 수 없는 정적인 혹은 동적인 상황. 시공간 안에 존재한다기 보다는 발생한다. 명사 272개, 동사 228개 도합 500개)

상황 유형 동적 BoundedEvent
UnboundedEvent

정적 속성
관계

상황구성 원인 동작주가 있는
현상적인
자극하는
의사소통
조건
존재
경험
장소
매너
정신적인
양태적인
물리적인
소유
의도

사회적인
시간
용도

3rd Order Entity
(시공간에서 독립해서 존재하는 명제. 실재보다는 참 거짓과 관련있다. 명사 33개)
이론, 관념, 구조, 증거, 절차, 독트린, 정책, data point, 내용, 행동계획, 개념, 계획, 의사소통, 지식기반, 인식적 내용, 노우하우, 범주, 정보, 추상

이와 같은 상층 존재론(Top Ontology)의 구성은 기본적으로 기초개념(Base Concepts)들로 이루어져 있다. 유로워드넷은 존재론의 적용에 있어서 하강(Top-Down) 전략을 사용하기 있기 때문에 마치 선험적인 의미론적 전제를 하고 있지 않은가 하는 인상을 주지만, 기초개념을 통해서 존재론을 구성하고 있다는 사실은 이들의 관점이 기본적으로 화용론적인 토대에 있다고 볼 수 있게 해 준다.
이들이 기초개념을 선택한 방식은 각각의 개별적인 언어 속에서 가장 폭넓게 사용되고 있는 단어들을 골라내는 방식으로 이루어졌다. 이들이 이와 같은 작업을 하는데 적용한 기준은 다음의 두 가지이다.

- 관계의 수(하의어에 대해 일반적인 혹은 제한된)
- 계층구조에서 상위에 위치하는 개념(워드넷 1.5나 아니면 개별언어의 분류에서)

각각의 개별언어에서 기초개념을 선정해서 그것을 모두 모아 공통적인 기초개념을 골라내고 이 기초개념들간의 어휘관계를 고려해서 구성해 낸 것이 결국 유로워드넷의 상층 존재론(Top Ontology)이라고 할 수 있다. 유로워드넷이 존재론을 구성함에 있어서 하강(Top-Down) 전략을 쓴 것은 여러 언어를 하나의 데이터베이스로 통합하는데 있어서 나타날 수 있는 다양한 문제들을 해결하기 위한 유용한 방식이라고 생각한다. 그런데 이런 전략을 위한 사전 작업이 모두 상승(Bottom-Up) 전략의 방식으로 이루어졌다는데 주목할 필요가 있다. 게다가 유로워드넷의 상층 존재론은 개별언어간의 차이를 반영할 수 있도록 개방된 구조를 가지고 있다. 더 올바른 개념적 지도를 그리기 위해서 이후에 발생하는 문제를 수렴할 수 있도록 끊임없이 수정되어야 하는 존재론이다.

이러한 형태의 존재론을 가지고서도 여러 언어를 통합할 수 있는 것은 바로 ILI를 통해서 가능하다고 생각된다. 유로워드넷의 ILI는 다양한 개별언어를 연결시켜주면서 상층 존재론과 영역 존재론(Domain Ontology)을 이어주는 비구조화된 의미의 리스트이다. ILI자체는 구조화되어 있지 않은 인덱스이기 때문에 끊임없는 수정과 보완이 가능한 구조를 가지고 있다. 유로워드넷의 데이터베이스에 통합되는 개별언어의 어휘는 반드시 ILI와 연결되어 있어야 한다. ILI는 기본적으로 워드넷의 의미표시 영역을 포함하며 이것이 다른 개별언어와 연결되도록 되어 있다. 개별언어의 상하위 관계는 ILI를 통해 어휘가 서로 연결되더라도 각 개별언어의 특성에 맞게 유지될 수 있다.

이와 같은 전략은 존재론의 위상에 대해 두 가지 관점을 고려하고 있는 것으로 보인다. 먼저 개별언어의 존재론은 언어사용권에 따라 다르며, 그 차이가 보존되어야 한다는 점이다. 유로워드넷에 연결된 언어들은 그 차이를 보존하기 위해 대부분 먼저 개별적인 워드넷을 구성하고 그것을 ILI를 통해 연결시키는 방식을 취했다. 이 경우 개별언어들은 개별적인 존재론을 구성해야 한다. 그리고 그 존재론은 그 언어사용권에 있는 언어사용자들의 개념적인 지도를 반영한다고 보아야 할 것이다. 스페인어의 경우 영어 워드넷을 번역해서 연결시키는 방식을 취했는데, 이런 경우에는 어휘공백(lexical gap)을 줄일 수 있는 이점이 있으나, 개별적인 언어의 특성을 반영하지 못할 것이다. 그와 같은 목적을 위해서는 여전히 개별적인 존재론의 구성이 뒤따라야 할 것이다.

두번째로 유로워드넷은 통합적인 존재론 즉, 상층 존재론(Top-Ontology)의 유용성을 전면에 내세우고 있으면서 그것에 대한 인식론적 정당화에 대해서는 부차적인 문제로 보고 있는 듯 하다. 이것은 필자가 보기에 불필요한 철학적 논쟁을 피해가는 바람직한 태도라고 생각된다.

3) 이글스 레포트의 존재론

이글스 레포트가 제안하고 있는 존재론의 경우, 워드넷과 유로워드넷의 연장선상에서 문제점을 보완하고자 하고 있다. 그렇기 때문에 존재론적 범주 구분에 대한 기본적인 태도는 크게 달라 보이지 않는다. 즉, 그 인식론적 정당화의 문제보다는 어떻게 하면 언어의 특성을 살리면서 통합적인 유용한 틀을 제공할 것인가에 주된 관심이 놓여 있다는 것이다.

이글스 레포트는 언어 공학 어플리케이션에서 어느 정도로 유용하게 사용될 수 있느냐를 기준으로 의미론적 정보의 적절성을 평가하고 그것을 바탕으로 유의미한 의미론적 기초개념의 우선성을 정하고 있다. 이러한 기준에서 가장 우선적인 기초 개념은 상의어, 하의어, 기초어휘 유형, 의미론적 틀 등이다.

워드넷, 유로워드넷과 마찬가지로 상, 하의어의 어휘 관계를 기본적인 의미론적 개념으로 삼고 있는 이글스 레포트는 유로워드넷의 기초 개념(Base Concepts)을 바탕으로 의미분류를 하는 방법을 생각하고 있다. 여기서 첫 번째 문제는 이글스 레포트가 밝히고 있듯이, 최상층의 존재론적 범주구분에 동의하는 일이다. 유로워드넷의 공통 기초 어휘 집합은 8개국어에서 경험적으로 이끌어낸 개념 집합이고 유로워드넷 자체가 최소한도로 통합된 존재론을 목표로 한 것이 아니고 대표할 만한 개념집합을 목표로 한 것이기 때문에, 이글스 레포트는 좀 더 통일된 존재론을 얻기 위해서는 기초개념의 집합을 최소화하는 것이 중요하다고 생각한다. 이글스 레포트가 제안하는 최소한 방안은 다음과 같다.

"- 9개 언어 중 6개 언어에 의해 선택된 개념들로 집합을 한정시킨다.
- 공통의 하의어가 없고, 명확한 상의어가 선택된 경우 특정 개념은 제거한다. 예를 들어, 인간이라는 상의어와 노동자라는 하의어가 있는데 여행가나 통치자라는 공통의 하의어가 없다면 노동자를 리스트에서 석제한다.
- 단일한 개념에 의해 분간될 수 없고 대표할 수 없는 유사한 의미들은 제거한다. 예를 들어 (material 5; sruff 7)이라는 신셋과 (matter 1; substance 1)이라는 신셋은 SUBSTANCE라는 단일한 개념으로 대표될 수 있다."

이런 기준을 통해서 이글스 레포트는 기초개념의 수를 74개로 줄였다. 다음은 이글스 레포트가 이러한 방법을 사용해서 최소화한 존재론의 상위개념들을 정리해 본 것이다.

Eagles 존재론(생략)


필자가 여기서 관심을 갖는 것은 이러한 존재론의 구성에 있어서 여전히 경험적인 자료를 바탕으로 하고 있다는 점, 즉 구체적인 언어의 사용에 바탕을 두고 있다는 점이다. 이러한 존재론은 더 간략한 것으로 수정될 가능성을 여전히 가지고 있는 잠정적인 것으로 보아야할 것이며 그에 대한 정당화의 문제는 경험적인 언어 사용의 용례를 제시하는 것 이외의 특별한 방법으로 해결되기는 힘들 것이라는 점을 예상할 수 있다.

3) 인식론적 정당성의 문제

어떤 의미에서 플라톤은 최초로 의미론적 범주에 대한 존재론적 정당화를 시도한 인물이라고 할 수 있다. 의미론은 단어의 의미가 대상으로부터 온다는 것을 전제한다. 컵이라는 단어의 의미는 컵이라는 대상에 의해서 결정된다. 그런데 우리가 경험적으로 접하는 컵이라는 것은 대단히 다양한 형태를 가지고 있다. 그 모든 경험적인 컵을 컵이라는 단어로 지칭하기 위해서는 무엇이 필요할까? 경험적인 컵의 본질을 담아내는 진정한 컵의 원형이 존재하며 우리가 그것을 알 수 있어야 할 것이다. 플라톤의 이데아론은 그와 같은 원형의 세계를 상정하고 그것을 통해서 무한한 다양성이 존재하는 경험세계의 차이를 뛰어넘어 영원불변한 '진리'를 말할 수 있게 하기 위한 것이었다. 이데아론은 이를테면 그의 존재론적 범주인 셈이다.

생성문법으로 유명한 푸스테욥스키(Pustejovsky)가 기본적인 틀로서 사용하고 있는 아리스토텔레스의 네 가지 범주, 즉 질료인, 형상인, 동력인, 목적인은 아리스토텔레스 자연학의 내용이지만 이것은 그의 기본적인 형이상학적 세계관과 밀접한 연관을 맺고 있다. 목적론적인 세계관을 가지고 있었던 아리스토텔레스는 부동(不動)의 동자(動者)로서의 신이라는 최고 목적을 이 세계 존재자가 움직이는 근본적인 동인으로 삼고 그 과정에서 질료가 형상과 결합하여 개별적인 실체를 이룬다고 보았다. 그가 논리학을 전개시킨 것도 기본적으로 언어의 질서가 세계의 질서를 반영한다고 보았기 때문이다. 이런 식으로 본다면 그는 인식론적으로는 플라톤을 계승하고 있는 것으로 볼 수 있다.

그런데 문제는 이러한 형이상학적 세계관을 전제한 존재론적인 틀 및 그 인식론적 전제들에 대해 정당성을 문제 삼지 않고 그들의 범주를 가져다 사용하는 것이 합당한가 하는 것이다. 여기에는 언어와 세계의 관계라는 꽤 고전적인 철학적 문제가 개입되어 있다.

자켄도프의 경우 이러한 문제에 대해 고찰하면서 몇 가지 올바른 지적을 하고 있다. 자켄도프는 존재론적 범주에 관한 개념구조가설에 대해 다음과 같이 말하고 있다.

"의미론적 구조는 단순히 - 발화를 통해 표현가능한 - 개념적 구조의 부분집합일 수 있다. 이런 관점은 대응규칙이 통사적 구조와 개념적 구조를 직접적으로 매핑하는 것이며, 추론규칙과 화용론의 규칙이 개념구조로 되돌아가는 개념구조에 대한 매핑이라는 주장을 함축한다. 이것은 인공지능과 관련한 작업들이 통사를 다룰 때, 대부분 전제하고 있는 관점으로 Fodor, Fodor and Garrett(1975), Chomsky(1975)에 의해 옹호되고 있다.

요약하자면, 나는 개념구조가설이 모든 주변적인 정보가 매핑되는 단일 차원의 정신적 표상의 존재를 전제하고 있는 것이라고 주장할 것이다. 이런 차원은 개념적으로 잘 정식화된 규칙의 본구적인 시스템에 의해 특징지워진다"

모든 주변적인 정보가 매핑되는 단일 차원의 정신적 표상의 존재를 받아들인다는 것은 플라톤적인 본질주의를 받아들이는 것이 될 것이다. 플라톤이 말하고 있는 이데아라는 것은 진리에 관한 메타포의 하나일 뿐이라는 사실을 긍정하는 것은 데리다나 로티같은 현대 철학자들의 논의를 끌어들이지 않더라도 그리 어려운 일은 아닐 것이다.

언어와 세계의 관계에 관한 자켄도프의 관점은 칸트주의적인 것으로 보인다. 그는 소박실재론적인 입장을 비판하면서 다음과 같이 말하고 있다.

"우리는 투사된 세계에만 접근할 수 있는 의식을 가지고 있다. 이 세계는 마음에 의해 무의식적으로 조직된 세계이다. 그리고 우리는 이런 조직과정을 통해서 정신적 표상을 만들어내는 한에 있어서만 사물에 대해서 말할 수 있다. 따라서 '언어에 의해 전달된 정보는 투사된 세계에 관한 것이어야 한다.' 우리는 소박한 관점을 우리가 투사된 세계를 실재로서 다루도록 구성되어 있는 것의 결과로 설명해야 한다."

자켄도프는 단일한 차원의 정신적 표상의 존재에 대해서는 소박한 관점이라고 비판하는 한편, '언어에 의해 전달된 정보는 투사된 세계에 관한 것'이라고 보고 있다. 이러한 관점은 우리가 인식하는 세계가 물 자체의 세계가 아니라 우리의 오성, 감성형식이라는 인식론적 틀에 의해 구성된 현상계에 불과하다는 칸트의 주장과 별로 달라 보이지 않는다. 특히 다음과 같은 그의 언급은 그를 칸트주의자로 해석할 만한 충분한 단서를 제공한다고 생각한다.

"우리 인간은 비슷한 정신적 구조를 가지고 있기 때문에 광범위한 유용한 사례들 속에서 우리의 투사가 대부분의 목적에서 양립가능하다는 것이다. 그래서 우리는 오해를 경계하고 있는 한 동일한 사물에 대해서 말하고 있다는 가정하에 합리적으로 활동을 할 수가 있다."

인간의 비슷한 정신적 구조 때문에 우리는 동일한 사물에 대해서 말하고 있다는 것을 받아들인다는 태도는 칸트가 자연과학적 탐구의 객관성의 토대를 인간의 선험적 통각, 즉 '나는 생각한다'고 하는 간주관적 공통 기반에서 찾은 것과 다를 바가 없는 것이다. 이런 관점은 사실 자켄도프가 비판하고 있는 '모든 주변적인 정보가 매핑되는 단일 차원의 정신적 표상의 존재'를 받아들이는 것에서 별로 멀리 나아가지 못한 것으로 보인다. 자켄도프는 단일 차원을 투사된 세계로 바꿈으로써 우리가 경험하는 세계의 다양성을 인정하고 언어적 표상의 다양한 차원을 열어주는 것처럼 보였지만 '인간의 비슷한 정신구조'에 호소함으로써 다시 플라톤주의적인 본질주의로 회귀하고 만다.

언어와 세계의 관계라는 철학적 물음과 관련하여 최근에 벌어진 철학적 논쟁을 간단히 살펴보는 것이 도움이 될 것이라고 생각한다.

철저한 경험주의(radical empiricism)를 제창하고 나온 맥도웰은 본질주의를 비판하는 한편 진리의 문제에 있어서의 세계경험의 의미를 포기하지 않으려고 한다는 점에서 칸트주의적인 입장을 견지하고 있다. 맥도웰은 문장과 문장 사이의 언어체계 내적 정합성만으로는 언어가 세계를 매핑한다고 하는 문제에 대한 필요충분한 대답이 될 수 없다고 생각한다. 맥도웰의 관점에서 중심이 되는 문제의식은 '세계에 대한 대답의 가능성'이다. 맥도웰은 마음과 세계의 관계를 규범적이라고 본 점에 있어서는 '추론주의'를 대안으로 들고 나온 브랜덤과 같은 입장으로 볼 수 있다. 그러나 맥도웰은 "판단이나 신념의 고정을 목표로 하는 사고는 세계 - 사물의 존재방식 - 에 답할 수 있다, 즉 그것이 올바로 수행되었는지 그렇지 않은지에 대해 말할 수 있다"고 함으로써 최소한의 경험주의라는 입장과 칸트식의 '마음의 틀'이라는 개념을 동시에 유지하려 한다. 이런 입장은 추리의 논리적 공간이 자연의 논리적 공간의 한 부분이라고 간주함으로써 다시 말해서 추리의 논리공간을 개념적 소재로부터 구성될 수 있는 것으로 봄으로써 가능하다. 맥도웰은 "그 상호관계가 이성의 논리공간에 속하는 개념적 능력이 판단 - 어떤 것에 대한 주관이 능동적으로 자신의 마음을 정한 결과 - 에서 뿐만 아니라 적절한 주관의 수용능력에 대한 세계의 영향에 의해 구성되는 자연에서의 상호작용 속에서도 작동할 수 있다"고 함으로써 개념적인 능력이 주관의 이성능력일 뿐 아니라 세계와 만나는 데서 작동하는 능력이라고 주장하고 있다. 이것은 이성공간 안에 경험의 개념을 살려둘 수 있는 여지를 만들어 놓자는 것으로 보인다.

필자는 이러한 맥도웰의 시도가 '경험'의 개념을 개인적인 차원에서 해명하려고 함으로써 플라톤에서 칸트로 이어지는 본질주의 내지는 표상주의적인 전통에서 크게 벗어나지 못한 것이라는 비판을 소개한 바 있다. 맥도웰과 논쟁을 벌였던 브랜덤은 맥도웰의 입장이 이성의 논리공간을 개인화하고 있는 부분이 가장 큰 실수라고 지적하고 있다. 브랜덤의 추론주의적인 입장에서 보자면 우리가 개념이나 명제를 말할 수 있는 이성의 논리공간은 결코 개인적인 공간이 될 수 없다. 그가 그렇게 생각하는 가장 큰 이유는 우리의 언어적인 실천이 본질적으로 사회적이고 규범적인 것이라는 차원을 고려하지 않은 인간의 마음과 세계의 관계, 혹은 인간의 언어와 세계의 관계에 대한 설명은 모두 인식론적으로 정당화되지 않은 본질주의적인 형이상학적 전제를 가지고 있기 때문이다.

브랜덤은 "자연세계는 그 자체 책임이나 자격을 가지고 등장하지 않는다. 그것들은 인간 행위의 산물이다…언어적 표현의 사용을 지배하는 규범은 의무론적 점수기록 행위 안에 내재해 있다"고 말함으로써 맥도웰이 기본적인 문제로 삼고 있는 '세계에 대한 대답 가능성'을 처음부터 부정하고 있다.
현재 우리의 관심에서 중요한 문제는 언어와 세계의 관계에 있어서 진술이나 언명의 참, 거짓을 인식론적으로 정당화하는 문제에 있어서 세계가 과연 정당화의 역할을 하는가 하는 것이다. 이것은 결국 표상의 문제를 어떻게 볼 것인가 하는 문제와 관련된다. 자켄도프가 플라톤식의 본질주의적 표상개념을 비판한 이유는 그것이 실재의 문제에 있어서 소박한 태도를 가지고 있다는 것이었다. 이런 관점에서 화용론의 규칙은 의미론적 구조로부터 도출된다고 할 수 있을 것이다. 실재론적 관점에서 의미론은 세계가 존재하는 방식을 표상한다고 생각되기 때문이다.

브랜덤은 이러한 의미론과 화용론의 관계를 거꾸로 세우고자 한다. 그는 "명제를 표현한다는 것이 무엇인지 묻지 않고서 명제가 참이라는 것이 무엇인지 혹은 표상이 성공적이라거나 올바르다는 것이 무엇인지 묻는 것은 소용없다"는 철저한 화용론의 태도를 가지고 있다. 브랜덤에게 있어서 표상의 정확성을 묻는 것은 언어와 세계의 대응의 문제가 아니다. 그는 "표상적 내용의 객관성은 표상의 올바름을 평가하는 실천의 특징이다"라고 주장한다. 브랜덤의 입장에서 볼 때, 지시론적 의미론적 모델은 기본적으로 범주적인 오류를 범하고 있는 것으로 지적된다. 즉 문장을 복합 이름들로 또 판단하는 것을 서술하는 것으로 동화시킨다는 것이다. 문장의 의미가 문장구성요소를 분석함으로써 이해된다고 생각하는 것 자체가 범주적인 오류에 기인하고 있는 것이다. 개념의 분류를 위해서는 먼저 규범적인 차원을 고려할 필요가 있다는 것이 브랜덤의 기본적인 생각이다. 개념들은 본질적으로 추론적으로 분절된다. 세계내에 존재하는 사물의 질서에 대응해서 분절되는 것이 아니라, 우리가 실천 속에서 개념을 파악하는 것은 추론이 언제 올바르고 언제 양립불가능한지를 아는 것과 관련되어 있다. "우리는 상태나 수행을 가진 사람에 대해 내용을 가질 수 있는 것이지 그것을 지시자로서 사용하는 대상에 대해 내용을 가질 수는 없는 것"이라는 브랜덤의 말은 그의 반표상주의적인 입장을 잘 나타내 준다고 생각된다. 이런 입장에서 볼 때 맥도웰이 이성의 추론공간을 개인화한 것은 개념이 본질적으로 추론적이며, 이 추론은 근거를 부여하고 묻는 사회적 실천 속에서 암묵적으로 이루어지는 것이라는 사실을 올바로 파악하고 있지 못한 것이라고 할 수 있을 것이다.

만약 브랜덤의 화용론적인 추론주의를 받아들인다면 존재론적 범주 구분의 문제에 있어서 촘스키류의 본질주의적 접근이나 자켄도프식의 칸트주의적인 접근, 혹은 맥도웰의 '철저한 경험론'의 접근은 모두 개념적 내용이 본질적으로 사회적이고 실천적인 추론에 바탕을 두고 있다는 점을 간과하고 있다는 점에서 바람직한 접근 태도는 아니라고 해야 할 것이다.


4. 한국어 워드넷 구성의 문제

개념적 내용이 사회적이고 실천적인 추론에 바탕을 두고 있다면 한 언어의 개념망을 만드는 것은 그 언어 사용자의 머리 속에 선험적으로 존재론적인 구분이 내재해 있다고 가정하고 그것을 파악해 낸다는 전략보다는 화용론적인 접근법을 시도하는 것이 바람직하다고 생각한다.

워드넷과 유로워드넷은 존재론적 의미 구분 자체가 세계의 질서와 부합하느냐의 문제에는 그다지 심각한 의문을 던지고 있지 않은 것으로 보인다. 이글스 레포트를 포함해서 위에서 살펴본 존재론적 범주구분의 특징은 언어사용자들의 사용을 참조해서 상승(Bottom-Up)전략의 방식으로 이루어졌다는 점이다. 이것은 브랜덤 식의 용어로 표현하자면 언어사용자들간의 의무론적 점수관리를 범주구분에 철저히 반영하고 있다고 보아도 좋을 것이다.

한국어 워드넷을 구성할 경우 존재론적 범주구분은 당연히 영어나 그밖의 언어와 달라야 할 것이다. 영어 사용자들간에 이루어지고 있는 의무론적 점수관리 방식과 한국어 화자들의 의무론적 점수관리 방식은 그 규칙이 다를 것이기 때문이다.

코퍼스 언어학은 브랜덤식의 추론주의에 입각한 존재론적 범주구분의 한가지 대안이 될 수 있을 것이다. 토이버트는 코퍼스 언어학에 대해 다음과 같이 말하고 있다.

"코퍼스 언어학은 언어가 근본적으로 사회적 현상이라는 개념에 기초한다. 즉 언어는 이용가능한 데이터, 다시 말해 커뮤니케이션 행위 안에서 관찰되고 서술될 수 있는 사회적 현상이다. 말뭉치는 모든 커뮤니케이션 행위를 포괄하는 담론 우주의 단면이다.

언어를 사회적 현상으로 보는 것은 화자나 청자가 단어, 문장, 텍스트를 어떻게 이해하는지 알려고 하지 않겠다는 것을 함축한다."

여기서 언어사용자가 단어, 문장, 텍스트를 어떻게 이해하는지 알려고 하지 않겠다는 것은 화용론적 차원을 무시하겠다는 것이 아니라 화용론적인 의무론적 점수관리의 결과로서 얻어진 것이 말뭉치이기 때문에 브랜덤 같은 철학자가 밝혀내야 할 그 암묵적인 추론의 규칙에 대해서는 직접적으로 다루지 않겠다는 것으로 보아야 할 것이다. 토이버트의 다음과 같은 언급은 브랜덤의 작업과 코퍼스 언어학이 얼마나 유사한 관심을 가지고 있는지를 보여준다.

"텍스트 요소의 의미에 대한 일개국어 공동체의 규약이 원칙적으로 번역자가 속한 공동체의 그것과 다르다고 가정할 이유는 없다. 그 규약은 지속적인 바꾸어 말하기의 행위에 의해 안정화되지 않기 때문에 덜 반영되고 덜 명확할 수 있다. 언어학이 파악하고자 하는 것은 언어학적 실천, 사람들이 언어를 다루는 방식이다. 언어학은 이 암묵적인 능력을 명확한 지식으로 전환할 것을 목표로 한다. 다국어 코퍼스 의미론은 이런 목표에 기여한다."

말뭉치에 기반한 존재론적 범주구분이 이루어진다면 의미론적 범주에 대한 선험적인 정당화의 부담을 피해갈 수 있다는 점에서 의미있는 일이 될 것이다.