자연어처리(NLU)를 하기 위한 소프트웨어 아키텍쳐 - 걸음마단계부터 인간 수준으로 진화하는 방향에 대해 알아본다

春

31437
Created at 2016-07-01 14:36:00

422

자연어 처리의 역사는 1950년대로 거슬러 올라가야 합니다. 당시 지금과 같은 컴퓨터 기술이 없었을때도 로봇이 사람의 말을 알아들을 수 있을까에 대한 의구심이 있었습니다. 또한 어떻게 하면 로봇이 사람의 말을 인지할 수 있을까에 대한 궁금증 또한 있었습니다.

인공지능의 가장 큰 도전과제는 어떻게 지식을 이해하고 표현할 것인가일 것입니다. 이해하는 것과 표현하는 것은 다를 것 같지만, 결국 그 둘의 공통분모는 이를 어떻게 정보화 할 것이냐에 대한 결과로 도출이 됩니다.

자연어처리라는 학문은 NLU라고 부르며 Natural Language Understanding의 줄임말입니다. 즉, 자연어에 대한 이해…

우리가 사용하는 언어는 일련의 규칙을 가지고 있으며, 여러가지 상황이 얽혀 있습니다. 소프트웨어 측면에서는 Multiple Query의 조합(Combination)이라고 할 수 있으며, 이는 어떠한 상황(State)에 대한 정보도 포함합니다.

이를 흐름도로 도식화 하면 다음과 같이 나타 낼 수 있습니다.

자연어처리(NLU)를 하기 위한 소프트웨어 아키텍쳐 - 걸음마단계부터 인간 수준으로 진화하는 방향에 대해 알아본다

우리가 어떠한 사실이나 개체를 인지할때는 대화를 통해서 알게 됩니다. 이것이 축적되면 굳이 대화를 나누지 않아도 우리 머리속에 그러한 상황정보가 남게 되고, 굳이 여러 대화를 나누지 않아도 한방에 알 수 있게 되는 것입니다.

결국 우리가 자연어처리 시스템을 구축한다고 하면 결국 “대화형 시스템”을 구축한다라고… 말해야 하는 것이 맞습니다. 대화형 시스템의 3단계 레이어를 도식화 하면 다음과 같이 나타 낼 수 있습니다.

자연어처리(NLU)를 하기 위한 소프트웨어 아키텍쳐 - 걸음마단계부터 인간 수준으로 진화하는 방향에 대해 알아본다

위의 그림에서 Dialogue Manager에서 핵심적인 기능은 있는 정보를 오케스트레이션(잘 버무리는 것; Dialog Orchestration)입니다. 이를 가능하게 하려면 양질의 메타데이터와 그에 따른 빅데이터가 있어야 가능할 것입니다.

자연어처리(NLU)를 하기 위한 소프트웨어 아키텍쳐 - 걸음마단계부터 인간 수준으로 진화하는 방향에 대해 알아본다

대화 시 상황정보를 받아들이는 계층을 도식화 하면 다음과 같이 표현 할 수 있습니다. 소프트웨어적 측면에서는 다음의 4단계로 나눌 수 있습니다.

명령(Command)

질문(Question)

할 일(Task)

잡담(Chat)

자연어처리(NLU)를 하기 위한 소프트웨어 아키텍쳐 - 걸음마단계부터 인간 수준으로 진화하는 방향에 대해 알아본다

지금까지 구현된 대화형 솔루션은 3번까지입니다. 4번의 경우 일부 업체들이 그러한 기술을 구현했고, 계속 발전하고 있는 상태입니다.

대화형 솔루션의 궁극의 목표는 누가 말했느냐… 까지 구현하는 것일 것입니다.

자연어처리(NLU)를 하기 위한 소프트웨어 아키텍쳐 - 걸음마단계부터 인간 수준으로 진화하는 방향에 대해 알아본다

이러한 정보를 효과적으로 오케스트레이션하는 방법론으로는 다음과 같은 접근이 가능할 것입니다.

자연어처리(NLU)를 하기 위한 소프트웨어 아키텍쳐 - 걸음마단계부터 인간 수준으로 진화하는 방향에 대해 알아본다

마지막으로 자연어 처리는 Rule-based DM(Dialog Management) 또는 Data-based DM(Dialog Management)를 기반으로 동작하게 될 것입니다.

자연어처리(NLU)를 하기 위한 소프트웨어 아키텍쳐 - 걸음마단계부터 인간 수준으로 진화하는 방향에 대해 알아본다

현실적으로 자연어처리 소프트웨어를 만든다면 “자연어 처리로 무엇을 할 것이냐”에 대한 답을 가지고 있어야 가능 할 것입니다.

예를 들면 다음과 같은 목표가 있어야 합니다.

IPTV 서비스를 위한 콘텐츠 추천

홈표핑을 위한 제품 추천

제품 고장 처리를 위한 문제점 확인

아마도 가까운 미래에는 위와 같은 DM Engine이 많이 만들어져 있을 것이고, 이것을 다시 오케스트레이션 하는 통합 엔진이 나올 것입니다. 그러면 정말 인간과 가까와지는 천재 로봇이 나올지도 모르겠군요.

Tags: Chat Command Dialog Orchestration NLU Natural Language Understanding Query Question Task 검색 대화형 대화형 솔루션 상황정보 아키텍쳐 오케스트레이션 자연어처리 질문 추천 알고리즘 할 일 홈쇼핑

◀ PREVIOUS
SK 텔링크 선불전화 충전 방법

▶ NEXT
LED 리폼으로 보다 밝은 거실/부엌 만들고, 더불어 전기요금 절감에 도전

Comments 0

자연어처리(NLU)를 하기 위한 소프트웨어 아키텍쳐 - 걸음마단계부터 인간 수준으로 진화하는 방향에 대해 알아본다

구글 머신러닝 솔루션 텐서플로(Google Machine Learning - TensorFlow) 오픈소스 공개에 따른 현재와 미래의 비젼 (created at 2015-11-15)

Machine Learning Tool의 종류와 용도 (created at 2017-03-12)

EIDR(Entertainment IDentifier Registry) - 콘텐츠 ID 표준화를 이끄는 미디어/엔터테인먼트 서비스 연관 국제 표준 단체 (created at 2015-10-17)

인텔이 주장하는 데이터 센터 아키텍쳐의 미래는 Software-Defined Infrastructure(SDI) (created at 2015-06-18)

Layered pattern은 PC App, 쇼핑몰(이커머스) 웹사이트 등이 주로 쓰는 아키텍쳐 패턴 (created at 2017-12-14)

Client-server pattern은 TCP/IP를 통해 데이터를 주고 받는 이메일, 웹하드 등이 주로 이용하는 아키텍쳐 (created at 2017-12-15)

Master-slave pattern은 장애 대응을 위한 Database 복제 등 병렬처리 및 Disaster Recovery 대응 로직에 주로 이용 (created at 2017-12-16)

Pipe-filter pattern은 컴파일러와 같이 통해 연속되는 필터링 기법을 통한 분석을 하는 아키텍쳐에 주로 이용 (created at 2017-12-17)

Broker pattern은 Apache ActiveMQ, Apache Kafka, RabbitMQ 등 메시지 미들웨어 같은 아키텍쳐에 주로 이용 (created at 2017-12-18)

Peer-to-peer pattern은 BitTorrent와 같이 파일공유 솔루션이나 P2PTV, PDTP와 같은 멀티미디어 프로토콜에 주로 이용 (created at 2017-12-19)

Event-bus pattern은 Push Notification Service, 안드로이드 앱 개발에 주로 응용되는 아키텍쳐 (created at 2017-12-20)

MVC(Model-view-controller) pattern은 Django, Rails와 같은 웹 어플리케이션 개발에 주로 응용되는 아키텍쳐 (created at 2017-12-21)

Blackboard pattern은 오늘날 NLU(Natural Language Understanding)이나 차량인식 등에 응용되는 아키텍쳐 (created at 2017-12-22)

Interpreter pattern은 SQL 또는 통신프로토콜을 기술하는 언어 구현시 주로 이용되는 아키텍쳐 (created at 2017-12-23)

아키텍쳐 패턴이란 - 소프트웨어 디자인 패턴 (updated at 2023-12-17)

집단지성을 활용하는 Collaborative Filtering(CF) 알고리즘 - 추천 알고리즘으로 많이 이용되고 있지만, 한계도 알아야 해 (created at 2014-08-27)

질문을 짧고 단순하게 하는 것이 최고의 질문 (created at 2014-08-06)

편안함의 혁명! 라인은 지우고 가볍게 - 날개부터 끝까지! 360도 헴브라 - 게다가 노와이어 (created at 2014-07-22)

아틀라시안 뱀부(Atlassian Bamboo)를 활용한 CI(Continuous Integration) 환경 구축 (created at 2018-06-20)

플러거블 스토리지 엔진을 가진 MySQL 아키텍쳐 - InnoDB는 인메모리 캐싱을 하는 고성능 솔루션 (created at 2018-07-02)

넷플릭스 서비스 오토스케일링 아키텍쳐 (created at 2018-07-10)

AWS 기반 서버 없는 아키텍쳐(Server-less back-end architecture) (created at 2018-07-11)

마이크로 서비스 아키텍쳐 (MSA, Micro Service Architecture)의 장단점 및 구현 방법 (created at 2018-07-13)

구라파닷컴 서버 이전 - 뉴욕에서 한국으로 (created at 2014-04-07)

면접 시 반드시 준비해야 할 것들-장소와 시간, 주차정보는 기본, 면접관 직함 및 성함, 회사 연혁 및 재무상황은 기본, 질문도 미리 준비해야 할 필수 준비 (created at 2014-02-12)

서버 인프라 설계시 장애를 고려하여 만드는 Single Infra, Active-Stand-by,Active-Active, Active-Stand-by/Active-Active+DR Center (updated at 2023-12-17)

서버 이전 및 플렛폼 변경에 따른 카테고리 분류 작업 완료 (created at 2012-08-19)

소녀시대 윤아랑 사귀는 방법 (created at 2008-10-05)

인터넷에 질문을 올리고 답변을 얻는 효과적인 방법 (created at 2008-10-02)

2-Tier 아키텍쳐와 3-Tier 아키텍쳐의 다른점 (created at 2007-05-04)

Pipe-filter pattern은 컴파일러와 같이 통해 연속되는 필터링 기법을 통한 분석을 하는 아키텍쳐에 주로 이용 (created at 2017-12-17)

Master-slave pattern은 장애 대응을 위한 Database 복제 등 병렬처리 및 Disaster Recovery 대응 로직에 주로 이용 (created at 2017-12-16)

Client-server pattern은 TCP/IP를 통해 데이터를 주고 받는 이메일, 웹하드 등이 주로 이용하는 아키텍쳐 (created at 2017-12-15)

Layered pattern은 PC App, 쇼핑몰(이커머스) 웹사이트 등이 주로 쓰는 아키텍쳐 패턴 (created at 2017-12-14)

삼성 MG900 블루투스 헤드셋 페어링 방법 (EO-MG900) (created at 2017-12-14)

추억의 스타크래프트 사무실에서 한판 뜨기 - IPX가 안되어 방법을 찾아 보았습니다 (created at 2017-10-30)

갑자기 컴퓨터가 너무 느려져 내가 한 일 - 백신프로그램 하나를 제외한 나머지를 다 지우니 해결 (created at 2017-07-15)

코드리뷰도 생산성 있게 - Visual Studio Code를 이용하여 코드리뷰 중 JIRA에 이슈 등록하는 방법 (created at 2017-07-14)

구입 후 만족스러웠던 맥북프로 케이스 - insquare 2017 맥북프로 13/15 터치바 케이스 (created at 2017-06-21)

원격 폴더를 외장 하드처럼 자유롭게 써 보자 - 마운틴덕(Mountain Duck) (created at 2017-04-14)

CentOS에서 포트 여는 방법 - iptables를 이용하여 80포트, 22번 포트 등을 열어 (created at 2017-03-14)

CentOS 6.x에 APM(Apache+PHP+MySQL) 설치 및 초기 설정 방법 (created at 2017-03-14)

Machine Learning Tool의 종류와 용도 (created at 2017-03-12)

논문/특허 인용여부를 검색해주는 웹사이트 (created at 2016-10-25)

LED 리폼으로 보다 밝은 거실/부엌 만들고, 더불어 전기요금 절감에 도전 (created at 2016-09-30)

SK 텔링크 선불전화 충전 방법 (created at 2016-04-03)

구글 머신러닝 솔루션 텐서플로(Google Machine Learning - TensorFlow) 오픈소스 공개에 따른 현재와 미래의 비젼 (created at 2015-11-15)

EIDR(Entertainment IDentifier Registry) - 콘텐츠 ID 표준화를 이끄는 미디어/엔터테인먼트 서비스 연관 국제 표준 단체 (created at 2015-10-17)

스마트 TV에 이어 스마트폰까지 진출한 중국의 동영상 업체 LeTV (updated at 2023-10-03)

엑셀(EXCEL) 사용시 한자(중국어)를 한글로 번역하는 방법 (created at 2015-05-14)

서버 해킹 도대체 누가? (created at 2015-01-20)

8K 고화질 영상 - 섬세한 화질과 현란한 색상에 매료되 (created at 2014-10-27)

놀랍게 빨라진 동남아 국가들의 인터넷 속도 - 싱가폴, 태국, 베트남, 대만, 홍콩 등 동남아 국가들의 아시아 인터넷 속도는 세계적 수준, 동남아의 나머지 국가들도 2015년 부터는 무시 못할 것 (created at 2014-10-02)

애플과 삼성의 스마트폰, 스마트 워치 제품 경쟁 - 소비자로서 흥미진진하고 기대 되, 다음의 블루오션은 뭐!? (created at 2014-09-11)

MAC에 Apache, PHP, MySQL 설치 - MAMP로 쉽게 설치 할 수 있어 (created at 2014-09-03)

집단지성을 활용하는 Collaborative Filtering(CF) 알고리즘 - 추천 알고리즘으로 많이 이용되고 있지만, 한계도 알아야 해 (created at 2014-08-27)

제트기류(Jet Stream)란 (created at 2014-07-26)

Ahrefs bot의 비상식적 사이트 크롤링 접근 차단 - robots.txt 수정 또는 .htaccess 파일 수정을 통해 차단 가능해 (created at 2014-06-09)

우분투(ubuntu)에서 메모리 용량 확인하는 방법 (created at 2014-06-09)

우분투 소켓 접속 제한 풀어 소켓 갯수 늘리기(How to increase maximum socket connection in Ubuntu?) (updated at 2023-12-17)

글루코사민 vs. 콘드로이친: 무엇이 더 나은 관절 건강 보조제일까? (created at 2024-04-22)

광주 5·18 민주화운동 알린 테리 앤더슨 前 AP 기자 (created at 2024-04-22)

햄과 소세지가 우리 몸에 일으키는 부작용 (updated at 2024-04-22)

콘드로이친의 염증 감소효과 (updated at 2024-04-22)

코사민 DS - 글루코사민+콘드로이친 복합물이 함유된 퇴행성 관절 건강보조제 (updated at 2024-04-22)

삼겹살 먹을때 환상조합 (created at 2024-04-22)

일본 여중생의 특이한 취향 (created at 2024-04-22)

우리가 먹는 약물이 바꿔버린 생태계 (created at 2024-04-21)

일본에서 그린 상상속의 사무직과 현실속의 사무직 (updated at 2024-04-21)

북한 미대생들이 그린 북한 최고존엄 김정은 (created at 2024-04-21)

입사 후 1년도 되지 않은 회사에서 구조조정에 의한 퇴직 불응에 따른 해고 처리시 대응 가능한 방법 (updated at 2024-04-20)

한고은님의 옛날 사진 (updated at 2024-04-20)

소녀대 - Bye Bye Girl (updated at 2024-04-13)

대한민국 날씨 근황 (created at 2024-04-13)

성일종 인재육성 강조하며 이토 히로부미 언급 - 인재 키운 선례? (updated at 2024-04-13)

일제강점기가 더 살기 좋았을지도 모른다는 조수연 국민의힘 후보 - 친일파? (updated at 2024-04-13)

Marshall Ha님의 샤오미 SU7 시승기 - 테슬라의 일론 머스크님이 긴장할만한 느낌 (updated at 2024-04-09)

윙크하는 귀염둥이 반려견들 (created at 2024-04-08)

달콤 살벌한 고백 (created at 2024-04-08)