인공지능 (AI, Artificial Intelligence)
컴퓨터에서 인간과 같이 사고하고 생각하고 학습하고 판단하는 논리적인 방식을 사용하는 인간지능을 본 딴 고급 컴퓨터 프로그램을 말한다. 인간의 지능으로 할 수 있는 사고, 학습, 자기 개발 등을 컴퓨터가 할 수 있도록 하는 방법을 연구하는 컴퓨터 공학 및 정보기술의 한 분야로서, 컴퓨터가 인간의 지능적인 행동을 모방할 수 있도록 하는 것을 인공지능이라고 말하고 있다.
인공지능은 크게 둘로 나뉜다. ‘약한(Weak) AI’와 ‘강한(Strong) AI’다. 약한 AI는 특정 영역의 문제를 푸는 기술이다. ‘단어를 입력하면 검색 결과를 보여라’, ‘음성을 듣고 무슨 말인지 인식하라’ 같은 문제를 푸는 것이다. 강한 AI는 이와 달리 문제의 영역을 좁혀주지 않아도 어떤 문제든 해결할 수 있는 기술 수준을 말한다.
약한 AI을 구현할 때는 머신러닝(기계학습)을 사용한다. 딥러닝과 머신러닝이라는 용어가 혼용되고 있지만, 머신러닝이 좀 더 큰 개념이다. 머신러닝의 방법론 중 하나가 딥러닝이다. 딥러닝은 머신러닝 방법론 중 가장 많이 쓰이는 것이기도 하다.
① 자연언어처리(natural language processing) 분야에서는 이미 자동번역과 같은 시스템을 실용화하며, 특히 연구가 더 진행되면 사람이 컴퓨터와 대화하며 정보를 교환할 수 있게 되므로 컴퓨터 사용에 혁신적인 변화가 오게 될 것이다.
② 전문가시스템(expert system) 분야에서는 컴퓨터가 현재 인간이 하고 있는 여러 가지 전문적인 작업들(의사의 진단, 광물의 매장량 평가, 화합물의 구조 추정, 손해 배상 보험료의 판정 등)을 대신할 수 있도록 하는 것이다. 여러 분야 가운데서도 가장 일찍 발전하였다.
③ 컴퓨터가 TV 카메라를 통해 잡은 영상을 분석하여 그것이 무엇인지를 알아내거나, 사람의 목소리를 듣고 그것을 문장으로 변환하는 것 등의 일은 매우 복잡하며, 인공지능적인 이론의 도입 없이는 불가능하다. 이러한 영상 및 음성 인식은 문자 인식, 로봇 공학 등에 핵심적인 기술이다.
④ 이론증명(theorem proving)은 수학적인 정리를 이미 알려진 사실로부터 논리적으로 추론하여 증명하는 과정으로서 인공지능의 여러 분야에서 사용되는 필수적인 기술이며, 그 자체로도 많은 가치를 지니고 있다.
⑤ 신경망(neural net)은 비교적 근래에 등장한 것으로서 수학적 논리학이 아닌, 인간의 두뇌를 모방하여 수많은 간단한 처리기들의 네트워크로 구성된 신경망 구조를 상정하는 것이다.
기계학습, 머신러닝 (Machine Learning)
인간의 학습 능력과 같은 기능을 컴퓨터에서 실현하고자 하는 기술 및 기법. 머신 러닝은 경험적 데이터를 기반으로 학습을 하고 예측을 수행하고 스스로의 성능을 향상시키는 시스템과 이를 위한 알고리즘을 연구하고 구축하는 기술이라 할 수 있다. 머신러닝은 크게 알고리즘, 데이터, 하드웨어 인프라로 구성된다. 머신러닝의 핵심은 데이터의 양이다. 데이터의 양이 많을수록 품질이 올라간다. 데이터가 많으면 수많은 데이터를 처리할 인프라를 구축해놔야 한다. 머신 러닝의 알고리즘들은 엄격하게 정해진 정적인 프로그램 명령들을 수행하는 것이라기보다, 입력 데이터를 기반으로 예측이나 결정을 이끌어내기 위해 특정한 모델을 구축하는 방식을 취한다.
머신 러닝 알고리즘은 학습 시스템에 정보 및 데이터를 입력하는 형태에 따라 크게 세 가지로 나뉜다.
① 감독(supervised) 학습 : 입력과 이에 대응하는 미리 알려진 출력(인간 전문가가 제공)을 매핑(mapping)하는 함수를 학습하는 과정이다.
② 비감독(unsupervised) 학습 : 출력 없이 입력만으로 모델을 구축하여 학습한다. 일반적으로 데이터마이닝의 대부분의 기법이 이에 해당한다.
③ 강화(reinforcement) 학습 : 학습자가 행동을 선택하여 행동으로 환경에 영향을 미치고, 이에 대한 피드백으로 보상치를 얻어 학습 알고리즘의 가이드로 사용한다.
머신 러닝의 기법 및 모델들로는 트리 구조 형태를 예측 모델로 사용하는 의사 결정 나무(Decision Tree), 생물의 신경 네트워크 구조와 기능을 모방하는 인공 신경망(Neural Network), 생물의 진화 알고리즘에 기반한 유전자 프로그래밍(Genetic Programming), 관측된 예를 군집이라는 부분집합으로 분배하는 군집화(Clustering), 무작위로 추출된 난수를 통해 함수값을 확률로 계산하는 몬테카를로 방법(Monter Carlo method) 등이 있다.
머신 러닝은 컴퓨터 과학을 포함한 대부분의 모든 분야에서 활용되고 있으며, 컴퓨터 시각(문자 인식, 물체 인식, 얼굴 인식), 자연어 처리(자동 번역, 대화 분석), 음성 인식 및 필기 인식, 정보 검색 및 검색 엔진(텍스트마이닝, 스팸 필터, 추출 및 요약, 추천 시스템), 생물 정보학(유전자 분석, 단백질 분류, 질병 진단), 컴퓨터 그래픽 및 게임(애니메이션, 가상현실), 로보틱스(경로 탐색, 무인 자동차, 물체 인식 및 분류) 등의 분야에서 응용되고 있다.
딥러닝 (Deep Learning)
머신러닝의 대표적인 학습법이 아래 그림처럼 여러 층을 거쳐 점점 추상화 단계로 접어드는 알고리즘 형태인 ‘딥 러닝(Deep Learning)’이다. 딥러닝은 사물이나 데이터를 군집화하거나 분류하는 데 사용하는 기술이다. 과거엔 데이터들을 사전지식을 동원해 분류했지만, 딥러닝은 사전지식을 사용하지 않는다. 일단 데이터를 넣어놓고 기계가 스스로 특성을 분류한다. 이때 무작정 데이터가 많아선 안 되며, 실제로 찾는 사진을 무엇인지 알려주는 이른바 ‘정답’ 데이터도 많아야 한다. 기술 기업이 딥러닝을 활용하는 분야는 주로 사진과 동영상, 음성 정보를 분류하는 쪽이다. 데이터의 양이 풍부하고, 정확성을 요구하기 때문이다.
'용어정리' 카테고리의 다른 글
클라우드 / 클라우드 컴퓨팅 / SaaS / PaaS / IaaS (0) | 2021.04.02 |
---|---|
빅데이터 / 플랫폼 / 인프라 / 프레임워크 (0) | 2021.04.01 |
사물인터넷 (IOT) / 유비쿼터스 / USN / RFID (0) | 2021.03.30 |
인터넷(Internet) / 인트라넷(Intranet) / WWW / 웹브라우저 / 웹서버 / HTTP / DNS/아르파넷(ARPAnet) / TCP/IP (0) | 2021.03.29 |
정보기술(IT) / 정보통신기술(ICT) / 지능정보기술 / 4차 산업혁명 (0) | 2021.03.29 |