아티클 읽기

[아티클 읽기] LLM이란 무엇인가? (1) - 정의

doo_ 2024. 1. 5. 13:33

[내용 정리]

0. 언어 모델(LM : Language Model) 이란

> 인간의 언어를 이해하고 생성하도록 훈련된 일종의 인공지능 모델

- 주어진 언어 내에서 패턴이나 구조, 관계를 학습하여 텍스트 번역과 같은 좁은 AI 작업에서 주로 활용되었다.

- 언어 모델의 품질은 크기나 훈련된 데이터의 양 및 다양성, 훈련 중에 사용된 학습 알고리즘의 복잡성에 따라 달라진다.

 

1. 거대 언어 모델(LLM : Large Language Model)

> 대용량의 언어 모델을 의미한다.

- 딥러닝 알고리즘과 통계 모델링을 통해 자연어 처리(NLP) 작업을 수행하는 데에 사용한다.

- 사전에 대규모 언어 데이터를 학습하여 문장 구조나 문법, 의미 등을 이해하고 생성할 수 있다.

ex. GPT4 / BERT

+) NLP :

- 인간의 언어를 이해하고 처리하는 데 초점을 맞춘 인공지능 분야

- 컴퓨터가 자연어 텍스트를 이해하고 분석하는 기술을 개발하는 것을 목표

- NLP는 문장 구분 분석, 텍스트 분류, 기계 번역, 질의 응답 시스템, 감정 분석 등과 같은 다양한 작업에 활용

- LLM은 NLP 안에서 특정한 접근 방식과 모델을 가리키는 한 가지 형태

 

2. LLM이 중요한 이유

> 다양한 유형의 소통이 필요한 언어나 시나리오에 적합하다.

 

3. LLM 및 기초 모델이 비즈니스 환경에 미치는 영향

> 작업 자동화 

> 고객 서비스 개선 

> 창의적인 콘텐츠 생성 

> 더 나은 비즈니스 의사 결정 

 

4. 언어 모델 유형

> SLM(Small LM) : 제한된 양의 텍스트 데이터를 학습하여 극소적인 문맥을 이해하는 데에 초점

> NLM(Neural LM) : 단어 임베딩, 문장 완성, 기계 번역 등 사용

> PLM(Pretrained LM) : 대규모 데이터셋으로 미리 학습되며, 이후 다양한 NLP작업에 전이학습을 통해 적용된다. BERT와 GPT와 같은 주요 모델들은 이 PLM에 속한다.

 

5. LLM에서 자주 사용하는 용어

> 단어 임베딩 : 각 단어 간의 유사성과 관계를 캡처하는 기술

> 주의 메커니즘 : 입력 시퀀스의 다양한 부분에 가중치를 부여하여 모델이 중요한 정보에 집중할 수 있도록 하는 기술

> Transformer : 주의 메커니즘을 기반으로 한 인코더와 디코더 구조의 신경망 모델로 길이가 다른 시퀀스를 처리하는 데 탁월한 성능

> fine-tuning LLMs : 사전 학습된 대규모 언어 모델을 특정 작업에 적용하기 위해 추가 학습하는 과정

> Bias(편향) : 모델이 학습 데이터의 불균형이나 잘못된 패턴을 포착하여 실제 세계의 현실과 일치않는 결과를 내놓는 경향

> 해석 가능성 : LLM이 가진 복잡성을 극복하고 AI시스템의 결과와 결정을 이해하고 설명할 수 있는 능력

 

6. LLM 작동 방식 및 원리 ___

[출처] https://www.thedatahunt.com/trend-insight/what-is-llm

 

LLM이란 무엇인가? - 정의, 원리, 주요 모델, 적용 사례

LLM (거대 언어 모델, Large Language Model) 은 딥 러닝 알고리즘과 통계 모델링을 통해 NLP 작업을 수행하는 데에 사용합니다. 최근 생성 AI의 가능성이 주목 받으면서, LLM의 시장성과 가치가 더욱 주목

www.thedatahunt.com