최근 생성형 AI들의 지속적인 발전과 함께 IT 직군이 아니더라도 많은 사람들이 AI에 관심을 가지게 되었다. 그중 LLM이 무엇인지 확인해 보자
LLM이란?
Large Language Model 의 약자로, 자연어 처리에서 사용되는 기술 중 한 종류를 의미합니다. 자연어 처리(NLP)란 인간의 언어를 해석하고 조작 및 이해하는 능력을 컴퓨터에 부여하는 기계 학습 기술 입니다.
LLM은 텍스트를 인식하고 생성하는 등의 작업을 수행할 수 있는 일종의 인공 지능 프로그램으로 방대한 데이터 세트를 학습하므로 대규모 (Large) 라는 이름이 붙었습니다.
LLM은 문자, 단어, 문장이 함께 작동하는 방식을 이해하기 위해 딥러닝이라는 일종의 머신 러닝을 사용합니다.
그런 다음 튜닝을 통해 추가 학습이 이루어집니다. 질문을 해석하고 답변을 생성하거나 한 언어에서 다른 언어로 텍스트를 번역하는 등 프로그래머가 원하는 특정 작업에 맞게 미세 조정됩니다.
LLM은 다양한 작업을 수행하도록 학습될 수 있습니다. 가장 잘 알려진 사용 사례 중 하나는 생성형 AI 입니다. ChatGPT를 예로들자면 사용자 입력에 대한 응답으로 에세이, 시, 기타 텍스트 형식의 글을 생성할 수 있습니다.
프로그래밍 언어를 포함한 모든 크고 복잡한 데이터 집합을 LLM 학습에 사용할 수 있습니다. 일부 LLM은 프로그래머가 코드를 작성하는 데 도움이 될 수 있습니다. 이들은 요청에 따라 함수를 작성하거나 시작점으로 일부 코드가 주어지면 프로그램 작성을 완료할 수 있습니다.
LLM은 챗봇, DNA 연구, 온라인 검색 등 다양한 분야에서 사용이 가능합니다.
출처 : https://www.cloudflare.com/ko-kr/learning/ai/what-is-large-language-model/
댓글
댓글 쓰기