KT가 한국의 문화와 가치를 담은 차세대 거대언어모델(LLM) ‘믿:음 2.0’을 공개하며 AI 시장에서 새로운 바람을 일으키고 있다. 2023년 ‘믿:음 1.0’을 선보인 이후 2년 만에 업그레이드된 이번 모델은 한국적 AI의 철학을 바탕으로 국내 환경에 최적화된 기술로 주목받는다. KT는 이를 통해 정부의 소버린 AI(주권 AI) 정책에 적극 동참하며, 한국 AI 생태계의 자립을 목표로 나아가고 있다. 믿:음 2.0의 특징, 기술적 차별점, 그리고 KT의 AI 비전을 알아보자.
한국적 AI의 철학, 믿:음 2.0의 시작
KT가 ‘한국적 AI’라는 비전을 담아 개발한 거대언어모델 ‘믿:음 2.0’이 드디어 베일을 벗었다. 한국의 언어, 문화, 사고방식을 기반으로 설계된 이 모델은 단순한 기술적 진보를 넘어, 국내 사용자와 환경에 최적화된 AI를 구현하려는 KT의 야심찬 목표를 보여준다. KT는 믿:음 2.0을 통해 한국의 AI 주권을 강화하고, 글로벌 AI 기술 의존도를 줄이는 데 기여하고자 한다.
‘한국적 AI’는 단순히 한국어를 잘 이해하는 모델을 넘어, 한국의 역사, 문화, 가치관을 반영한 AI를 의미한다. KT Gen AI Lab의 신동훈 상무는 “한국의 말과 문화를 깊이 이해하는 모델을 만들기 위해 노력했다”며, 믿:음 2.0이 독자적인 한국적 AI의 정체성을 담고 있다고 강조했다. 이는 단순한 언어 처리 능력을 넘어, 한국 사용자들이 공감하고 신뢰할 수 있는 AI 경험을 제공하려는 시도다.
믿:음 2.0의 두 가지 모델: 베이스와 미니
믿:음 2.0은 두 가지 모델로 구성되어 다양한 사용 사례를 지원한다. 첫 번째는 115억 파라미터 규모의 ‘믿:음 2.0 베이스’로, 범용 서비스에 적합하며 한국 특화 지식과 문서 기반 질의응답에서 뛰어난 성능을 자랑한다. 두 번째는 23억 파라미터의 ‘믿:음 2.0 미니’로, 베이스 모델의 지식을 증류해 경량화한 모델이다. 이 미니 모델은 성능과 효율성을 균형 있게 제공하며, 리소스가 제한적인 환경에서도 활용 가능하다.
뿐만 아니라 KT는 조만간 더욱 고도화된 ‘믿:음 2.0 프로’ 모델을 공개할 예정이다. 이 프로 모델은 특정 도메인에서의 전문성을 한층 강화해, 공공, 금융, 교육, 법률 등 다양한 분야에서 활용될 가능성을 열어둔다. 이러한 모델 라인업은 KT가 다양한 산업과 사용자를 아우르는 유연한 AI 솔루션을 제공하려는 의지를 보여준다.
데이터 품질에 집중한 개발 과정
믿:음 2.0의 개발 과정에서 KT는 데이터 품질과 윤리적 책임에 특히 신경 썼다. KT 관련자는 “합법적이고 양질의 데이터를 체계적으로 학습시키는 데 주력했다”고 밝혔다. 이를 위해 KT는 고려대학교 민족문화연구원과 협력해 학술적 신뢰도를 높였으며, 다양한 기관 및 기업과의 데이터 얼라이언스를 통해 고품질 데이터를 수집했다.
특히, 상업적 이용이 불가능하거나 저작권 문제가 있는 데이터는 철저히 배제했다. KT는 도메인별 데이터를 선별하고 체계적인 데이터 믹싱 기법을 적용해 모델의 성능을 최적화했다. 이 과정에서 데이터 구축부터 모델 학습까지 전 과정을 자체 기술로 완수해 저작권 이슈를 원천 차단했다는 점도 강조했다. 이는 믿:음 2.0이 신뢰할 수 있는 한국형 AI 모델로 자리 잡는 데 중요한 기반이 된다.
소버린 AI와 KT의 비전
KT는 믿:음 2.0을 소버린 AI의 핵심 모델로 내세우며, 데이터 주권, 모델 선택의 자유, 한국적 가치 반영, 책임 있는 AI 구현이라는 네 가지 철학을 강조했다. 소버린 AI는 단순히 기술적 자립을 넘어, 국가와 국민의 데이터를 안전하게 보호하고, 한국의 문화와 가치를 AI에 녹여내는 것을 목표로 한다.
KT는 정부가 추진하는 ‘AI 파운데이션 모델’ 사업에도 적극 참여해 이재명 정부의 소버린 AI 정책에 힘을 보탠다. 이 사업은 민간과 공공의 역량을 결집해 세계적 수준의 한국형 AI 모델을 개발하고, 오픈소스 공개를 원칙으로 글로벌 AI 기술 의존도를 낮추는 것을 목표로 한다. 신 상무는 “1년여간 구축한 고품질 데이터가 독자적인 AI 파운데이션 구축에 강점이 될 것”이라며, 이를 통해 한국의 AI 경쟁력을 높이고 국민들에게 실질적인 혜택을 제공하겠다고 밝혔다.
경쟁사와의 차별점: 스크래치부터 시작한 믿:음
KT는 경쟁사인 SKT의 한국어 특화 LLM ‘A.X 4.0’과의 차별점도 언급했다. A.X가 720억 파라미터의 대형 모델과 70억 파라미터의 경량 모델로 구성되어 믿:음 2.0보다 규모가 크지만, 모델 크기만으로 성능을 비교하는 것은 의미가 없다고 지적했다. 특히, 믿:음 2.0은 처음부터 직접 개발(스크래치)한 모델인 반면, A.X는 외부 모델을 기반으로 중간 단계부터 학습(미드트레이닝)을 진행했다는 점에서 개발 방식의 차이가 있다고 강조했다.
이러한 스크래치 기반 개발은 KT가 독자적인 기술력을 바탕으로 한국형 AI의 정체성을 확립하려는 의지를 보여준다. 이는 단순히 기술적 차이를 넘어, 한국의 AI 생태계를 자립적으로 구축하려는 KT의 장기적인 비전을 반영한다.
MS와의 협업: 글로벌 기술과 한국적 가치의 조화
KT는 자체 모델 개발뿐 아니라 마이크로소프트(MS)와의 협업을 통해 GPT-4에 한국적 사고를 추가 학습시킨 모델도 개발 중이다. 이는 KT가 글로벌 최고 수준의 기술을 활용하면서도 한국 시장에 맞는 가치를 담아내고자 하는 ‘투 트랙’ 전략의 일환이다. 신 상무는 “고객이 최고 성능의 모델을 통해 AI 전환(AX)을 원한다면, 이에 부응하는 모델을 제공할 것”이라며, 자체 기술과 글로벌 협업의 균형을 강조했다.
MS와 협업한 GPT 기반 모델은 한국의 문화와 가치를 반영하도록 튜닝되며, 주로 고성능이 요구되는 작업에 활용될 예정이다. 반면, 믿:음 2.0은 문서화 작업이나 공공, 금융, 교육 등 상대적으로 가벼운 도메인에서 강점을 발휘할 것으로 보인다. 이처럼 KT는 다양한 사용 사례를 아우르는 포괄적인 AI 생태계를 구축하려 한다.
한국형 AI의 미래와 과제
KT는 믿:음 2.0을 시작으로 추론 모델, 멀티모달 모델 등 다양한 AI 모델을 순차적으로 공개할 계획이다. 또한, 공공 문서와 같은 국가 데이터를 학습에 활용할 수 있도록 데이터 규제를 완화해야 한다는 점도 강조했다. KT 관계자는 “공공 데이터가 적절히 활용된다면, 독자적인 AI 파운데이션 모델을 통해 다양한 기업이 혜택을 누릴 수 있을 것”이라고 밝혔다.
'일상 > IT.과학' 카테고리의 다른 글
LG CNS와 코히어가 선보인 초대형 AI 언어모델 혁신 (0) | 2025.07.11 |
---|---|
국내 연구진의 획기적인 NPU 기술, 생성형 AI 혁신을 이끌다 (0) | 2025.07.04 |
마이크로소프트의 AI 진단 혁신: 의료의 미래 (0) | 2025.07.01 |
구글 도플(Doppl), AI로 옷을 입어보는 새로운 패션 경험 (0) | 2025.06.27 |
삼성월렛 디지털 키, 메르세데스-벤츠와 손잡고 럭셔리 차량 경험 혁신 (0) | 2025.06.26 |