변수)를 갖춘 초대형 언어모델

변수)를 갖춘 초대형 언어모델

test 0 20 2025.04.11 00:24:56

빅테크 기업들은 최소 수천억 개에서 많게는 1조개가 넘는파라미터(매개변수)를 갖춘 초대형 언어모델도 보유하고 있지만, 실제 기업 고객들이.


SLM은 수억~수십억 개 수준의파라미터로 구성된 경량화 모델로 특정 도메인 데이터에 기반한 고정밀 질의응답과 문서 요약, 분류, 해법 제시 등의 다양한.


또 신경망의 성능과 복잡성을 측정하는 핵심 척도인파라미터의 수가 무려 1,750억개에 달하는 대형이었다.


지도모델(InstructGPT Model) 구축 GPT 기반 모델은 기본적인 언어를 익힌 수준이다.


이제 사용자가 의도하는 과업에 맞춰 더 알맞는 결과를 생성할 수 있는 모델로 만들어야 한다.


딥시크 ‘R1(6710억파라미터)’, 알리바바 ‘Qwen2’는 각각 과학 문제 해결력과 툴 조작 능력을 갖춘 대형 추론 AI로 자리 잡았다.


이들은 수천억개 매개변수를 바탕으로 복잡한 문제 해결과 장기적 사고 과정을 수행할 수 있다.


한국에서는 LG 엑사원 딥이 대표 주자다.


적은 매개변수로 글로벌 모델과.


총 2530억개의파라미터를 가진 '덴스(dense)' 모델로, 고성능 추론과 지시 이행, AI 에이전트 워크플로우 등을 지원하도록 설계됐다.


특히 앤트로픽의 '클로드 3.


7 소네트'와 유사한 '추론 토글(Reasoning Toggle)' 기능을 탑재, 간단한 작업에서는 고비용 추론 기능을 자동으로 비활성화할 수 있다.


안리쓰 MS46122B를 이용한 RIS 필름을 부착한 유리와 일반 유리 간의 S-파라미터및 투과 손실 비교 측정 모습 안리쓰(Anritsu)는 한국전자통신연구원.


실험에서는 안리쓰의 2-포트 VNA인 MS46122B를 이용해 RIS 필름을 부착한 유리와 일반 유리 간의 S-파라미터및 투과 손실 비교 측정이 진행됐다.


빅테크 기업들은 최소 수천억 개에서 많게는 1조개가 넘는파라미터(매개변수)를 갖춘 초대형 언어모델도 보유하고 있지만, 실제 기업 고객들이.


SLM은 수억~수십억 개 수준의파라미터로 구성된 경량화 모델로 특정 도메인 데이터에 기반한 고정밀 질의응답과 문서 요약, 분류, 해법 제시 등의 다양한.


실험에서는 안리쓰의 2-port VNA인 MS46122B를 이용해 RIS 필름을 부착한 유리와 일반 유리간의 S-파라미터및 투과 손실 비교 측정이 진행됐다.


MS46122B는 콤팩트한 USB 타입 벡터 네트워크 분석기로, 최대 43.


5GHz까지 지원하며 복잡한 테스트 환경 없이도 실험실 및 현장 환경 모두에서 안정적이고.


이미 LG AI연구원, 코히어 등의 파운데이션 모델 기업들은 기존처럼 모델파라미터를 키우기보단 양질의 산업 데이터로 성능을 끌어올리는 방식에 주력하고 있다.


인공지능(AI) 기술이 거대언어모델(LLM)을 중심으로 확산되던 흐름에서 벗어나 산업 맞춤형 '버티컬 AI'로 전환되는 흐름이 빨라지고 있다.


연구팀은 모든 정보를 공유하는 대용량파라미터방식 대신, 중요 정보만 선별해 공유하는 이진 마스크 방식을 적용해 통신 효율을 높였다.


또 생성 품질을 정밀하게 평가하는 손실 함수(MMD, Maximum Mean Discrepancy)와 각 로컬 AI의 기여도를 다르게 집계하는 전략(MADA, Mask-Aware Dynamic Aggregation).


AI 기반 플랫폼 'Navigator NCS'는 다층 네트워크의 토폴로지, 용량, 성능파라미터를 실시간으로 모니터링하고 설계에 반영할 수 있도록 돕는다.


병목 현상이나 용량 업그레이드가 필요한 구간을 사전에 파악하고, 다양한 시나리오 시뮬레이션을 통해 리소스를 효율적으로 할당할 수 있다.


-IP·광 통합에서 AI는.


상무 스위첸

Comments

최근글


새댓글


Facebook Twitter GooglePlus KakaoStory NaverBand