알리바바, 메타의 Llama 3을 능가하는 새로운 AI 모델 Qwen2

알리바바가 최신 대규모 언어 모델인 Qwen2를 출시했습니다.

Qwen2는 알리바바의 오픈 소스 Tongyi Qianwen 제품군의 두 번째 버전으로, 다국어 사전 훈련과 확장된 컨텍스트 윈도우 등의 업데이트를 통해 긴 쿼리와 답변이 가능해졌습니다. Qwen2의 최고 사양 모델인 Qwen2-72B는 메타의 Llama 3-70B보다 수학, 코딩, 자연과학, 사회과학, 공학, 인문학 등 다양한 벤치마크 테스트에서 우수한 성능을 보였습니다.

(출처 : 알리바바)

Qwen2는 5가지 버전으로 제공되며, 가장 작은 모델인 Qwen2-0.5B부터 최고 사양 모델인 Qwen2-72B까지 다양한 규모로 구성되어 있습니다.

모델의 매개변수 수는 4억 9천만에서 727억 개에 이릅니다.

또한, 중국어와 영어를 포함하여 유럽, 중동, 아시아 지역의 27개 언어로 학습되었습니다. 특히, 최고 사양 모델인 Qwen2-72B는 메타(구 페이스북)의 최신 오픈 소스 모델인 Llama 3-70B와 비교했을 때, 수학, 코딩, 자연과학, 사회과학, 공학, 인문학 등 다양한 벤치마크 테스트에서 우수한 성능을 보였습니다.

알리바바는 한 달 전 출시한 폐쇄형 모델인 Tongyi Qianwen 2.5가 OpenAI의 최신 모델인 GPT-4보다 중국어 능력에서 뛰어나다고 주장한 바 있습니다.

이처럼 짧은 시간 내에 글로벌 선도 모델과 대등한 성능을 보이는 새로운 AI 모델을 출시한 것은 알리바바가 AI 경쟁에 많은 자원을 투입하고 있음을 보여줍니다.

알리바바뿐만 아니라 텐센트 등 다른 중국의 대형 기술 기업과 수많은 스타트업들도 자체적인 대규모 언어 모델 개발에 매진하고 있습니다.

텐센트는 최근 자사의 최신 Hunyuan 모델을 기반으로 한 전용 챗봇 Yuanbao를 발표했으며, AI를 600개 이상의 비즈니스 시나리오에 활용하여 효율성 향상을 꾀하고 있습니다.

알리바바 역시 B2B 국경 간 소싱 플랫폼인 Alibaba.com에 AI 기반 도구를 도입하여 판매자와 구매자를 연결함으로써 매출 증대를 도모하고 있습니다.

https://huggingface.co/spaces/Qwen/Qwen2-72B-Instruct