,

根據SuperCLUE 六月份 中文能力評測,#將大模型中文能力可以分成四個梯次

根據SuperCLUE 六月份 中文能力評測,#將大模型中文能力可以分成四個梯次 #第一梯隊:介於GPT4o到…

By.

min read

根據SuperCLUE 六月份 中文能力評測,#將大模型中文能力可以分成四個梯次

#第一梯隊:介於GPT4o到GPT4之間:

阿里雲開源的Qwen2-72b、新創的DeepSeek、智譜AI的 GLM-4-0520 、商湯科技的SenseChat 、OPPO的AndesGPT

#第二梯隊:介於GPT4到Gemini1.5 Pro之間:

抖音的豆包、百度的文心一言、Llama3-70b

#第三梯隊:介於 Gemini1.5 Pro 到GPT3.5Turbo 之間:

百川智能的 Baichuan4、月之暗面的 Moonshot (Kimi) 、阿里雲閉源的通義千問2.5

#第四梯隊 :Gemini1.5Pro以後:

Yi1.5、Qwen2-7b、Llama3-8b、Gemma-7b

資料來源

#SuperCLUE 6月評測

https://github.com/CLUEbenchmark/SuperCLUE

中外混合排名

#GPT4o#Claud3.5 #Qwen2.5 #DeepSeekV2#GLM#SenseChat5.0 #AndesGPT#GPT4#豆包#Kimi#山海大模型#百川#通義千問#文心一言#Llama3#Gemini1.5 #階躍星辰#訊飛星火#Yi#Gemma2#Llama2

中文排名

#Qwen2.5 #DeepSeekV2#GLM #SenseChat5.0 #AndesGPT #豆包 #Kimi #山海大模型 #百川 #通義千問 #文心一言 #階躍星辰 #訊飛星火 #Yi

參考閱讀

2024 年 6 月的中國大陸中文大模型排行榜(幾乎就是中文大模型的排行版,繁體中文模型目前的表現上得了嗎🤔)。2024 年 6 月的中文大模型排行榜:

https://leggie.co/2024%E5%B9%B46%E6%9C%88%E4%B8%AD%E6……

#中文大模型排行榜

https://leggie.co/category/chinese-large-model-ranking