根據SuperCLUE 六月份 中文能力評測,#將大模型中文能力可以分成四個梯次
#第一梯隊:介於GPT4o到GPT4之間:
阿里雲開源的Qwen2-72b、新創的DeepSeek、智譜AI的 GLM-4-0520 、商湯科技的SenseChat 、OPPO的AndesGPT
抖音的豆包、百度的文心一言、Llama3-70b
#第三梯隊:介於 Gemini1.5 Pro 到GPT3.5Turbo 之間:
百川智能的 Baichuan4、月之暗面的 Moonshot (Kimi) 、阿里雲閉源的通義千問2.5
#第四梯隊 :Gemini1.5Pro以後:
Yi1.5、Qwen2-7b、Llama3-8b、Gemma-7b
資料來源
#SuperCLUE 6月評測
https://github.com/CLUEbenchmark/SuperCLUE
中外混合排名
#GPT4o#Claud3.5 #Qwen2.5 #DeepSeekV2#GLM#SenseChat5.0 #AndesGPT#GPT4#豆包#Kimi#山海大模型#百川#通義千問#文心一言#Llama3#Gemini1.5 #階躍星辰#訊飛星火#Yi#Gemma2#Llama2
中文排名
#Qwen2.5 #DeepSeekV2#GLM #SenseChat5.0 #AndesGPT #豆包 #Kimi #山海大模型 #百川 #通義千問 #文心一言 #階躍星辰 #訊飛星火 #Yi
參考閱讀
2024 年 6 月的中國大陸中文大模型排行榜(幾乎就是中文大模型的排行版,繁體中文模型目前的表現上得了嗎)。2024 年 6 月的中文大模型排行榜:
https://leggie.co/2024%E5%B9%B46%E6%9C%88%E4%B8%AD%E6……
#中文大模型排行榜