文心一言,腾讯元宝,豆包相信大家都熟悉的不能再熟悉了,我们今天就对这三款大厂的语言大模型进行大比拼,看看谁家的更胜一筹。我们将从AI绘画,AI搜索,数学推理,编程代码,分析能力五大方向来进行测评。
AI绘画
AI绘画这三款大模型都是支持的,我们就让它们画一幅含有中国风的山水图。
文心一言
腾讯元宝
豆包
从上述的反馈来看,文心一言与腾讯元宝AI绘画功能略胜一筹,豆包绘画功能则差点意思。
AI搜索
AI搜索功能对于这三款模型来说并不是难题,主要看谁家的检索能力更强,谁家的总结能力更强。既然评测的是AI,我们就搜索今日关于AI的最新事件吧!
文心一言
腾讯元宝
豆包
从上述反馈来看,文心一言是基于百度搜索检索内容并总结,腾讯元宝是基于公众号文章检索内容并总结,豆包是基于头条,微博等其它平台检索内容并总结,对于文心一言和腾讯元宝还是比豆包更有优势,都有自家的产品作为搜索底层。同时豆包搜索也出错了,OpenAI CEO 被罢免事件已经是很久之前的事件了,并不是今日事件,所以豆包的AI搜索功能并不严谨。
对于各大平台的AI搜索功能还是得有自己的分辨能力,毕竟AI并不是人,不可能做到不出错。
数学推理
数学推理应该是每款语言大模型必训练的一道门槛,我们来用大学奥数题让它们解答。
文心一言
腾讯元宝
豆包
从上述反馈来看,答案是8062,三款大模型均没有出错,但豆包只是给出了答案,并没有解题思路与公式,而文心一言,腾讯元宝都不仅得出了答案,还给出了解题公式,还是文心一言与腾讯元宝更胜一筹。
编程代码
写代码这三款大模型都会,我们来点不一样的,不仅要写代码,还要对每段代码进行注释,这样连小白都能看得懂代码不是更有意思。
文心一言
腾讯元宝
豆包
从上述反馈来看,豆包写的都不能算是代码,只能说太差劲了。真的是没有对比就没有伤害,文心一言,腾讯元宝都详细的写出了示例代码,函数调用,图片调用等,看来又是文心一言,腾讯元宝更胜一筹。
分析总结能力
分析总结能力如果只是分析文字就太简单了,我们就用PDF文件的方式,先读取内容,再进行内容的总结吧!
文心一言
腾讯元宝
豆包
从上述反馈来看,三款大模型都没有任何的出错与问题,分析总结能力都是不想上下。
文心一言,腾讯元宝,豆包作为三大科技巨头的大语言模型,豆包的能力的确略逊一筹,当然这次只是从五个方向测评,并不能完全代表豆包的能力不行。也期待国内的大模型尽快超越国外。
微信扫描下方的二维码阅读本文
评论(0)