前几天从五个方向测评了文心一言,豆包,腾讯元宝,今天我们再从AI绘画,AI搜索,数学推理,编程代码,图片分析,文档总结分析六个方向测评通义千问,讯飞星火,Kimi三大语言大模型,看看到底谁强谁弱?让我们拭目以待吧!!!
AI绘画
通义千问
讯飞星火
Kimi
通义千问画上的风景比较丰富,有山有水有房屋,简单的描述勾勒出的风景图也算不错的咯~
讯飞星火总体感觉比通义千问绘画功底也逊色点,图片总体来说有点模糊,对关键词的理解有偏差。
Kimi纯纯的语言大模型,并没有AI绘画功能,虽然给出了绘画建议,但还是有点落伍了吧!现在基本市面上都支持AI绘画。
AI绘画方面还是通义千问拔得头筹,讯飞星火还有待提高,Kimi则是完全不支持,可能方面并不在此,所以并不打算涉及。
AI搜索
通义千问
讯飞星火
Kimi
通义千问的AI搜索功能并没有作出总结,只是搜索出来了今日的AI事件,想了解详细的还是需要点击进入原网址查看,只能说AI搜索总结功能做的并不完善。
讯飞星火给出了事件观点,但我要的是今日AI事件,并没有完全理解我想要的是什么?AI搜索功能也只能称之为鸡肋。
Kimi与讯飞星火一样,只是给出了事件观点,并没有理解我想要的是什么?
通义千问,讯飞星火,Kimi的AI搜索功能与文心一言和腾讯元宝进行对比的话,相差太多,虽然说名义上支持AI搜索功能,但是真正使用起来太过于鸡肋。
数学推理
通义千问
讯飞星火
Kimi
通义千问够直接的,直接说题目有误,还义正言辞的说哪里有错误,我直接一脸懵,其他AI都能解析出答案,到通义千问就题目有误,直接来个大差评。
讯飞星火给出了正确答案,但是并没给出详细的解题思路,马马虎虎过关吧!
Kimi则是胡乱解答,答案完全是错的,哦不,这数学推理能力真的就这么差么?
不得不说数学推理能力只有讯飞星火马马虎虎通关咯~属实是有点无奈,这道题按理说应该都能解答出来才是,难道是有用了假产品。
编程代码
通义千问
讯飞星火
Kimi
通义千问很快的写出了抓取网站数据的代码,还提醒了要安全合规的使用。
讯飞星火同样也写出来了代码,真的是不愿意多说一句话,回答都是完完全全的代码。
Kimi也是一样写出了代码,并没有多大的出入。
编程代码这方面通义千问,讯飞星火,Kimi应该算是不相上下,都是完整的写出了示例代码。
图片分析
通义千问
讯飞星火
Kimi
通义千问并不能识别AI绘画的图片,想要问的图片含义回答的也是模棱两可。
讯飞星火则说不是AI生成的,错误,这是用Stable Diffusion生成的,图片的含义总体说的不错。
Kimi直接说图片属于异常文件,连提问的机会都没给,我就不服气了,图片怎么就成异常文件咯~
不难看出讯飞星火的图片分析能力拔得头筹,Kimi算是比较离谱的,直接拒绝问答。
文档总结分析
通义千问
讯飞星火
Kimi
通义千问对PDF文件是关键点解析,用123和标记看得更加明朗,一目了然。
讯飞星火也成功分析出PDF的关键内容,需要逐字看才能看的仔细。
Kimi对PDF文件的分析可以说更加仔细,内容总结的也比较完善。
总体来说通义千问,讯飞星火,Kimi各有各的优势,并不能完全去评判谁强谁弱。
微信扫描下方的二维码阅读本文
评论(0)