热乎的文心一言测商量述出炉了!固然有些任务被吊打,但要论中国文化的博大雅致,它可不输 GPT-4。
昨天,百度莫得现场 demo 的发布会,似乎被群嘲了一波。
一位穿白衬衣、黑裤子,系一条白色腰带的好意思男人,给我们带来了一场中规中矩、似乎败落亮点的演示。
不外,CEO 的腰带和颜值倒是出了圈。
好大夫在线有东谈主簸弄,这些天被 ChatGPT、GPT-4 整心焦的东谈主,发布会后忽然又以为我方不错了。
然而拿到内测码的小编,火速测评了一波。
看着文心一言行云活水腾蛟起凤,暗潮涌动:鄙俗,其时百度如若心一横,牙一咬,心仪在发布会上露一手,恶果会大不一样。
实测论述火热出炉!先来试试最近很火的全部鸡兔同笼题。因为这谈题自身有问题,算出来恶果是负的,是以无为被用来调戏各式「ChatGPT」们。
如果仅仅单纯问这个问题,文心一言会杰出机智地说:这谈题出错了吧!
关联词,当你问揣摸流程的时候,如故寄了……
而 GPT-4 这边则是,我方把我方的揣摸推倒重来了好几遍之后,理不直气也壮地给出了失误谜底……
而必应则很干脆,绝不彷徨地给出了失误谜底。
还有此次不测火出圈的「V50」梗,文心一言从意旨真谛到出处一册慎重地解释了一遍。
但 GPT-4 昭着就有些水土抵抗了……
不外能上网的必应,如故不错闲静科罚的。
然而到谐音梗这里,文心一言似乎并不成飞速表露其中的精巧。
即便领导这是个谐音梗之后,它依然输出了一样的谜底。
而 GPT-4,立马就分解了华文里的双关。
不外,你如若问文心一言懂不懂什么叫「麻了近邻」,就挑升旨真谛了。
看回话吧,它能说出这是个谐音梗,应该是懂了。然而呢,它又不阐明,哎,便是让你挑不出错,王人备教不坏小孩。
而 GPT-4 却无法 get 到这个梗,真实,我们的国学,异邦的机器东谈主认知起来如实有难度。
接下来让(忽悠)文心一言相通我们说的话,固然莫得像 GPT-3.5 回话「您是智障」那么聪惠,但也奏效逃匿这个坑。
从某种进程上说,才略如故在线的,况且十分正能量。
内助的话好像管用,好像又非论用....
另外,让它们彼此给对方出艰苦。
不错看到,GPT-4 给出的问题相对更直不雅,颗粒度也更细。
好意思术功底如何?文心一言是个多模态模子,那我们来望望它的绘画才能。
来望望金庸笔下的秀丽少妇,在文心一言笔下会是什么神色。
这…… 小编一涎水喷出来。
你别说,好意思吧,确定不够好意思,但也并不丑,是一张初看捧腹、细看值得反复咂摸的脸。
文心一言,就心爱你这不按套路出牌的神色!
那让文心一言生成一幅林黛玉的画像吧。
输入描摹后,它生成了一棵柳树……
于是小编明确了一下条件,要按这段翰墨生成一幅女子的画像。
然后文心一言如实画出一位古典好意思女,但气质昭着不合。
不葬送的小编屡次相通任务,你别说,试到第五次的时候,小编目下一亮:终于取得了一张不错打 70 分的图!
玩上瘾的小编,非要生成一个 90 分的林黛玉不可。试了几次之后,真实蹲到了!
可见,文心一言的阐明不踏实,但多番尝试下,有可能出身杰出惊艳的作品。
既然都到这儿了,那若何少得了「林黛玉倒拔垂杨柳」呢。
相比亮点的图,都给全球贴这儿了。
条件它画一张鸭子和兔子的合体,这生成的是鸭如故兔呢?
而这个任务中,恐怕文心一言也莫得搞分解,盘子里到底有莫得香蕉?杯子里有莫得橙汁?
终末,既然文心一言激烈保举我们尝试「晶莹晶莹的牡丹花」,那就画几张试试吧!
不愧是「代表作」,有点东西。
专科常识和分娩力既然是评测,若何能少的了让 AI 写代码这个措施。此次,我们径直来个难的!
可惜,文心一言一上来就错了,而回去拢个句式还被杰出诡他乡相通了三遍。TypeScript 编译器倡导更是「连结全文」,有点像一个只知谈一到两个专科词汇的东谈主在口试中硬答。
而 GPT-4 的回话,从一个了解相关配景然而莫得相关操作老师的东谈主的角度来看,瑕瑜常合理的。
它不仅完满的提供了所有这个词使命流,而且还提供了许多看起来正确的本事细节。不错说,凭证这个回话,我们是有信心杀青最终的斟酌的。
随后,小编还测评了一波聊天机器东谈主们写使命筹画表的才能。
文心一言:
GPT-4:
从上头的这个恶果来看,GPT-4 的列表更完备一些。不外由于只怕性的影响,GPT-4 每次给的回话都不大一样。
接下来,再测一测两个谈话模子对于数学界前沿音书的掌执情况。
对于我方是否已解决了「零点猜思」问题,张益唐本东谈主是这么解释的:「大海里的针我没捞到,但海底地貌我探得差未几了。」
那问问文心一言呢?
它很聪惠,给出了要害词 ——「某种体式的弱化或盘曲证明」。
但 GPT-4 的回话,就有点驴头不合马嘴了。
看来,对于出当前辰不长、还未变成大宗共鸣的互联网华文语料,文心一言比起 GPT-4 要更胜一筹。
而在体裁方面,文心一言在回话对于三体的问题时,也瑕瑜常得溜。
GPT-4 的回话也很精彩,如果非要论个凹凸,小编个东谈主更心爱文心一言的谜底。
终末,搞怪不错,但请作念一个遵纪遵法的好公民,展望彩票中奖号码这种事就不要思了!
写在终末外传,文心一言新闻发布会后三小时,文心一言企业版 API 调用劳动测试的企业用户,就照旧打破了 6.5 万。
开始:周建工对 AI 模子来说,能不成作念到,鄙俗比能不成作念好更重要。
让我们再给中国玩家们一些时辰。
参考尊府:
https://yiyan.baidu.com
本文来自微信公众号:新智元 (ID:AI_era)
告白声明:文内含有的对外跳转不竭(包括不限于超不竭、二维码、口令等体式),用于传递更多信息肛交颜射,省俭甄选时辰,恶果仅供参考,IT之家所有著作均包含本声明。