谷歌Bard最近在LLM榜单上取得了巨大的成功,登上了第二的位置,超越了GPT-4,引起了AI界的热议。谷歌官方最近宣布,在GeminiPro的支持下,Bard不仅在推理、理解、总结和编码能力方面有了显著的提升,还能够支持230多个国家的40多种语言。与此同时,谷歌的Imagen2模型也被集成到了Bard中,这个模型在谷歌的ImageFX、Search和VertexAI上体验Bard的生成能力有多强。
去年12月,谷歌推出了最新的Imagen2模型,它能够生成高质量、照片级逼真的图像。尽管生成效果令人惊艳,但却遭到了许多网友的批评:因为不开源,所以没有太多实用性。现在,任何人都可以体验Imagen2的能力了。谷歌官方给出了许多Bard生成的图像示例,比如一只踩着冲浪板的狗等等。为了负责任的生成,Bard生成的图像都会被加上由SynthID进行标记的数字水印。SynthID是谷歌DeepMind开发的一种水印工具,可以将数字水印嵌入到生成的图像像素中,人眼无法察觉,但可以进行识别。
网友们纷纷对Bard的生成能力进行了评测。其中,有人用Bard生成了一只吹着喇叭的贵宾犬的图像,给人一种抽大烟的感觉。还有人用Bard生成了「Cincinnatiskylinewithahistoricpaddlewheeler」的图片,与GPT-4相比,Bard生成的图像可能因为色调更加真实。创始人RyanCarson也用Bard和DALL·E3分别进行了测试,虽然DALL·E3的生成图片价格要贵32倍,但他更喜欢DALL·E3生成的图像。Bard无法满足某些特定尺寸的请求。网友们对Bard的生成技术非常震撼,它不仅在视觉上表现出色,而且在生成文字方面的准确性也超过了DALL·E。
网友们还用Bard生成了各种各样的图像。比如海绵宝宝吃墨西哥卷饼、火星系列、摄影稻草人、寿司、电子游戏角色等等。每个人对Bard的评价各不相同,但Bard在生成写实、自然风格的图片方面表现良好。与Bard相比,GPT-4和Midjourney也有各自的特点。DALL·E3在结合了GPT-4后具备了最强的语义理解能力,只要用户提出需求,它就能生成相应的图像。而Midjourney则以其最强的美学表现力和多样的风格而脱颖而出。至于价格方面,10美元一个月的Midjourney仍然是最具性价比的选择。Bard之所以胜出,一方面是因为它是免费的,对于一些偶尔使用的用户来说非常重要;另一方面,它的风格整体上更加写实,更适合创作真实风格的图片。
Bard在生成图像方面的能力得到了广泛的认可。无论是Bard、GPT-4还是Midjourney,它们都各自具有独特的特点,适用于不同的用户需求。无论是追求写实风格还是多样的美学表现力,用户可以根据自己的偏好选择适合自己的生成模型。