微比恩 > 信息聚合 > 融合 ChatGPT+DALL・E 3,贾佳亚团队新作开源畅玩:识图推理生图一站解决

融合 ChatGPT+DALL・E 3,贾佳亚团队新作开源畅玩:识图推理生图一站解决

2024-04-15 16:07:17来源: IT之家

在开源社区中把 GPT-4+Dall・E 3 能⼒整合起来的模型该有多强?香港中文大学终身教授贾佳亚团队提出多模态模型 Mini-Gemini:更高清图像的精确理解、更高质量的训练数据、更强的图像解析推理能力,还能结合图像推理和生成,堪称王炸。Mini-Gemini 还提供了 2B 小杯到 34B 的超大杯,最强模型在多个指标上相比谷歌的 Gemini Pro 甚至 GPT-4V 都不遑多让。目前,Mini-Gemini 从代码、模型到数据已全部开源,登上了 PaperWithCode 热榜。Mini-Gemini 线上 Demo 也已发布,超会玩梗,一起来体验下!接近商业闭源模型水平Mini-Gemini Demo 放出后受到广大网友关注,一番“品尝”后,他们认为 Mini-Gemini 跟商业模型差不了多少。目前,绝大多数多模态模型仅支持低分辨率图像输入和文字输出,而在实际场景中,许多任务都需要对高清图像进行解析,并用图像的

关注公众号
标签: 开源 ChatGPT