微比恩 > 信息聚合 > 融合 ChatGPT+DALL・E 3，贾佳亚团队新作开源畅玩：识图推理生图一站解决

融合 ChatGPT+DALL・E 3，贾佳亚团队新作开源畅玩：识图推理生图一站解决

2024-04-15 16:07:17来源: IT之家

融合 ChatGPT+DALL・E 3，贾佳亚团队新作开源畅玩：识图推理生图一站解决

图片地址：https://img.ithome.com/newsuploadfiles/2024/4/051c9baa-dca1-4215-a2dd-54318a8ae80d.png?x-bce-process=image/format,f_auto

在开源社区中把 GPT-4+Dall・E 3 能⼒整合起来的模型该有多强？香港中文大学终身教授贾佳亚团队提出多模态模型 Mini-Gemini：更高清图像的精确理解、更高质量的训练数据、更强的图像解析推理能力，还能结合图像推理和生成，堪称王炸。Mini-Gemini 还提供了 2B 小杯到 34B 的超大杯，最强模型在多个指标上相比谷歌的 Gemini Pro 甚至 GPT-4V 都不遑多让。目前，Mini-Gemini 从代码、模型到数据已全部开源，登上了 PaperWithCode 热榜。Mini-Gemini 线上 Demo 也已发布，超会玩梗，一起来体验下！接近商业闭源模型水平Mini-Gemini Demo 放出后受到广大网友关注，一番“品尝”后，他们认为 Mini-Gemini 跟商业模型差不了多少。目前，绝大多数多模态模型仅支持低分辨率图像输入和文字输出，而在实际场景中，许多任务都需要对高清图像进行解析，并用图像的

关注公众号

标签：开源 ChatGPT

提示：支持键盘“← →”键翻页

上一篇英特尔 Arrow Lake 处理器现身 SiSoftware：最高搭载 128 EU Xe-LPG+ 核显

下一篇思锐光学夜行者 16/75mm T1.2 电影镜头 5 月 7 日发布，提供 R / E / X / M43 / L 卡口

赞

你的鼓励是对作者的最大支持

相关阅读

因生成错误信息，ChatGPT 在奥地利遭投诉2024-04-29 14:42:03
Nothing 推出集成了 ChatGPT 的 Ear 和 Ear (a)2024-04-22 09:58:00
开源模型打败 GPT-4：LLM 竞技场最新战报，Cohere Command R + 上线2024-04-20 20:26:06
最强开源大模型来了，Meta推出开源大模型Llama 3，追赶GPT-42024-04-19 15:21:15
Meta震撼发布Llama 3，一夜重回开源大模型铁王座2024-04-19 07:57:49
中国电信开源 TeleChat-12B 星辰语义大模型，年内开源千亿级参数大模型2024-04-16 20:47:46
百度李彦宏称开源 AI 模型会越来越落后2024-04-16 11:12:47
ChatGPT一年电费高达2亿元，AI 为何如此耗电？| 钛媒体AGI深度2024-04-14 08:04:27
OpenAI 阿尔特曼投资 AI 智能胸针遭差评，ChatGPT 版 iPhone 上市即翻车2024-04-13 20:38:19
开源路由系统 iStoreOS 推出 NAS 版，提供 x86、ARS4 固件2024-04-13 21:25:23

热门排行榜

1日1周1月

免费发布分类信息

最新图片