IT之家 10 月 19 日消息,北京大学软件工程国家工程研究中心知识计算实验室联合四川天府银行 AI 实验室,今天正式开源旗下 70 亿参数的代码大模型 CodeShell,号称“同等规模最强代码基座”。官方已经在 GitHub 开源了模型、相关配套方案及 IDE 插件,支持商用,感兴趣的小伙伴们可以在此前往。▲ 图源 官方 GitHub 项目IT之家从项目详情中获悉,CodeShell-7B 基于 5000 亿 Tokens 进行了冷启动训练,上下文窗口长度为 8192,架构设计上融合了 StarCoder 和 Llama 两者的核心特性。官方声称,CodeShell 的原始训练数据基于自家爬取的 Github 数据、Stack 和 StarCoder 数据集,以及少量“高质量的中英文数据”,这些预训练数据均经过了“数据判重、数据过滤规则、数据质量模型一系列流水线”。CodeShell 构建了包含 7 万
北大推出“最强编程助手”:代码大模型 CodeShell-7B 开源,性能霸榜
2023-10-19 16:48:33来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 火山引擎入场大模型,场景、场景、场景2024-05-16 22:13:54
- 行业首发多模态大模型辅助视障人士,vivo 看见 App 接入蓝心大模型2024-05-16 16:11:42
- 乐道首车 L60 开启预售;字节跳动发布豆包大模型;微软中国AI团队整体打包赴美|Do早报2024-05-16 08:54:47
- 【钛晨报】证监会:从严打击严重危害市场平稳运行、侵害投资者合法权益等违法行为;字节跳动自研大模型豆包宣布正式对外提供服务…2024-05-16 07:20:00
- 腾讯混元文生图大模型对外开源:搭载首个中英双语 DiT 架构,免费商用2024-05-14 17:01:24
- 对话李开复:中美大模型差距越来越小,我10年不“套现”|钛媒体AGI2024-05-13 18:41:00
- 软通动力受邀参加"昇思AI框架及大模型技术论坛" 共探AI框架未来发展2024-05-13 15:38:00
- 首期EPAI"元脑企智"企业大模型开发平台实践集训成功举行2024-05-13 16:45:00
- 给文字动画注入语义灵魂!港科大开源「文字跳动」技术,每个单词都浪漫2024-05-13 18:09:54
- vivo 自研蓝心大模型升级“自研 AI 多模态大模型”2024-05-13 19:17:08
- 1今晚国内油价迎“两连降”,加满一箱 92 号汽油将少花 9 元
- 2Triskell Software 在《企业敏捷规划工具市场指南》中被评为 2024 年代表性供应商
- 3福达股份:拟定增募资不超3亿元,用于新能源汽车混合动力曲轴项目
- 4广汽想靠智驾拯救它的“小baby”
- 5雷诺汽车发布未来自动驾驶战略,将与文远知行探索公交领域实践
- 6欧林生物:四价流感病毒裂解疫苗(MDCK细胞)获批开展临床试验
- 7中简科技:拟1500万元-3000万元回购公司股份
- 8睿创微纳成立智造技术公司 注册资本1亿
- 9一年4000亿,都是谁在给主播打赏?
- 10富士推出 GF 500mm f / 5.6 中画幅相机镜头:抗水 + 6 轴防抖,3499 美元