人工智能在过去十年左右的巨大成功通常归功于大量的数据和计算能力,但是「基准测试」在推动进步方面也发挥着至关重要的作用。为了提高SOTA结果,研究人员需要一种方法来比较他们的模型与同行开发的模型的效果差异。准确的比较是验证新模型确实优于该领域现有模型的先决条件这个过程被称为「基准测试」,即Benchmark。研究人员可以利用人工智能进行对比测试,看看它到底有多先进。例如,ImageNet,一个由1400万张图像组成的公共数据集,为图像识别设定了目标。MNIST 在自然语言处理方面对手写数字识别和 GLUE (通用语言理解评估)做了同样的工作,导致了诸如 GPT-3这样的突破性语言模型的出现。基准测试已经越来越快地达到饱和,尤其是在自然语言处理(NLP)领域。虽然研究团队花了大约18年时间才在 MNIST 上取得了人类水平的表现,并在 ImageNet 上花了大约6年时间才超过人类,但在 GLUE 语言理解基准上只花了大约一年时间就
动态基准测试Dynabench已发布,Facebook想用人类来「审问」人工智能
2020-10-09 14:00:06来源: 新浪科技
关注公众号
赞
你的鼓励是对作者的最大支持
- LG电子据悉寻求与微软结成人工智能联盟2024-04-19 08:59:25
- 浪潮信息IPF24: 发展人工智能+,创新需要激发活力、拓展路径、加速落地2024-04-18 14:08:00
- 2024 年 10 款人工智能教育工具(学生和教师版)2024-04-17 17:34:43
- 三星推出其当前最快、专为人工智能应用优化的10.7Gbps LPDDR5X2024-04-17 10:00:00
- Omdia:到 2028 年,亚洲和大洋洲的生成式人工智能 (AI) 软件收入将超过 180 亿美元2024-04-17 16:14:00
- 微软将向阿联酋人工智能公司G42投资15亿美元2024-04-16 17:49:00
- 可以互相交谈的人工智能来了2024-04-14 16:15:58
- 小米应用商店要求App不得默认勾选自动续费;xAI称Grok-1.5V将很快向早期测试者开放;北京联通人工智能算力中心正…2024-04-14 09:42:29
- 马斯克的人工智能初创公司xAI称Grok-1.5V将很快提供给早期测试者使用2024-04-13 15:27:43
- 香港数码港行政总裁郑松岩:重点打造人工智能生态,助力更多内地企业走向全球2024-04-13 17:39:58
- 1创力集团等成立煤机智能装备公司 注册资本6000万
- 2依托于“天通一号”,比亚迪与中国电信联合推出汽车直连卫星业务
- 3用回iPhone 5c后,我怀念起那个把塑料做出高端感的时代
- 4雷军、谷歌、联想、甲骨文……F1 为什么成了科技圈春晚?
- 5安踏0碳使命店开幕;VICUTU威可多30周年品牌升级首倡“正装全场景”;太平鸟品牌VI升级;方里官宣梅耶·马斯克|消…
- 6全文|微软Q3业绩会实录:有信心将投资转化为未来的第二次成功
- 7射击游戏《逃离塔科夫》推出 The Unheard 版:专属 PvE 模式,250 美元
- 8中国神华建投能源等成立发电公司 注册资本15亿
- 9消息称 OPPO XR 探索暂停,转向 AI Device、机器人
- 10中石油昆仑资本等成立创投基金 出资额20亿