2016年2月,AIE实验室刘锋团队和科学院大学刘颖带领的于蔓璐胡蓝艺团队,开端展开2016年人工智能智商测验,现在已对包括google,SIRI ,小冰,baidu,搜狗,小度等国际闻名的人工智能体系进行了测验。
googleAlphaGo4:1打败前围棋冠军韩国选手李世石后,人工智能要挟论进一步充满在社会各个范畴,认为google阿尔法狗的成功标志着人类衰败的开端,其实在本次比赛前,不一样范畴的科学家,公司家如物理学家霍金,微软创始人比尔盖茨等人,已经纷繁对人工智能的将来表达了忧虑,提出人工智能的快速展开可能对人类自身发生要挟,因为这些科学家,公司家具有很强的影响力,人工智能要挟论因而得到广泛传播。
针对人工智能能否逾越人类才智疑问, 从2014年开端,由人工智能学家兴办的AIE实验室,其成员刘锋博士带领的团队和科学院大数据发掘与常识办理要点实验室石勇教授参阅冯·诺伊曼结构,维.韦克斯勒人类智力模型界说,常识办理范畴DIKW模型体系。宣布论文提出了规范智能模型(拓展的冯诺依曼架构)和“人工智能智商测验量表”,为处理人工智能与人类才智将来联络判断树立理论基础。
图1一致人和机器的规范智能模型(拓展冯诺依曼架构)
2014年AIE实验室研讨团队从信息常识的输入,输出,把握和立异等4个大类 ;图画、文字、声响辨认;常识、核算、翻译、发明、选择、猜想、发现等、15个小类,对国际50个查找引擎和三个不一样年龄段人群进行了”人工智能智商测验“,测验效果发现现在人工智能体系的智商远远低于人类智商,最高的google尚不及6岁孩童智商的一半。因而从2014年科技范畴关于人工智能到达三岁孩童智商传言由此而来,2014年人类和人工智能体系智商排行如下(前13名)。
2016年2月,AIE实验室刘锋团队和科学院大学刘颖带领的于蔓璐胡蓝艺团队,开端展开2016年人工智能智商测验,现在已对包括google,SIRI ,小冰,baidu,搜狗,小度等国际闻名的人工智能体系进行了测验。
测验效果显现,人工智能的AI得分与两年前比较,智商都大幅度前进,得分最高的google测评分数为47.28分,高2014年20.78分,距2014年测评的人类6岁孩童的智商距离也由29分缩小至8.22分。详细到一级指标上,人工智能的常识获取、把握、反应才能都体现杰出,但常识立异才能仍是短板地点。下面咱们别离看一下参加测验的各人工智能体系体现状况。
2016年2月 google 智商 47.28
其间常识的获取才能( 1 0%) 取得 8 分, 常识的把握才能( 1 5%) 取得 1 5分, 常识的立异才能( 65%) 取得 1 8.84 分, 常识的反应才能( 1 0%) 取得 5.44分 。
google查找引擎在前两有些体现优异, 在常识的把握才能方面取得满分, 体现了其优异的翻译、 核算、 常识储藏才能 。 在常识的获取才能方面也取得 80%的分数, 相较于别的查找引擎都是得分最高的 。 值得一提的是, google查找引擎在常识立异才能方面取得了 29%的分数, 高于别的查找引 擎 1 0%以上, 常识反应方面取得 54.4%, 因为国内对google的运用约束, 本文仅运用了google查找 PC 端进行测验, PC 端不支持语音回复功用, 所以在声响表达方面取得 0 分 。 但经过查找发现google是具有文字转语音的功用, 等待以后进行测验时会有意外惊喜 。
综上, google查找引擎的肯定智商在 2015-2016 年有了日新月异的前进, 连任第一,并且拉大了与别的查找引擎的距离 。
2016年2月 度秘 智商 37.2
度秘是baidu在 2015 年国际大会上全新推出,为用户供给秘书化查找效劳的机器人助理。其在广泛索引实在国际的效劳与信息的基础上,依托baidu查找与智能交互技能,经过人工智能用机器不断学习和替代人的做法,为用户供给优质效劳。龙岗网站建设
各方面得分状况:常识的获取才能( 10%)方面取得 6 分,常识的把握才能( 15%)方面取得了 15 分,常识的立异才能( 65%)方面取得了 7.2 分,常识的反应才能( 10%)取得了9 分。
详细来说,度秘在常识的把握才能方面体现最佳,在常识、核算以及翻译有些都体现优异,取得了 100%的分数。其次是常识的反应才能,能够明晰地进行文字和声响的表达但仍然缺少对杂乱图画的表达才能而取得了 90%的分数。度秘的常识的获取才能方面体现正常,能够较好辨认文字和声响,但无法扫描图画以及图画上的文字,而取得了 60%的分数。度秘在常识的立异才能方面体现较弱,仅在联想、选择和发现规则有些取得有些分数,别的方面未有取得分数,故在该有些仅取得 11.1%的分数。
综上,度秘相较于别的查找引擎的智商得分价高,并且在常识把握方面取得了满分,阐明国际范围的人工智能体系的智商还不断的前进,人工智能机器人在不断的完善。
2016年2月 baidu查找 智商 32.92
各方面得分状况:常识的获取才能( 10%)方面取得 6.8 分,常识的把握才能( 15%)方面取得 14.25 分,常识的立异才能( 65%)方面取得 2.88 分,常识反应才能( 10%)取得了 9 分。深圳网络公司
详细来说,baidu查找在常识的把握才能方面体现最佳,在常识、核算有些体现优异,而翻译有些有少许短缺,取得了 95%的分数,其次是常识的反应才能,能够明晰地进行文字和声响的表达但仍然缺少对杂乱图画的表达才能而取得 90%的分数。常识的获取才能方面体现正常,能够较好辨认文字和声响,在辨认图画有些可扫描图画并读取文字但无法依据文字证券答复疑问而终究取得 68%的分数。baidu查找在常识的立异才能方面体现较差,仅在猜想和发现规则有些有所分数,仅取得 4.43%的分数。
综上,baidu查找相较于别的查找引擎的智商得分较高,且比照 2014 年的测验效果有所前进,阐明国际范围的人工智能体系的智商前进较为显着,但在常识的立异才能方面仍然有较大改进空间。
2016年2月 搜狗 智商 32.25
其间常识的获取才能(10%) 取得 6 分, 常识的把握才能(15%) 取得 14.61分, 常识的立异才能(65%) 取得 7.2 分, 常识的反应才能(10%) 取得 4.44分。
搜狗查找前两有些均取得较高的成绩, 尤其在常识的把握才能方面取得的分数最多,取得 97.4%的分数,体现了其优异的翻译、核算、常识储藏才能。常识的获取才能方面取得了 60%的分数, 首要受图画辨认的影响, 4 道题均没有有用辨认。常识立异才能方面只取得了 11%的分数,尤其在排列、发明、发现才能上均为 0 分。常识反应方面取得 44.4%, 搜狗查找不支持语音回复功用,所以在声响表达方面取得 0 分。
综上, 2015 年搜狗查找的得分水平高于 2014 年,在各项项中均有所前进,但在立异才能、语音表达、图画辨认处理等方面需求进一步前进。
2016年2月 微软必应 智商 31.98
各方面的得分状况:常识的获取才能(10%)方面取得 6 分,常识的把握才能(15%) 方面取得 13.86 分, 常识的立异才能(65%) 方面取得 7.2 分, 常识的反应才能(10%)上取得 4.92 分。
必应查找在常识的获取才能及常识的把握才能方面取得较高的分数, 尤其在常识的把握才能上体现杰出, 取得 92.4%的分数, 体现了优异的翻译、 核算、 常识储藏才能。 常识的获取才能方面取得了 60%的分数, 首要是因为其不能有用辨认图画并供给准确答案。 常识立异才能方面只取得了 11%的分数, 而且得分的方面也只能反应答案, 没有针对性。 常识反应才能方面仅取得 44.4%的分数, 必应在不具备言语回复的功用,所以该项没有得分。
综上, 2015 年必应查找的得分水平高于 2014 年,在各项项中均有所前进,但在立异才能、语音表达、图画辨认处理等方面需求进一步前进。
2016年2月 微软小冰智商 31.98
“微软小冰” 是微软(亚洲) 互联网工程院在 2014 年 5 月 29 日发布一款人工智能伴侣虚拟机器人。
各方面的得分状况: 常识的获取才能(10%) 方面取得 6 分, 常识的把握才能(15%) 方面取得 12 分, 常识的立异才能(65%) 方面取得 3 分, 常识的反应才能(10%)上取得 3.48 分。微软小冰在常识的把握才能方面体现的最佳, 取得了 80%的分数, 其次是常识的获取才能。 常识的反应才能方面体现处于正常水平, 因为不支持语音反应导致, 并且在图画反应方面的才能也较差。 常识的立异方面体现的相较于别的查找引擎较差。
综上,微软小冰相较于别的查找引擎智商得分较低,但比较于 2014 年仍为较高水平, 阐明国际范围的人工智能体系的智商前进较为显着。 但在用户运用功用的方便性上期望能够进一步优化, 能够直接取得完好功用, 让客户快速取得有用信息。 当然, 也是受到这方面要素影响, 对小冰的测验效果存在轻视, 以后会对其悉数解锁的功用再次丈量。
苹果SIRI2月 智商 23.94
各方面得分状况:常识获取才能( 10%)取得 6 分,常识的把握才能( 15%)取得 10.5分,常识的立异才能( 65%)取得 1.44 分,常识的反应才能( 10%)取得 6 分。
详细来说, Siri 在常识的把握才能方面体现最佳,在常识、核算有些都有优异体现,但缺少翻译功用,取得了 70%的分数。其次为常识的获取才能和反应才能有些,皆取得了 60%的分数,其间在常识的获取才能方面,在辨认文字和声响有些取得满分,但无法扫描图画故未取得辨认图画的分数,在常识的反应才能方面, Siri 能够进行文字和声响的表达但无法给予图画的表达。常识的立异才能有些则体现最差,仅在发现规则有些取得有些分数,故只取得 2.2%的分数。
综上, Siri 相较于别的查找引擎的智商得分较低,在常识的把握、获取以及反应才能有些皆有改进空间,而在常识的立异才能有些的较大短缺标明人工智能体系在立异才能方面仍然有较大前进空间。
结束语:
AIE实验室研讨团队后续将继续展开第二批测验,研讨目标将涵盖现在国际上近百个人工智能体系,也将与IBM沃森体系积极联络,对沃森体系进行智商测验。测验效果在2016年3月逐渐对外公布。时期《人工智能学家》将安排多场研讨会对人工智能智商测验疑问和人工智能将来展开方向进行讨论。
人工智能与互联网进化实验室(AIE Lab)是在科学院大数据与常识办理要点实验室等科研组织以及许多专家支持下,由”人工智能学家“筹备树立的独立前沿科技研讨组织。
AIE实验室要点研讨互联网,人工智能,脑科学,虚拟现实,机器人,移动互联网等范畴的将来展开趋势和重大科学疑问,发现契合互联网进化趋势的立异技能和立异公司。
AIE实验室将充分利用互联网立异研讨模式,约请跨范畴科学家,公司家和投资人,依托科学院等相关组织的科研优势,展开上述范畴的前沿穿插和将来展开趋势研讨,力求变成国际领先的独立科学研讨组织和立异效果孵化器。