冥王生活

您现在的位置是:首页 > 科技生活 > 正文

科技生活

柯洁3600什么意思(柯洁3600分)

admin2023-01-09科技生活87

柯洁围棋有多厉害?

也就是到目前为止拿了四个世界冠军,从数量上来看,中国第二,没啥了不起。

也就是现在积分排名世界第一而已,没啥了不起。

也就是今年五月份和阿尔法的“大战”为围棋这种知名度不那么高的运动吸引了不少人的关注而已,没啥了不起。

也就是在不久前出的运动员影响力排名全国第二而已,没啥了不起。

也就是十七岁就拿世界冠军而已,没啥了不起。

柯洁绝非天下第一,也谈不上孤独求败,天下无敌。

但,他拿的冠军数量可以证明他的实力,他确实是一个优秀的棋手,是值得被中国围棋记住的棋手。

关于AlphaGo的一些错误说法

最近看了一些关于alphago围棋对弈的一些人工智能的文章,尤其是美国人工智能方面教授的文章,发现此前媒体宣传的东西几乎都是错的,都是夸大了alpha狗。我做了一个阅读心得摘要。

首先是对媒体错误宣传的更正:

1.alphago可以说里程碑式开创了历史,但是他并没有作出任何非常创新的技术,而deep mind只是将早已经存在的一些人工智能技术(尤其是机器辨认图片技术运用到下棋上)之前没有人想过能这样做,这种尝试是一种创新。

2.alphago并没有真正的棋感,实际也不懂得思考并作出策略,围棋解说把alphago当人来看待是错误的。alpha只是不停问自己我下这一步我胜率提高多少。

3.alphago并没有强大学习能力,达到现在棋力是基于接近1亿次棋局的模仿和推测出来的,一开始alphago只学习了16万棋局时它的棋力很弱。他不但比人学习效率差而且比马戏团的动物学习效率更差。所以说跟李对局每一局都在进步是不可能的,一局的经验对alpha go没什么影响。

4.alphago其实也是基于蛮力穷举下法,只不过运用新的机器学习方法。穷举法和机器学习不矛盾

5.之前看到文章说alpha速度没深蓝快,其实alpha是深蓝的5万倍。今天用的iPhone6s计算能力都是深蓝的几十倍。

6.说人脑计算速度慢是错误的,和计算机计算速度相对应的应该是人脑神经元计算速度,保守估计人脑计算速度是每秒1000万亿次,计算能力是深蓝的10万倍。

7.alpha并不是完全学习的,首先底层需要人编程围棋规则,其次基础的下期原则也是人为输入的

简单总结一下阅读心得:首先包括alpha围棋程序和深蓝的象棋都是蛮力搜索法。也就是

1.考虑所有未来可能变化,

2.计算走法未来多少步的胜率,

3.选择走法。但是围棋每走一步比国际象棋变化更大,步数更多,可能变化种类超过宇宙原子总和。其实这对于象棋也是如此。深蓝雇佣大量职业象棋选手设定一个积分法,比如一个兵值多少分,吃对手一个车胜率提升多少,这个评分体系很准确,深蓝思考范围被压缩成十几步。

但是围棋无法如此评估,之前围棋程序是简单的人手输入,见到什么情况如何走,所以很死板。这些程序棋力大概是400。

2006年一种叫做蒙特卡洛树的搜索法被发明,它使用概率模拟方法(类似模拟投掷骰子)只需要判断终盘胜负,弥补了围棋不能设定确定走法函数的缺陷。(alpha go也是使用蒙特卡洛树方法)但是这方法要展开到终盘计算量太大,所以需要让围棋专家协助制定行棋规则,减少计算量。此方法可使人工智能棋力提升到业余5段。

但是十年来电脑棋力进展令人悲观,直到alphago。它在此基础上引入深度人工网络。神经网络已经发明50年,适合编写一些不直观因果关系的事物,并且软件可以自主学习调整。但是编程太难,加上以前计算能力问题一直不受重视。

6年前开始,技术上能达到10层神经元,神经网络开始兴起。结合大数据和云计算技术,神经网络开始吃香。图像处理和人脸识别这类程序很难直观的由编程员编程,神经网络在此有用武之地,其中深度卷积网络技术称霸。alpha狗团队创新之处在于意识到可以将图像识别的这项技术用于下棋。alpha狗团队将神经网络升级到13层,预测人类棋手走法。

首先它学习了围棋对战平台的3千万业余高段位的对局记录,作为让alpha狗猜人类走法的正确答案。也就是说alpha一开始是在模仿业余高手平均玩法。同时团队人工输入围棋知识。alpha是神经网络加手工编程混合物。

这个预测人类玩法被叫做策略网络,此时alpha叫做rp版。根据alpha狗团队的论文把策略网络加入业余3段棋力的围棋程序,其棋力能达到业余6段。棋力提高950分达到2600(棋力分每相差230分双方5局三胜比赛的胜率为高分者95%胜率)此时alpha已经成为世界最强围棋程序。

为了减少计算量,alpha狗使用一个叫价值网络的深层卷积网络作为评估函数,使用alpha的预测结果和实际展开结果的平均值作为胜率参考信息。加入此功能的alpha狗叫做完整版。其棋力提高了450分。达到3100。

(大家要知道棋力相差500的选手之间,棋力低者想赢一盘棋都很难的,相差1000的话,棋力低者胜率几乎为0)

首先刚刚入门只懂得规则的玩家棋力是0。

手写下棋规则类围棋程序的棋力大概是400多。也就是程序是当对手下什么子,程序应该怎么走,这种纯靠手工编程软件的棋力。

业余棋手最低级别(1段)的棋力是1000左右。

加入神经网络的alpha go棋力是1500。相当于业余4段。此时的aloha go也是程序规则软件,只不过靠神经网络训练加入围棋知识而已。

r版alpha go棋力1700。相当于业余5段。此时alpha go加入蒙特卡洛树搜索功能,但是主要靠手写程序为基础。

和r版alpha go类似的程序zen棋力是2200。相当于业余7段。

rp版的alpha go棋力是2700。和r版相比rp版的改进是在手工编程最基础的围棋策略基础上,加入“策略网络”该功能是一个预测对手落子位置的神经网络。因此alpha go棋力大增接近1000棋力。已经成为世界最强围棋软件。这个棋力大概是最低级别的职业选手(职业1段)的棋力。

2015年下半年被alpha go横扫的欧洲冠军樊麾的棋力是2900左右。相当于职业2段和3段之间水平。

完整版alpha go的棋力是3100多(2015年底时)。这个版本alpha go比之前增加了一个“价值网络”的深层卷积网络DCNN。他可以在不将牌局演算到终局就评估出双方胜率也就是上一篇文章所说的大幅度减化了计算。这种技术本来是用在识别图像技术上的。

此时李世石棋力是3500多。相当于超出最高段位(职业9段)水平。

柯洁的棋力是3600左右。

其实宣布挑战李世石时alpha go棋力落后李400左右。它是通过自己和自己大量对局来提升棋力的。(战胜樊麾时它是通过观摩人类业余高段位对战历史数据学习,为了击败更强对手只能向更高技术的选手学习,就是自己了)。在不断对局中程序棋力不断提高,而提高的棋力自我对阵时产生更高水平的下棋数据。

虽然凌哥没看到战胜李世石时alpha go的棋力但是我简单算一下推测出2016年3月战胜李时alpha go棋力大概是3800左右。(因为差230分五局三胜95%胜率可以推算单局胜率80%再低一些。李是3530左右棋力)所以当时柯洁已经不是alpha go的对手了。

现在alpha go挑战各位围棋高手60连胜(唯一一次平局是人类棋手掉线)至于现在棋力应该是没办法评估吧。因为一场都不输的话根本不知道棋力是多少。按照棋力计算方法应该是棋力无限大了,也就是七龙珠漫画里面的战斗力爆表了。至少输一场才能估算出其实际棋力。

其他:

说到alpha没有期感,和人类下棋不一样。只要是因为人类学习下棋,是通过总结棋局规则和下法,分析因果关系和其中逻辑关系的,而alpha go只是推算走这一步它的胜率提高多少(这方面和深蓝没区别只是评估方式不同)它并不是真的有智慧懂得各种谋略。

alpha go学习方式只是像训练动物一样。走对了给予奖赏鼓励以后以更高概率走这步,走错了就惩罚。而且这个效率很低,其实它的高水平是通过每天学习普通职业选手一辈子也不止的时间来学习下棋得来的。

而且这个学习过程“没有高层思维和概念”,只是一个搜索过程。

上文说道alpha go学习效率很低。因为alpha go学习了3000万盘棋局时面对新局面应变能力很差,分析发现这些棋局很多都是冗余的只相当于16万棋局。而几十万局棋对训练alpha go是不够的,它需要千万级别的棋局训练。所以电视里职业棋手解说说alpha go在每局都从李世石身上学到新技能是不可能的,一两局对alpha go是没用的。而李世石反而是从alpha go身上学到东西利用创新下法战胜alpha go。人类这种能力是人工智能不具备的。

人工智能专家认为现在人工智能其实并不是真正的智能。alpha go只是下棋能力强的软件,IBM的沃森只是智力答题能力强的机器。真正的人工智能是让一个白板人工智能机器见到围棋,自己学习下棋规则,自己通过推理推断怎么下棋。(现在的alpha go的围棋规则和基础下棋策略都是人手编程的)deep mind致力于开发真正的人工智能程序。近期目标是玩几百种游戏都能战胜人类。这是向真正人工智能迈步。

围棋史上最厉害的7人是哪些人?

TOP1:柯洁(3628分)

18岁的中国围棋少年柯洁闯入第二届梦百合杯世界围棋公开赛决赛后放出豪言,称他的决赛对手、棋坛传奇李世石的赢面只有5%。这样的表态有棋迷认为是霸气十足,也有人觉得是年少轻狂。以记者之见,这样的“轻狂”在缺乏明星和亮点的中国棋坛弥足珍贵,也为沉闷的世界棋坛吹来一股新风。

TOP2:AlphaGo(3600分)

阿尔法围棋(AlphaGo)是一款围棋人工智能程序,由谷歌(Google)旗下DeepMind公司的戴密斯·哈萨比斯、大卫·席尔瓦、黄士杰与他们的团队开发。其主要工作原理是“深度学习”。2016年3月,该程序与围棋世界冠军、职业九段选手李世石进行人机大战,并以4:1的总比分获胜。

TOP3:朴廷桓(3588分)

朴廷桓,男,出生于1993年1月11日,韩国围棋手,九段(2006年5月入段),隶属联赛俱乐部为光州GS Kixx(2010年),弈城TYGEM网名为attractive(中国棋友习惯叫“挨踢”) 曾战胜过花开、顺利过关等中国强9。现在用弈城号为idontcal,网友习惯称为“我不卡”。2017年2月,朴廷桓前往上海参战农心杯。

TOP4:芈昱廷(3564分)

芈昱廷,1996年出生,江苏徐州人,围棋棋手。12岁即获世少赛青年组亚军和首届全国智运会围棋青少年组冠军。曾豪取2011年全国围棋甲级联赛九连胜。

2011年第二届全国智运会卫冕围棋少年赛。2012“王泰兴杯”全国围棋个人赛最男子甲组芈昱廷七胜二负勇夺冠军。2013“首届梦百合杯”决赛第四盘中盘胜古力,3:1实现逆转,拿到自己的第一个世界冠军。获得了180万的冠军奖金。

TOP5:周睿羊(3553分)

中国天元战史上最年轻的挑战者,第20届天元赛亚军。7岁学棋,9岁入吴肇毅围棋道场,后入聂卫平围棋道场,12岁获全国“晚报杯”业余围棋锦标赛冠军,13岁被商借至北京海淀队参加围甲联赛。

2002年入段,2007年升为五段。2008年11月25日第4届威孚房开杯中国棋王争霸赛决赛冠军;2010年第七届“倡棋杯”中国职业围棋锦标赛亚军;2012年第14届阿含桐山杯亚军;2013年,第一届百灵爱透杯世界围棋公开赛冠军;2013年4月13日,第13届理光杯围棋赛冠军;2013年5月2日,第1届“洛阳龙门杯”中国围棋棋圣战决赛冠军。

TOP6:时越(3528分)

时越,中国职业围棋选手,1991年1月11日出生于河南洛阳。师从黄进先六段,14岁入选国少队。2003年入段,2007年升为四段,2010年升为五段。2003年第3届全国围棋职业新秀赛第三名,2014年11月15日,时越在无锡华美达广场酒店屠龙胜江维杰,赢得第10届无锡威孚房开杯冠军,获得冠军奖金15万元。至2015年8月6日,时越已经连续15个月高居等级分第一人宝座。

TOP7:李世石(3524分)

韩国著名围棋棋手,世界顶级围棋棋手,1983年3月2日生于韩国全罗南道,棋风特点——李世石属于典型的力战型棋风,善于敏锐地抓住对手的弱处主动出击,以强大的力量击垮对手,他的攻击可以用“稳,准,狠”来形容,经常能在劣势下完成逆转。

2016年3月9日起,李世石与谷歌计算机围棋程序“阿尔法围棋”(AlphaGo)进行围棋人机大战。截止3月15日,李世石不敌人工智能“阿尔法围棋”,以总比分1:4落败。

发表评论

评论列表

  • 这篇文章还没有收到评论,赶紧来抢沙发吧~