的策略模型要么是训练时间太短:还没有掌握足够多的策略,要么,就是已经训练得极为成熟,成熟到根本不想利用消极防守策略来跟对手耗时间!因为从长远来看,消极防守对于已方是没有任何收益的,等于是把自己的命运完全交给了对手。
而对于AI来讲,没有任何收益的策略,或者说不能把主动权牢牢把握在自己手里的策略,它必然不会去选择!这也让凌志松了一口气,如果这个AI跟自己已玩起了消极防守,那还真的是不好破局。
因为它消极,那么自己可能就得被迫积极,但是自己所谓的积极防守,放在AI眼里可能会显得有些可笑。
因为它完全可以不按现实世界的寻常套路去出牌,比如说把一些超级难球当做是进攻机会。
所以刚刚的那一杆球,恰恰展示出了它的防守短板!它本意是想要控制白球回到上半台,持续掌握防守主动,然而却没想到大量红球也会同步跟看来到上半台,给对手留下进攻机会。
这一点,或许是设计模型的人没有能够考虑到这种情况。
所以模型训练的时间必然十分有限,还没有达到很成熟的程度。
接下来这局,木心牢牢把握住上手机会,再次一杆超分,没有给AI任何的上手机会!!因为这位"奥沙利文”先生的准度十分惊人,所以木心并不敢托大,如果让它得到上场的机会,那么自已便会再次成为背景板,就这样,之后的3局比赛,木心分别试探出了这位AI先生的其也个短板,最终以5:3的比分赢得表演赛的胜利其实她可以赢得更简单一些,比如用第5局的那杆消极防守,逼迫对手不断把球堆炸散!因为此时是处于比赛当中,它不可能学习到上一局失利的情况,也就是说,从它踏入这个赛场的那一刻起,它的进攻和防守策略,就已经确定下来了。
当然了,这是一般情况下。
凌志有听说过,现在已经有AI能做到在线学习。
也就是说,通过在线学习,AI即便已经正式上线到了生产环境,依然可以通过不断的学习来避免生产过程中的某种误操作,在后续的实践过程当中将这项策略的漏洞给补上!等于说,A不需要再回炉训练,而是会随看环境的变化而不断改进自已,这种方式会降低模型训练所付出的时间成本。
但与此同时,在线学习需要耗费的计算成本可并不低,尽管凌志并不觉得主办方会把这个AI设计成在线学习版本,但是为了以防方一,她还是没有选择跟第5局同样的策略,而是通过其他的防守漏洞赢得了比赛胜利。
不过说起来,这AI设计得还真挺不错的,就是跟自己比,还嫩了点。
比赛结束后,桓志车显得很高兴,使劲拍了拍木心的肩膀,说了很多激励的话语,心也都一一笑看回应。
AI机器人依然是没有任何表示,在与木心和相志军握丰以后:就悄然离开了现场。
木心还想过要不要跟踪它,看看它究竟会去哪里。
但仔细一想,这里是虚拟世界,它所在的地方并没有任荷意义,除非能够看到它的源代码,否则的话还有可能暴露自己已知晓了这次表演赛的秘密。
而就在此时此刻,沉浸式体验部,副部长办公室,楼关听着小桃给自己的汇报,当场把喝进去的茶给吐了出去!!他再也没什么心思保持持,一把把桌上的茶杯给扔到了墙上,摔了个粉碎!“好你个木心,算我看走了眼,没想到你们竟然这么有本事!!”
楼关的眼中冷光一闪,把小桃给叫到身边来,轻声嘱吋她:“比赛结束后,不是有例行的体检环节吗?”
“你给木心那两个小子的体检报告里加一句话,就说他们因为身体原因,不再适合继续实验。”
“他价们已经没有利用价值了,是时候该把垃圾给清理掉了!”
,我要说两句月票