一一判别器很难鉴定其真伪。
这时候,就可以用少量真实数据加大量生成数据来训练算法,从根源上解决特殊参与者训练数据不足、数据收集困难的问题。“思路上我明白了,"梁思宇非常犹豫,“可是,这有点像一种数字游戏。”“用虚拟生成数据来训练运动控制算法?怎么确保它们和真实数据一致?”他点破自己的担忧:“判别器不能分辨,也许不是虚拟数据足够仿真,而是你的判别器不够聪明呢?”
许瑷达点头:“所以,我们还是要招募阿得拉的使用者,收集真实数据。你就当我的GANs算法在搭便车,做不出来也没损失,对不对?”“到时候,如果用它生成的虚拟数据和真实数据训练出来的算法一样好,你是不是可以承认,我的方法是有效的?”梁思宇叹了口气,听她这意思,是准备私下完成,才向导师汇报,可见她自己也知道成功率不高。
这是刚发表一年的新算法,万一算法本身有问题呢?况且,她完成了算法,也得投稿啊,审稿人那一关呢?他觉得这个做法真的很冒险。他劝道:“Ada,你也得想想投稿的问题,审稿人恐怕会觉得这方法不够严谨。起码,医学期刊上,据我所知,没有人会接受虚拟数据。”她有些不舒服,微微提高了音量:“那是你们既傲慢,又无知,不肯看看其他领域的进步。”
她怎么这么倔呢?他扶着额头:“你就准备这么回复审稿人?”“行了行了,我就私下说说。"她也承认自己不过是逞口舌之快。其实她不准备投医学期刊,这个适合nature、PNAS这种综合型期刊。不过,涉及药物和医学,还是可能遇到医学方向的审稿人。她眼珠一转,神秘兮兮地笑了,像只小狐狸。她干脆绕过餐桌,坐到他膝上。
“Ned,你来想想怎么应付审稿人,好不好?"她抱住他脖子,轻轻摇晃。“你想得美!"梁思宇无奈地扶住她的腰,让她坐更稳。这个小坏蛋,老喜欢把这种解释类的写作任务扔给他。
他点一下她眉心,“还审稿人呢?先想想怎么说服布鲁克教授吧。”“可行性啊。"她理直气壮地说,“阿得拉的参与者容易找,干净的曲唑酮对照组可不容易吧?”
基于科研伦理,他们显然不可能为了研究运动控制算法,让健康人服用曲唑酮。
“怎么没有对照组?"梁思宇笑着摇头,“因为原发性失眠而服用曲唑酮的患者,很干净的药物效应。”
她愣了一下,啊,有对照组吗?
她戳一下他肩膀:“那,那你怎么不早说啊?”他摇摇头:“你不是在写阿得拉的算法吗?我哪能想到,你还想无中生有,一举两得,把曲唑酮的问题也一起解决掉。”“什么无中生有?我这是数据科学!"她瞪他一眼,不过又陷入沉默。如果有办法研究曲唑酮,布鲁克教授肯定不会随便接受“做阿得拉速度更快"这种理由。
她叹口气,准备问问原发性失眠患者是否容易招募,但瞥到梁思宇的眼神,一下福至心灵。
她再次抱紧他的脖子,靠到他耳边:“Ned,Ned,如果我想做阿得拉,还有什么好理由?你一定知道什么,快点告诉我!”“好了好了。"他躲了一下,喉结滚动。
“原发性失眠患者很难招募。需要一个复杂的筛选流程,说不定100个报名者里,只有5个符合。”
这也是他没主动和她讨论新计划的原因,他也一直在思考,有没有更好的方案。
他叹口气,下定了决心:“既然你想快点,顺带检验新算法,那我们就做阿得拉。”
“至于曲唑酮,不如直接招募服用曲唑酮的截肢患者。反正都是慢慢凑人数,不如一步到位,直接研究目标人群。”她凑上去亲他一口:“你放心,只要GANs成功,曲唑酮那边,我们只需要很小的样本,GANs就可以模仿他们生成数据,你完全不用再愁样本量的问题。“我对此谨