十年前Cloud Computing火爆的时候,大家自然而然开始了想站在生物云计算的风口,可是没起风,猪肉去涨价了。生物云计算究竟是遗失的美好,还是雾里看花,水中望月;究竟是出身未捷身先死,还是怀才不遇,壮志未酬。
生物云计算,看上去很美
首先,我们的定义是什么?
按照字面定义,目的就是做生物的计算,主要包括各种生物序列的分析工作,加上云,就是能够在云端处理。其实和其他云计算也没太大的不同。这是非常好的想法,后面在结合上5G技术,就更好了。比如在野外利用孔测序仪进行测序,数据实时传输到云端开始处理,然后结果返回结果。通过各种终端都可以直接查看结果,看起来非常完美是不是。
然而现实情况是,这些年很多公司推出的生物云计算,大方向都是在炒概念,生物大数据,生物云计算,5G,物联网,人工智能,精准医学……都是当前时髦的热词,如果不带几个这样的词儿,都不好意思和别人打招呼。但是当街头老大妈都准备入市赚钱的时候,也就说明股市泡沫要来了。
硅谷有一个臭名昭著的技术成熟度曲线,也叫做技术循环曲线,或者直接叫做炒作周期,是指新技术、新概念在媒体上曝光度随时间的变化曲线。是指经过新闻媒体和学术会议的大肆宣传之后,新技术趋势一下子跌倒了谷底。生物云计算就是这样的一个例子。
生物云计算的乌托邦之梦
云计算其实是一种非常好的解决方案。然而目前为何还没有完全普及,虽然市面上有很多产品,有些做得确实也还可以,但依然不是主流。能效升近7万倍!新兴超导量子技术实现神经网络硬件加速系统
很多公司的产品是想做成傻瓜式的操作,有一个图形化界面,用户购买之后,登录账户,然后上传数据,选择要分析的流程,点击运行,然后等待结果就行,用户体验非常好是不是,你甚至不需要任何生物信息经验就可以了。
利用这段时间,去楼下点上一杯咖啡,晒晒太阳,伸个懒腰,刷刷手机,然后回来等待结果就行了,生活真美好……
甚至还有很多人预言,已经不需要做生物信息的人了,这些工作会像精算师一样逐渐被生物云计算以及人工智能所取代,这个我不肯定也不否定。
梦醒时分喝完咖啡回来,查看一下结果。“wow,fxxx”,出错了,到底哪里有问题呢?这就是当前生物云计算的问题所在。将所有分析封装起来,如果中间环节有问题,就比较麻烦。
举个简单的例子,
例如做人全基因组的变异检测。从拿到原始测序数据,到最终得到可靠的结果,中间可能需要10几个处理过程。这些过程都是承上启下的,有一个过程有问题,整个流程就断掉。如果断掉在查找原因,重新从这里开始,这反而更加繁琐。
其次,
像这种非常标准化的分析过程,采用目前的云计算是没有问题的。但如果是做科学研究。科学研究本身就是一个反复探索的过程,需要反复测试,不断调参,使用这种图形化反而更加复杂。
第三:
所有图形化本质上只不过是给命令行添加上一个按钮,本质上内容都是一样的,根本不存在不懂生物信息也能使用的情况,如果不懂的话那些参数就只能按照默认的来处理了。
回到未来
由于当前的生物云计算现实情况,就会造成一种现象:懂分析的人不喜欢图形界面,不懂分析的人有了图形界面也还是不会用。我并不是一棒子打死各种生物云计算,每个用户的具体需求不同,具体分析内容也不同,有些分析云计算非常方便。相反,我觉得需要生物云计算,甚至我们自己也运营生物云计算平台,只不过不是图形化界面,需要用户自己熟悉敲命令。
其实云计算有诸多的优势。
首先,
方便数据管理,也就是同一份文件不需要进行多个拷贝,测序完成之后直接上传到云服务器,用户可以在任何地点联网访问。
第二,
软件和数据库也无需进行多个拷贝,并且可以第一时间进行更新,省去很多麻烦,例如,只需要在云端下载一份nt数据库,所有的用户都可以与之进行比对,而不需要下载很多份。
第三,
云计算可以进行弹性计算,也就是资源可以充分利用,需要多大资源,就提供多大资源,不会像本地资源存在计算资源不足的情况。
第四,
云计算不需要很多的配置以及系统维护。