怀着非常激动的心情,我和我的同事们今天完成了本院大数据平台的验收工作。感谢学校和领导的支持,让学院的数据库建设上了一个新的台阶。
数据库的具体性能以及特点描述就不赘述了,有兴趣的读者可以看本文最后的小字(来自乙方),我只想和大家分享一些让我激动的瞬间:
回想起刚来到学校的时候,我向领导们描述的愿景就包括建立一个基础的数据共享和分析平台。这个愿望在我前往包括国际肿瘤研究机构等一线科研机构后变得更加强烈。只有数据实现规范化储存和可溯源留痕式应用,才能更好保证研究可复现性,透明度,还有科学的可信度。现在我们尽管距离实现这个目标依然很远,但至少已经不是遥不可及。
借助大数据平台建设的机会,我第一次有机会参观了位于学校网红图书馆的高层托管机房。在闷热嘈杂的高性能计算机房中,我们很高兴地看到了属于商学院的服务器硬件。
我再次惊讶于学校大数据储存和运算平台资源的丰富,我们商学院使用了托管机房最后两个格子中的一个,若不是赶上,等其他院系扩展现有硬件资源,将没有空间安置我们学院的数据系统,不禁感到一丝庆幸。
我们也参加了由设备安装方的系统课程培训。
未来,平台将会逐步实现以下功能:
数据资源:平台将汇聚海量的医药行业数据,包括医药市场数据、临床试验数据、电子病历数据、组学数据等,满足不同科研需求。
计算资源:平台提供高性能的计算资源,支持大规模的数据分析和计算。
软件工具:平台提供包括R、SAS等在内的多种数据分析软件工具,满足不同科研需求。
科研协作:平台支持团队协作,方便师生之间进行科研交流与合作。
平台特色
从此以后,我们会有稳定可靠的线上自主数据储存平台,再也不需要物理隔离的计算机和容易忘记密码的大容量硬盘。我们将能够与合作者实现数据安全共享和云端线上结果的合规展示,会大大增加我们科研的效率。
当初的愿望,正在一个一个实现。这些耗费巨大的基础科研设施不是大玩具,而是开展高水平有组织多学科科研必不可缺的工具。我们作为在药科大学开展真实世界研究和药物流行病学的团队,无疑感到巨大的荣幸还有重要的使命。
“在业务承载方面,平台通过虚拟化等能力构建一个平台呈现硬件、平台、业务和数据四个层面,高性能承载各类丰富业务应用,虚拟机随需弹性添加、弹性扩展,时刻有效协助解决科研或教学面临的新挑战、新要求
在存储管理方面,做到上层协议开放、统一对接管理各类数据存储服务,下层硬件解耦、充分发挥分布式存储优势实现存储资源池化,灵活扩容应对业务和数据变化。同时通过自动化的数据管理策略可视化分析存储现状,更高效更轻松应对海量数据的管理挑战。
在数据可靠方面,通过内置的AI硬件故障大模型能力在平台软件层面对硬件故障进行预防、检测、隔离、告警等动作来避免因硬件不稳定而对数据产生影响。并且依托平台本身的先进架构,提供如存储多副本、自平衡、数据重建等机制,来保障数据可靠。
在数据安全方面,平台具备嵌入Hypervisor层的安全底层代码,使得虚拟机上线即安全,安全策略完全跟随业务运行,强化虚拟机访问控制能够端口收敛。通过将安全和云统一管理,实现更便捷地完成云资产管理、安全策略管理和安全事件闭环。”(来自设备供应商)