当前位置: 首页 > 研究中心 > 医疗大数据研究中心 > 正文

山东大学健康医疗大数据研究院简介

【 发布日期:2020-01-19 】

山东大学健康医疗大数据研究院是山东大学数据科学研究院的四个研究中心之一,为校内实体教学科研机构;也是山东省健康医疗大数据科技创新平台的依托单位,是国家健康医疗大数据北方中心的重要组成部分。

研究院现有总面积达9600平方米的科研用房,包括面积达3600平方米的科研楼、面积达4000平方米的数据驱动假设的医学研究功能验证实验及面积达2000平方米的孵化器。内含面积达300平方米的数据储存与运算中心和数据可视化展示中心,面积达600平方米的高通量生物组学大数据检测中心,面积达300平方米的生物标本中转库。为数据分析产生的生物医学假设进行细胞生物学、分子生物学、动物模型实验验证及实验室产生的大数据科研成果产业孵化和示范推广提供了强有力的保障。

此外,研究院已配备了总价值4820万元的仪器设备。包括总价值600万元的“数据储存与运算平台”,总价值120万元的数据展示与可视化平台及总价值4100万元数据驱动假设的医学研究功能验证实验室的仪器。

研究院的整体规划是创建1种新范式:本着“顶天立地”的“双一流”学科建设原则,致力于创建数据驱动假设的医学研究新范式。创建2个大队列:通过构建覆盖2000万自然人群队列和涵盖90个重点疾病1000万病例的临床大数据队列,创建多中心健康医疗大数据研究和转化平台。目前自然人群队列已覆盖500万人口,并预计在2019年底完成1500万人口收集。设定3个重点建设任务:推进健康医疗大数据科学的学科平台建设、健康医疗大数据驱动的医学研究体系建设,健康医疗大数据成果示范推广和产业化平台建设。设定4个研究方向:数据资源汇聚和数据融合的理论和技术方法,数据治理和优化的理论方法与技术,数据挖掘分析的理论方法与技术,数据应用转化与产业化研究 。创建5种成分融合的交叉团队:研究院整合了山东大学临床医学、预防医学、基础医学、生命科学、数学与统计学、计算机科学、控制科学、信息科学、管理学等多学科交叉优势资源,汇聚了政府、知名企业、顶级医疗机构等方面的健康医疗大数据资源。目前研究院研究团队已有成员近百人。

研究院的总体目标是建立“国际一流、国内引领”的健康医疗大数据研究机构。研究院将采取分阶段,稳步推进、逐步优化的策略,建设成为国际一流的健康医疗大数据学科平台;建立大数据驱动的医学研究体系,在转化医学、临床比较效果研究、个性化精准医学研究等领域实现突破性进展;在大数据成果转化和产业化方面探索出政、产、学、研、用结合的创新模式。争取3-5年内成为省部级健康医疗大数据重点实验室或工程中心。力争5-10年内,成为国家健康医疗大数据重点实验室或国家健康医疗大数据工程中心。

研究院下设机构

研究院目前组建了由9个学科加盟的,以PI为核心,高水平博士后,博士、硕士研究生为骨干的18个研究中心及15个管理/服务机构,全面开展面向政府、医疗机构和行业企业的健康和临床数据科研服务。

在基础理论方法与技术研究方面,组建了大数据多方计算、大数据因果推断、跨组学大数据、队列大数据关键技术、大数据核心技术、大数据超算资源管理、大数据智能感知与计算、生物信息大数据、医院数据治理与分析等9个研究研究中心。

大数据多方计算研究中心

研究方向:1)研究高度分散的生物医学数据源,跟踪从生成到准备的演化过程,开发处理不同结构数据的新方法;2)开发基于并行和分布式架构的算法;3)开发海量数据可视化方法和分析方法;4)开发可扩展的增量式算法及海量数据下的统计模型构建所涉及的一系列问题。

该中心完成了3个传统一体化统计学计算在多方计算条件下的分布运算和合并,取得了与原有集中数据运算完全一致的计算效果,使得在数据不出门的情况下,实现多中心协同计算成为可能。

大数据因果推断研究中心

研究方向:1)大数据背景下控制选择偏倚、测量偏倚和混杂偏倚的因果推断理论方法;2)大数据驱动的系统流行病学网络/通路比较及靶点识别的因果推断理论方法;3)基于多中心大数据共享的因果推断边缘计算模型;4)基于深度因果学习的精准医学个性化效应评价方法。

跨组学大数据研究中心

研究方向:1)肿瘤跨组学大数据研究;2)影像基因组学的研究;3)复杂疾病代谢组学的研究;4)宏基因组学在疾病研究中的应用;5)用于精准医学研究的药物基因组学。

该中心与齐鲁医院神经外科李刚教授团队合作,在脑胶质瘤免疫微环境分子标志物鉴定的关键技术研发和推广应用领域取得重大突破,不仅阐明了低氧胶质瘤促进抑制性免疫微环境形成的分子机制,还将关键分子标志物的鉴定和检测技术进行了全面推广,对山东省脑胶质瘤精准诊疗事业发展起到了重要推动作用。

队列大数据关键技术研究中心

完成包括16种常见肿瘤,300余种传染病和70多种其他类型疾病的疾病编码、药品编码等主要医学术语的归一数据库,所创建的队列已服务多个研究机构的临床专家开展临床科研。

大数据核心技术研发中心

该中心完成了医学数据科研平台的一期研发,将“集成-优化-分析-应用”医学数据科学技术生态体系融合为一个统一的软件平台,实现了单点登录,分布存储,混合搜索,多方计算,持续开发集成等功能模块的开发与测试。

大数据智能感知与计算研究中心

研究方向:1)医学影像组学;2)智能心理测量,计算精神病学,信息安全心理学;3)网络空间安全(生物特征识别、隐私保护与区块链)。

该中心多次出访国内外知名人工智能科学领域知名科研机构,并邀请相关专家来访。与重庆邮电大学王国胤教授团队共同申报的科技部重点研发计划“主动健康与老龄化应对”。

医院数据治理与分析中心

研究方向:依托健康医疗大数据平台组织临床专家、信息化专家完成医院业务数据高质量采集技术开发、数据质量评估体系建设、临床研究队列建设、医院运营管理理论研究。

该中心完成了千佛山医院,山东大学附属儿童医院的医院科研数据集成平台建设,及包括省立医院,齐鲁医院等多家医院11个疾病队列数据的汇集和治理,相关分析结果正在挖掘调整。

在转化与应用研究方面组建了数字健康中国、癌症早诊早治大数据、药物大数据、医学影像大数据、妇女儿童健康大数据、精神卫生大数据、整合健康管理&健康保险、医养结合大数据、生物安全大数据等9个研究中心。

数字健康中国研究中心

研究方向:1)个体社会经济状况对健康和医疗服务行为的影响;2)宏观经济及空气污染的健康效应研究;3)健康城市评估;4)医养结合。

该中心参与了山东省卫健委多个政府文件和报告的起草,参与了2018版山东省全民健康信息标准数据集的修订与推广;药物大数据研究中心成功申报了山东省重点基础研究专项;整合健康管理与健康保险研究中心,完成了16种恶性肿瘤风险评估模型的研发,相关专利正在申报中,已转化的25种慢病风险评估模型实现了500万元的销售额;为济南市人力资源研究院提供健康人力资本测算服务,研究转化2项。

癌症早诊早治大数据研究中心

研究方向:1)复杂疾病代谢组学的系统流行病学设计与统计方法研究;2)癌症风险评估模型研究;3)生命历程流行病学理论方法研究。

药物大数据研究中心

研究方向:1)药物大数据平台建设及药物数据科学研究;2)药物政策研究;3)药物基因组学理论方法研究;4)精准用药决策支持及辅助基因芯片研发;5)精准用药智能决策系统和机器人药师开发

妇女儿童健康大数据研究中心

研究方向:1)孕前至产后全生命历程暴露与妊娠期疾病及新生儿疾病相关性研究;2)妊娠期并发症的危险因素与高危人群预测模型研究;3)婴幼儿常见疾病危险因素与人群预测模型研究;4)女性营养膳食状况与妊娠期并发症及新生儿疾病相关性研究。

精神卫生大数据中心

研究方向:1)心脑血管疾病患者精神卫生健康管理模式研究;2)神经免疫疾病患者精神卫生健康管理模式研究;3)精神障碍流行病学研究;4)自杀流行病学研究

整合健康管理&健康保险技术研发中心

研究方向:1)风险评估模型研发;2)健康干预指南及辅助诊疗;3)核、保分级模型研发;4)多中心健康医疗大数据队列平台创建;5)健康管理及健康评估中心。

生物安全大数据研究中心

研究方向:1)现代空间信息技术;2)传染病侦察预警3)传染病应急防控与仿真模拟;4)病原微生物信息

为各研究中心科研和转化工作的顺利开展,研究院配置了包括人才引育办公室、项目管理与合作办公室、医学数据伦理与法学研究中心、数据安全管理办公室、交叉学科管理与双创中心、交叉学科双创实践基地、山东省健康医疗大数据科技创新平台、山东省医养结合智库、济南临床数据研究管理中心和千医、省立等多个临床医院的大数据管理中心。

签署各类合作科研协议7项,制定相关管理和服务制度14项。

引进两个国家级学科平台:国家自然科学基金委重大集成项目合作基地(李立明教授),中国人类表型研究协作组成员单位(金力院士)。

人才引育

研究院聘请金力院士为健康医疗大数据名誉院长;聘请兼金力院士、赵国平院士、周泓灏院士为兼职讲席教授;研究院现有全职教授4人、副教授6人,特别资助博山后1人、重点资助博士后1人。其中山东大学特聘教授1人、山东大学齐鲁青年学者1人、山东大学未来学者2人。

学生培养

获批教育部首个数据学科交叉博士/硕士培养点,已经招生,培养博士研究生5名,硕士研究生6名;送出国外联合培养的博士研究生4人;去国外知名大学(斯坦福大学)就读博士研究生1人,截至目前,来自校内5个学科的研究生已经达到50人以上,来自校外合作联合培养的研究生2名。

申报了“预防医学+医学数据学”微专业,在预防医学专业框架下,培养在基础医学、临床医学、预防医学、医工交叉、医理交叉、医文交叉等领域继续深造的复合型公共卫生人才,打破现有预防医学培养体系过于老化,专业培养与就业职业发展需求匹配度不够的局限性。

学生在修满流行病学、卫生统计学等预防医学核心课程基础上,继续修满10-15门医学数据学课程(包括必修课程:医学数据学导论、数据科学概率统计基础、数据科学计算机与软件编程基础、健康医疗大数据治理与可视化、跨组学大数据队列设计与分析基础、数据驱动的医学预测与决策、数据驱动的医学因果推断、生物信息学;选修课程:人工智能概论、机器学习与深度学习、分布式计算和医疗区块链、自然语言处理、海量数据采集与处理、数据可视化、非结构化数据分析、大数据预处理、医学数据行业实践);通过半年的实践教学,具备从事健康大数据行业实践专门知识,获得大数据采集、整理、分析和运用的能力,使其能够熟练操作大数据平台和使用大数据处理专业软件工具,能够从海量健康医疗大数据中提取出简单易懂、有价值的信息并应用到研究和工作实践中。