需求背景:
2024年10月,工业和信息化部、财政部、国家数据局联合印发《新材料大数据中心总体建设方案》,部署启动我国新材料大数据中心建设。新材料大数据中心定位于促进新材料科技和产业创新发展的新型研发基础设施,立足机制创新,构建新材料数据资源中心;立足协同创新,构建加速新材料应用数据产品开发的研发中心;立足成果转化,提供材料数据基础产品和定制化服务,构建大中小企业融通发展、促进产业整体能力提升的服务中心。以“公益性、权威性、国际化、可持续”为宗旨,构筑“1+N”的架构体系(1个主平台、N 个数据资源节点),实现科技、产业等材料数据的融通和应用。主平台重点开展基础设施搭建、统一门户建设、标准规范制定、数据流通体系构建、数据技术和产品研发,面向全社会提供数据服务。主平台以边设计、边建设、边运行、边服务的模式加快推进建设工作,以公益服务为牵引,逐步实现稳定运行。目前,统一服务门户测试版(https://www.matbd.cn)已于2025年5月6日上线试运行,公开征求社会各界意见和建议。北京云智材料大数据研究院作为新材料大数据中心建设运营的专职化机构,在数据资源融通治理、软件产品研发、统一门户运维服务方面承担大量具体工作,亟需多领域人才加盟,助力国家材料数据资源体系和服务能力建设。
岗位职责:
1. 数据源对接与支持
• 对接数据资源节点等数据来源,配合新材料大数据中心技术团队完成数据资源节点融通器的接入与使用培训;
• 开展数据融通发布规范培训,定期向数据源反馈融通数据量、使用量、数据质量等指标;
• 配合数据资源节点在中心门户网站建设门户页面及数据资源专区。
2. 数据质量管理与体系建立
• 设计多级数据审核机制,研究智能化审核流程,对融通数据进行形式审查及合规性审查;
• 利用相关工具,开展数据完整性、一致性、重复性校验,确保符合相关数据标准与规则;
• 输出数据质量分析报告,建立材料数据质量管理体系,推动中心数据质量整体提升。
3. 高质量数据集研发
• 基于中心已有数据,设计材料设计、性能预测等高质量数据集产品,明确数据集服务目标,设计数据集结构,定义数据实体与关系,指导数据采集与治理方向;
• 基于领域知识图谱与数据治理框架,通过多源异构数据提取、跨模态数据融合及语义增强技术,遵循FAIR原则构建并发布高质量材料数据集。
4. 数据流通生态构建与协同:
• 与其他部门协同设计数据服务接口和数据流通应用场景,构建数据价值释放体系;
• 配合运营团队开展数据市场化推广,探索生态合作模式。