数智时代,数据已成为推动科技进步和产业发展的关键要素。2024年10月,国家数据局局长刘烈宏在《人民日报》上刊文指出,充分发挥数据的基础资源作用和创新引擎作用,有利于带动各类生产要素创新性配置,促进各类先进生产要素向发展新质生产力集聚,提升全要素生产率,为发展新质生产力开辟新空间。要加快构建自立自强的数字技术创新体系,依托数据驱动科技创新,持续增强科技实力和创新能力,深化科技与产业融合,推动产业创新。2025年“数据要素×”大赛科技创新赛道紧扣“科学数据赋能科技及产业发展”核心目标,设置一系列极具前瞻性与现实意义的赛题,为行业发展指引新方向。
一、鼓励科学数据汇聚共享:筑牢协同服务网络基石
科学数据是国家科技创新发展和经济社会发展的重要基础性战略资源,科学数据的汇聚共享是实现科学数据价值最大化的基础。本赛题聚焦科学数据开放共享机制,重点关注海量多源科学数据治理、数据安全与隐私保护等场景。当前,重大科技基础设施与项目产生的各类科学数据,亟须有效汇聚与高效治理,才能串联起价值链条。大赛通过打造可信科学数据空间,实现跨领域流通的科学数据协同服务网络,将推动打破数据孤岛,让数据在不同领域间自由流动。发展综合型、智能化、交互式等新型科学数据发现服务模式,将帮助科研人员高效定位数据,推动科学数据有序开放共享和融合利用。
二、推动科技领域人工智能大模型开发:夯实智能创新根基
科学数据的质量和准确性是人工智能大模型开发的关键所在。本赛题聚焦科学数据标注分类、领域大模型预训练、微调与推理应用等,深度挖掘科学数据和文献价值。通过细粒度知识抽取和多源知识融合,构建科学知识资源底座,建设高质量语料库和基础科学数据集,为大模型提供充足“养分”。本赛题将有力支持科技领域大模型的开发训练,提升其理解和解决复杂的科学问题的能力,为科研和技术创新注入强大智能动力。
三、科学数据助力科学研究和技术创新:成为产业升级引擎
跨领域科学数据与人工智能等技术的深度融合,蕴藏巨大创新潜力。本赛题聚焦科学数据成果赋能技术创新和产业发展等场景,推动其全方位、深层次融合应用与挖掘。大赛通过搭建创新交流平台,为科研人员提供高质量的数据资源与知识服务,结合大模型等新技术,助力科研人员突破传统局限,大胆探索未知领域。特别是在生物育种、新材料等重点领域,以数智融合为引擎,驱动科学创新涌现与转化,推动产业升级迈向新高度。
四、科学数据加速科研新范式变革:催生科研新质生产力
AI for Science在各学科领域的研究与落地,标志着科研范式正迎来深刻变革。本赛题依托各类数据库与知识库,借助人工智能、大数据等技术,推进跨学科、跨领域协同创新。数据驱动的科研模式能够发现新规律、创造新知识、发明新方法,推动科学研究方法不断进步。这种变革不仅加速了科学研究范式的转变,更为新质生产力发展注入强大动力。同时,新质生产力的发展为科技创新提供更广阔的应用场景和发展空间。二者相辅相成,协同共进。大赛积极助推科研范式变革,将进一步提升我国在全球科技竞争中的优势地位,推动科技与产业朝着更高水平更具创新性的方向稳步迈进。
科技创新赛道赛题体系完整有机,紧扣科学数据赋能科技及产业发展目标,从汇聚共享、大模型开发到科研创新驱动范式变革,助力培育和发展新质生产力。本次大赛为产学研用搭建展示创新能力的舞台,有望催生一系列具有重大价值的科研成果和产业应用,为国家科技自立自强和高质量发展贡献力量。(作者 周园春 中国科学院计算机网络信息中心副主任 )