信息发布
首页/HOME - 信息发布地下水数据挖掘技术培训班二号通知
发布时间:2017-09-26 16:13:07,阅读人数:55063
We are drowning in information and starving for knowledge
面对这海量的数据,我们却倍感知识的匮乏
——约翰∙奈斯比(John Naisbitt) 1982
随着我国地下水监测手段的创新和监测数据的积累,地下水数据日益出现大数据的关键特征:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。这对现有地下水专业人员提出了新的要求,亟需掌握相应的数据处理技术对前端采集的大量数据有效地消化处理。数据挖掘及数据融合技术能充分利用高密高频的多元监测数据,优化专业人员对环境目标高效有序的监督管理过程,这必将是地下水资源乃至环境保护行业今后发展方向和趋势。近年来,计算能力的提高使得机器学习——统计学和计算机科学的跨学科领域蓬勃发展。将物理模型和机器学习更好地结合用于地下水信息挖掘及融合将会成为地下水行业发展的活跃领域。
为响应国内地下水资源环境技术工作者需求,北水国际、国家环境保护工业污染场地及地下水修复工程技术中心、北京大学、中国地质大学(北京)合作,定于2017年10月下旬举办“地下水大数据技术——数据挖掘与机器学习”。
课程内容:
目前地下水数据集体量仍无法与潮流行业(如电商、即时通讯等)相提并论,故本课程并不涉及更为底层的海量数据并行存储与计算领域,而是将授课重心置于大数据领域的核心技术:数据挖掘及数据融合算法。数据挖掘是从地下水数据库中抽取有意义的(非平凡的,隐含的,以前未知的并且是有潜在价值的)信息或模式的过程,根据应用方向,可以划分为分类、聚类、关联规则及预测等几大类。数据融合是指针对含水层按时序获得的若干观测信息,在一定准则下加以自动分析、综合,以完成所需的决策和评估任务而进行的信息处理技术。鉴于课程内容具有跨学科的特点,本培训班将从地下水领域的问题出发,在梳理数据挖掘方法的基础上,以典型案例为指导,结合理论讲解和实践练习,深入浅出剖析典型数据挖掘及数据融合算法在地下水领域的应用,探讨世界范围内地下水工作中的热点和难点问题。
培训对象:
掌握多源或高频次含水层及地下水观测数据的单位和个人,学员应具有一定地下水资源与环境专业基础和实践经验。有意加入中国含水层参数共享平台的学员可以用地下水动态数据充抵部分学费,所收集数据将在北水国际官网开放共享,详情见下文。
授课教师(按姓氏拼音排名)
² Michael J. Friedel 博士,高级地球物理专家,科罗拉多大学副教授。明尼苏达大学双城分校获得水资源科学(计算机水文学)博士毕业。曾就职于美国地调局,担任水文地质研究员、地球物理研究员、高级水文地质学家。Ground Water、Vadose Zone、Applied Geophiscs、Engineering Geology 期刊审稿人。在地下水大数据和机器学习领域有超过30年的工作经验,致力于开发应用高级计算机及智能数据驱动的全套工作流程,来描述、预测、预报及解译人类及自然活动对水文、地质、大气及生物圈的影响。
² 齐永强 博士,北水国际副总经理,美国阿拉巴马大学获得地质学博士毕业。中国地质大学(北京)水资源与环境学院客座教授,亚洲开发银行特聘专家,台湾高等法院污染刑事案件专家证人。开发了双吸附点位地下水污染模拟程序(MT3DDS)和高应力含水层参数估计软件(TFPR)。
² 杨丽红 北水国际高级技术经理,毕业于美国纽约州立大学,亚洲开发银行特聘专家。曾作为项目负责人为国家环保部编制《地下水污染模拟预测评估工作指南》,并开展了全国典型案例区示范工作,对数学模型在水资源和水环境管理中的应用具有丰富经验。开发了高应力含水层参数估计软件(TFPR)。
培训软件
GMS:地下水模拟系统(Groundwater Modeling System) ,简称GMS ,是美国Brigham Young University 的环境模型研究实验室和美国军队排水工程试验工作站在综合MODFLOW、FEMWATER、MT3DMS、RT3D、SEAM3D、MODPATH、 SEEP2D、NUFT、UTCHEM 等已有地下水模型的基础上开发的一个综合性的、用于地下水模拟的图形界面软件。
PEST:非线性参数估计和不确定性分析综合软件,常用于实现参数优化模拟。
R:用于统计分析、绘图的语言和操作环境。R属于GNU系统的一个自由、免费、源代码开放的软件,是一个用于统计计算和统计制图的优秀工具。下载地址:https://www.r-project.org/
RStudio:免费开源的R语言集成开发环境(IDE),可以在桌面机(Windows\Mac\Linux)多平台运行,也可以在Linux服务器上安装RStudio服务器,供用户远程云端web使用。
TFPR:以高应力含水层水位动态分析方法HDA为基础开发的高频地下水监测数据挖掘工具。
Siro SOM:由赫尔辛基理工大学计算机与信息科学实验室神经网络研究中心开发,提供SOM算法工具包的图形化操作界面,有助于快速挖掘、综合解译数据。
课程安排
授课语言为中文及中文翻译。
日期 |
时间 |
题目 |
重点 |
第一天 |
上午 |
讲座:数据挖掘与地下水问题概述 讲座:神经网络技术概述及其在地下水科学中的应用 |
数据挖掘技术体系、神经网络技术、地下水数据体系特征 |
讲座:地下水数据结构概述 讲座:地下水数据空间基本特征 |
|||
下午 |
讲座:主成分分析理论与算法 |
地下水水化学数据初筛与预处理、 |
|
讲座:岩溶山区泉水水化学溯源分析案例 |
|||
上机:使用数据降维技术进行地下水化学端元识别 |
|||
第二天 |
上午 |
上机:神经网络计算软件SiroSOM界面简要操作与练习 |
非监督人工神经网络、SiroSOM界面、使用SOM进行估算及交叉检验 |
讲座:使用SOM实现含水层参数平滑内插及自组织映射SOM算法理论 |
|||
上机:地下水多源数据融合实现参数平滑内插 |
|||
下午 |
讲座:地下水水位波谱分析简介-频域模型 |
线性回归、非线性回归、 |
|
讲座:基于逐日地下水位波动求取含水层关键参数 |
|||
讲座:多元非线性回归算法 |
|||
上机:利用WTFR方法求取含水层关键参数 |
|||
第三天 |
上午 |
讲座/上机:基于聚类分析的水文地质子单元(HSU)划定 |
聚类、K-means、监督下人工神经网络算法 |
讲座/上机:人工神经网络算法在含水盆地勘察与评估中的应用 |
|||
下午 |
讲座:地下水模型校准与参数优化 |
向导点法、GMS、地下水模型校准、正则化 |
|
上机:GMS-PEST向导点操作练习 |
需学员自带笔记本电脑,并应在培训开始前完成相关软件的安装调试。由于SiroSOM界面适配问题,请尽量携带安装Windows 7的笔记本电脑。(注:以上培训内容和课程安排可能变动,以正式的培训通知为准。)
报 名 事 项
人民币3500元/人。其中含注册费、讲义、及听课费。学员往返路费及食宿费用需自理。
培训人数限制:40人,报满为止。
² 优惠政策:
(1) 8月20日前汇款,可享受优惠500元。
(2) 凡在培训通知发布之日起至8月20日之前加入中国含水层参数共享平台计划的学员,可优惠1000元。每个学员需提供高抽水应力潜水含水层内五口监测井井位、至少两个水文年的逐日水位监测数据、以及相应的逐日降水数据,数据系列应连续工整且能够通过HDA检验。由此求得的含水层参数将在北水国际官网共享,如下图示。
(3) 同单位参加培训人员超过3人后,从第4人起可享受半价培训;
(4) 大学全日制在校学生可凭真实有效学生证享受八折的优惠价格。发票单位与学生证单位一致;
(5) 优惠政策1、2可以累加,除此之外,不可累加,北水国际具有对以上条款的最终解释权。
l 时间与地点:
时间:2017年10月17-19日
地点:北京文津国际酒店
l 联系方式
联系人:许女士 电话:010-58815801 152 1063 1512
邮箱: info@bwil.com.cn yxu@bwil.com.cn
报名方式(填写以下报名表后发送至联系邮箱)
学员姓名 |
|
邮箱地址 |
|
单位 |
|
||
手机 |
|
||
参加培训目的 |
|
||
关注领域 |
|
||
通过哪种方式知道此次培训的消息? |
电子邮件 |
□ |
|
公司网站 |
□ |
||
同事转告 |
□ |
||
其它 |
|