微信里点“发现”,扫一下
二维码便可将本文分享至朋友圈
演讲摘要:在工业领域,由于传感器精度、设备故障、网络不稳定、复杂环境干扰等多种原因,数据质量问题尤为突出,这对于高度依赖数据深度利用的新一代智能制造发展形成了巨大的障碍。本报告梳理工业场景下的数据治理生命周期与面临挑战,介绍工业物联网时序数据治理研究最新进展,以及技术方法在开源软件Apache IoTDB工业物联网时序数据库的系统实现和应用案例。包括时序数据质量评价指标,即完整性、一致性、实效性、有效性等;时序数据填补与修复方法;油量监测、虚警过滤等应用案例。
讲者简介:宋韶旭,清华大学软件学院副教授、博士生导师。从事数据质量、数据集成和数据挖掘方面的研究。主持多项国家自然科学基金项目、国家重点研发计划项目课题。在TODS、VLDBJ、TKDE、SIGMOD、VLDB、ICDE、KDD等CCF-A类期刊和会议上发表论文40余篇。入选国家万人计划青年拔尖人才,担任JCST青年编委、JDIQ特约编辑,IEEE BigData 2022 Vice Chair,VLDB、ICDE、KDD、SIGIR等国际会议程序委员会委员,中国计算机学会数据库专业委员会执行委员。