数据流算法

课程目标:数据流算法一直是计算机网络、数据库、数据挖掘领域的热点话题。随着互联网的高速发展和数据中心规模的逐步扩大,数据流统计算法面临的流量规模急速增长,如何使用有限的资源处理大规模数据流成为了研究的重点。本课程主要介绍大规模高速数据流(流式大数据)中使用的各种概率统计算法和数据结构,包括各种sketch、采样方法、Bloom filter、随机映射、相似度等带误差的估计算法。此类算法在网络、数据库、数据挖掘、机器学习等方向都有广泛的应用,在近年的SIGCOMM、SIGMOD和SIGKDD都有多篇论文发表。通过学习,学生们应该能够了解并掌握数据流概率统计算法的基本思想和原理,能够设计并实现基本的概率统计算法,对目前主流的概率统计算法和数据结构有深入的了解和应用经验。

开课基础:《数据结构与算法》或者相关课程

学期: 

秋季学期

开课学年: 

2020