首页 > 范文大全 > 申报材料 正文
【申报最佳创新奖理由】KDD 2022奖:中国学者获得了创新奖、博士论文奖、新星奖等多项奖。

时间:2023-02-10 20:03:03 阅读: 评论: 作者:佚名

机器的心报道

机器心脏编辑部

KDD 2022已经发表了时间检查奖、博士论文奖、革新奖等重量奖。

最近几天每年举行的KDD大会正在美国华盛顿特区举行。

此次大会包括Research和Applied Data Science的两条赛道。此前,大会发表了论文接收结果。Research track共收到1695篇投稿,其中254篇为14.9%,去年收到了Research track(1541篇投稿,238篇接受,接收率为15.4%)。应用数据科学跟踪共收到753份投稿,其中195份。

总的来说,大会的受理率为18.3%(2448部投稿,449部受理)。

随着会议的进行,各对象也开始逐一公开时间检查奖、博士论文奖等重要奖项。其中斯坦福大学中国人博士获得了博士论文奖,清华大学博士题主中获得了博士论文亚军。中国计算机科学家刘欢教授获得KDD创新奖,清华大学助理教授董同学晓获得新星奖。

时间检验奖-研究方向

研究方向的时间检验奖是为了表彰KDD大会的杰出论文,KDD大会在过去10年里对数据挖掘研究社区产生了重大影响,仍然被引用为新研究点的基础。今年获得该奖的人是加州大学河滨分校Thanawin Rakthanmanon等2012年论文《Searching and Mining Trillions of Time Series Subsequences under Dynamic Time Warping》。

论文地址:

大多数时间序列数据挖掘算法以相似性搜索为核心子程序,因此相似性搜索所需的时间几乎是所有时间序列数据挖掘算法的瓶颈。大部分时间序列数据挖掘的学术工作停留在考虑数百万个时间序列对象上,而在许多工业和科学领域,数十亿个时间序列对象在等待探索,这在很大程度上解释了为什么将搜索扩展到大数据集上存在困难。

在这篇论文中,Thanawin Rakthanmanon等研究者表示,这是他们第一次能够结合四个新想法搜索和挖掘真正的大规模时间序列。他们证明了以下极端反直觉的事实。在大数据集上,可以在DTW下准确搜索,比当时的SOTA UCLID距离搜索算法更快。

目前,这篇论文在谷歌Scholar上引用的量为1050。

时间测试奖-应用数据科学方向

晶晶、郑宇、谢兴等2012年论文《Discovering Regions of Different Functions in a City Using Human Mobility and POls》获得了大赛应用数据科学方向的时间检验奖。这些研究者都来自微软亚洲研究院。

论文地址:

如题目所述,本论文旨在利用人的流动和地图上的关注点(POI,可以将一切抽象为点的地理大象)来寻找城市的各种功能区域(如教育区、商业区)。这个目标是通过名为DRoF的框架实现的。

特别是,研究者根据主要道路(如高速公路或城市高速公路)将一个城市划分为彼此不相连的区域。他们使用基于主题的推理模型,将区域表示为文档(document)、功能(例如餐厅、购物中心)表示为元数据(例如作者、相关性、关键字)、人的流动模式(因此,区域可以用函数分布表示,函数可以用移动模式表示)。

的分布为特征。然后,他们进一步确定每个功能在不同位置的强度。

DRoF 框架产生的结果有着广泛的应用价值,包括城市规划、企业选址和社会推荐。研究者使用大规模的真实数据集评估了他们的方法,包括北京的两个 POI 数据集(2010 年和 2011 年)和两个 3 个月的 GPS 轨迹数据集(代表人类出行,分别在 2010 年和 2011 年由 12000 多辆北京出租车生成)。结果证明,他们提出的方法优于仅使用 POI 或人的流动性的基线方法。

目前,这篇论文在 Google Scholar 上的引用量是 1198。

博士论文奖

斯坦福大学博士 RexYing(应智韬)的博士论文《Towards Expressive and Scalable Deep Representation Learning for Graphs》拿到了今年的博士论文奖。

论文链接:;cbl=18750&diss=y

在这篇论文中,应智韬提出了一系列方法,这些方法率先使用图神经网络来解决图表示学习在可解释性、可伸缩性和表达性方面的挑战。论文的第一部分展示了 GraphSAGE 框架,它是一个通用但功能强大的图神经网络框架。第二部分在 GraphSAGE 框架下展示了一系列工作,通过使用层次结构、几何嵌入空间以及 multi-hop 注意力来提高 GNN 的表达能力。最后,他展示了 GNN 在推荐系统、异常检测和物理模拟领域的各种应用。

应智韬于 2022 年 1 月获得斯坦福大学计算机系博士学位,师从斯坦福大学计算机学院副教授、图神经网络大牛 Jure Leskovec(拿到过 KDD 最佳论文奖、时间检验奖等奖项)。目前,应智韬已经加入耶鲁大学担任助理教授,继续研究图神经网络、表示学习、几何深度学习等方向。

除了这篇论文之外,还有两篇论文拿到了最佳论文奖亚军,分别是清华大学博士裘捷中的《Graph Representation Learning: Spectral Theory and Self-supervised Learning》和慕尼黑理工大学博士 Daniel Zügner 的《Graph Representation Learning: Spectral Theory and Self-supervised Learning》。其中,裘捷中的导师是唐杰教授,他本人目前在腾讯担任高级研究员,主要研究方向是图数据的算法设计和表示学习。

KDD 创新奖

KDD 创新奖旨在表彰对数据发现与数据挖掘领域做出杰出贡献,并促进理论和商业系统发展的研究者。

2022 年 KDD 创新奖颁给了华人计算机科学家刘欢教授。获奖理由是「他对社交媒体挖掘和数据挖掘的特征选择的基础、原则以及应用做出了杰出贡献」。

个人主页:

刘欢教授的研究重点是数据挖掘、机器学习和社会计算,致力于设计有效的算法将基础研究转化为实际应用。2018 年,刘欢教授当选 ACM Fellow。

KDD 新星奖

KDD 自 2020 年开始设立新星奖。该奖项根据研究者在博士毕业五年内的工作选出获奖者,旨在促进研究人员规划和建立自己的职业生涯。

今年的 KDD 新星奖颁给了清华大学的东昱晓博士,获奖理由是「他博士毕业五年内在网络数据挖掘和图机器学习领域做出了突出研究」。

个人主页:

东昱晓博士现任清华大学计算机系助理教授,主要研究方向为数据挖掘、图机器学习、预训练模型和社交网络。他曾获得 2017 年 ACM SIGKDD 博士论文第三名。

杰出服务奖

KDD 杰出服务奖旨在表彰在知识发现和数据挖掘领域做出杰出专业服务贡献的个人或团体。

今年的杰出服务奖颁给了 IBM TJ Watson 研究中心的杰出研究人员 Charu Aggarwal,旨在表彰他对数据挖掘领域会议和期刊的杰出服务贡献。

个人主页:

Charu Aggarwal 在数据挖掘领域进行了广泛的工作,研究兴趣包括数据流、隐私、不确定数据和社交网络分析。他出版著作 9 部,发表论文 400 余篇,申请或获得专利 80 余项。他曾获得 2015 年 IEEE ICDM 研究贡献奖和 2019 年 ACM SIGKDD 创新奖,这是数据挖掘领域最具影响力的两个奖项。他还是 W. Wallace McDowell 奖的获得者,这是 IEEE 在计算机科学领域颁发的最高奖项。

  • 相关阅读
  • 评论列表

发表评论: