当前位置: 首页 > 新闻公告 > 焦点新闻 > 正文

我院冯翱教授在京东进行技术讲座

2019-08-30

8月6日下午17:00,一场名为 “从词表示到情感分析” 的CDRD-TALK在京东正式开启,主讲人是我院的冯翱博士。

冯翱,理学博士,副教授,研究方向为人工智能、数据挖掘和信息检索。现任我校计算机学院副院长,曾任美国亚马逊(Amazon.com)软件开发工程师和联想成都研究院资深研究员。四川省学术技术带头人后备人选,成都市人才计划入选专家。

    冯博士1995-2001年在清华大学自动化系就读,1999年获得自动化学士学位,2001年获得模式识别与智能系统硕士学位。2001-2008年在美国马萨诸塞大学阿姆斯特分校(University ofMassachusetts Amherst)计算机系就读,从事信息检索模型、话题识别与跟踪(TopicDetection and Tracking)等领域研究,获得计算机科学硕士和博士学位。毕业后先后在美国亚马逊和联想成都研究院任职,主要工作是数据挖掘领域的学术研究和应用开发工作。2015年加入成都信息工程大学,主要进行深度学习、自然语言处理等方面的研究。


本次分享的主题是“从词表示到情感分析”,冯博士主要介绍了自然语言理解的发展历程,通过结合情感分类的例子,讲述了NLP领域预训练的发展史。最早做情感分类采用切词、构建语法树、分类,到现在直接将文本输入到模型中进行训练,减少了中间的损失。预训练的发展从NNLM到XLNet,介绍了各个预训练模型的特点。最后讲述了自己在卷积上做的一些尝试,从词维度的卷积,尝试采用embedding行维度的卷积,并展示了各个实验的效果,对工业界的分类很有借鉴意义。



随着bert与XLNet等大规模暴力模型的产生,NLP的训练已经成为一种VIP专享的过程。对工业界来说,未必是件好事。不同的应用场景需要不同的机器学习模型,无论是小而美的支持向量机、朴素贝叶斯等传统方法,还是采用大规模预训练的复杂深度学习网络,哪个选项更符合我们的需求,还是取决于数据、软硬件资源、性能和效果的平衡。