向阳老师,您好! 我是同济大学生物信息专业的学生xxx,已入选了电院的夏令营,想来读您的研究生! 我本科前五学期绩点4.52/5,专业排名第二名,英语六级632分。在本科期间,与计算机相关的课程(大学计算机A,C/C++程序设计,数据库技术基础,数据库与数据仓库技术等课程)我均拿到了优秀的成绩。我在全球在线教育平台Coursera上报名并完成了多项与机器学习相关的课程,包括:机器学习(Stanford University),Deep Learning(Stanford University) 系列课程中的Sequence Models, Improving Deep Neural Networks: Hyperparameter tuning, Regularization and Optimization等课程。 在大三这一学年里,我先后参加了两个数据挖掘领域的比赛。第一个比赛是在全球著名数据科学平台Kaggle上举办的Talkingdata AdTracking Fraud Detection比赛,通过长达两个月的不断尝试和探索,我参与的团队最终荣获了银牌,排名为24/3967,位列前1%。这是一个利用结构化数据进行分类预测的问题,我们团队先后尝试了近上百个特征,力求在特征工程方面做到完善。同时,我们还尝试了各类模型,包括lightgbm、xgboost等集成树模型以及因子分解机模型(Factorization Machine)等。附件中包含了我所设计的特征工程和lightgbm代码文件。 第二个参加的比赛是由马上消费金融股份有限公司举办的马上AI全球挑战者大赛中的对话意图识别比赛,这是一个NLP领域的分类预测问题。我们的创新点在于:一、考虑到对话的连续性,提取之前对话信息作为特征一起输入当前语句意图分析的模型中。二、在对时序特征压缩的过程中,我们采用了各种池化操作和attention方法以获得最佳的效果。我们主要采用的模型为TextRNN(Bi-GRU、Bi-LSTM)以及RCNN两大类模型。多层注释模型(Hierarchical Attention Network)表现并不突出,可能由于其需要对文本进行分句,因而更加适用于长文本。附件中包含了我所负责的模型代码和整体方案的介绍。 为了积累更多的项目经验,我在长江时代众创空间有限公司(长江众创)进行了为期3个月的实习,担任大数据分析助理一职。体验到了从数据采集,数据清洗,数据标注,数据建模,预测,评估,再改进等一系列的流程,提升了我独立完成一个完整项目的能力。 我对NLP领域以及深度学习方面的问题十分感兴趣,询问了在您实验室学习的师兄之后得知您的研究方向也是NLP领域,所以我非常希望能够来读您的研究生!谢谢老师在百忙之中抽空阅读我的邮件! 本文来源:https://www.wddqw.com/doc/02793d630342a8956bec0975f46527d3240ca6be.html