余心悦
求职中
目标:数据分析师 - 北上杭
基本信息
- 余心悦
- 雅思 8分
- Tableau Desktop Specialist
- Google Analytics
- 亚马逊认证云从业者
技能点
联系方式
教育经历
-
加州大学戴维斯分校 - 商业数据分析(硕士)
专业排名:Top 20%
核心课程:高级统计学,数据库管理,数据可视化,机器学习,大数据分析,数据决策
-
南京师范大学 - 金融学(本科)
专业排名:Top 1%, 获国家奖学金
核心课程:投资学,计量经济学,金融工程学,行为金融学,市场营销学,数学建模
工作经历
-
旧金山亚洲艺术博物馆-数据分析实习生
- 数据收集与维护 :使用Python爬取博物馆内、外部数据,设计并搭建MySQL数据库以储存 13 年间数据。
- 可视化仪表盘搭建 :使用Tableau搭建日数据仪表盘,为博物馆可视化每日客流量、展览信息等。
- 游客量预测模型 :使用ARIMA与随机森林,搭建博物馆日游客量预测模型,准确率达 70% 以上。
- 展览规划建议 :使用ANOVA分析影响展览游客量的关键属性,输出数据分析报告,为博物馆提供年度展览规划。
该项目帮助博物馆搭建数据分析体系,提供游客量预测模型与优化方案,支持博物馆达成 30 万年客流目标。
-
涌动战略管理咨询公司-战略分析实习生
- 研究报告 :负责 10 份行业研究报告与竞品分析报告,并负责相应 PPT 绘制。在研究中运用数据分析手段为客户提供额外价值:
-
(木工机械行业客户):使用爬虫获取客户潜在消费者的人口统计信息及评论,使用NLP 情绪分析获得消费者价值取向,绘制用户画像。
(线上教育APP客户):为客户分析其竞争对手在不同应用商店中的表现,用关键词、评论数量对 App 搜索排名进行回归,为客户进驻应用商店提供战略建议。
个人项目
-
新冠疫情期间基于新闻主题模型的Twitter情绪分析
- 使用Selenium爬取 1.2 万新闻,130 万 Tweets 进行文本挖掘。
- 使用MALLET 主题模型,提取 8 个新闻主题,对新冠疫情期间主要新闻事件进行聚类。
- 使用 BERT 模型,对 Tweets 进行五维情绪倾向分析,准确率达 60%+。
- 使用Tableau对分析结果进行可视化,产出数据分析报告发表至Medium数据科学之路专栏。
该项目通过自然语言处理(主题模型、情绪分析)对美国疫情期间媒体报道主题和大众情绪的变化进行研究。
-
纳斯达克新闻情绪对次日股价的影响研究
- 使用Selenium爬取纳斯达克三个月内十家公司共 5000+ 条新闻,对其中 50% 新闻进行情绪标注。
- 使用Doc2Vec进行词嵌入,XGBoost预测新闻情绪,准确率达 82%。
- 搭建回归模型,发现了次日股价受纳斯达克新闻情绪影响最大的时间点。
该项目通过爬取三个月内纳斯达克十家公司新闻报道,对其进行情绪分析以研究新闻情绪对次日对应股价的影响。
-
银行营销活动预测项目
- 使用 Python 对 4w+ 银行客户数据进行分析,总结出 21 列变量之间的关系以及客户定期存款认购情况。
- 设计多种机器学习模型(逻辑回归、决策树、随机森林)预测目标客户,其中随机森林的敏感度达 85%。
使用分类器模型分析银行客户的定期存款认购可能性,从而对客户展开针对性营销活动。
-
老年储蓄投资新模式探索项目
- 设计老年储蓄投资意向调查问卷,并在苏南三城分发。
- 根据问卷反馈,使用 ANOVA 提取影响老年储蓄意向的特征。
- 根据老年投资意向,使用马科维茨模型搭构建合老人的投资策略。
通过设计、分发、分析问卷,获得老年人对于储蓄的关注特征,并设计适合老人的投资基金。项目获大学生创新项目二等奖。