余心悦

求职中

目标:数据分析师 - 北上杭

基本信息


  • 余心悦
  • 雅思 8分
  • Tableau Desktop Specialist
  • Google Analytics
  • 亚马逊认证云从业者

技能点


联系方式


教育经历


  • 加州大学戴维斯分校 - 商业数据分析(硕士)

    专业排名:Top 20%

    核心课程:高级统计学,数据库管理,数据可视化,机器学习,大数据分析,数据决策

  • 南京师范大学 - 金融学(本科)

    专业排名:Top 1%, 获国家奖学金

    核心课程:投资学,计量经济学,金融工程学,行为金融学,市场营销学,数学建模

工作经历


  • 旧金山亚洲艺术博物馆-数据分析实习生

      该项目帮助博物馆搭建数据分析体系,提供游客量预测模型与优化方案,支持博物馆达成 30 万年客流目标。

    • 数据收集与维护 :使用Python爬取博物馆内、外部数据,设计并搭建MySQL数据库以储存 13 年间数据。
    • 可视化仪表盘搭建 :使用Tableau搭建日数据仪表盘,为博物馆可视化每日客流量、展览信息等。
    • 游客量预测模型 :使用ARIMA与随机森林,搭建博物馆日游客量预测模型,准确率达 70% 以上。
    • 展览规划建议 :使用ANOVA分析影响展览游客量的关键属性,输出数据分析报告,为博物馆提供年度展览规划。
  • 涌动战略管理咨询公司-战略分析实习生

    • 研究报告 :负责 10 份行业研究报告与竞品分析报告,并负责相应 PPT 绘制。在研究中运用数据分析手段为客户提供额外价值:
      • (木工机械行业客户):使用爬虫获取客户潜在消费者的人口统计信息及评论,使用NLP 情绪分析获得消费者价值取向,绘制用户画像
        (线上教育APP客户):为客户分析其竞争对手在不同应用商店中的表现,用关键词、评论数量对 App 搜索排名进行回归,为客户进驻应用商店提供战略建议。

个人项目


  • 新冠疫情期间基于新闻主题模型的Twitter情绪分析

      该项目通过自然语言处理(主题模型、情绪分析)对美国疫情期间媒体报道主题和大众情绪的变化进行研究。

    • 使用Selenium爬取 1.2 万新闻,130 万 Tweets 进行文本挖掘。
    • 使用MALLET 主题模型,提取 8 个新闻主题,对新冠疫情期间主要新闻事件进行聚类。
    • 使用 BERT 模型,对 Tweets 进行五维情绪倾向分析,准确率达 60%+。
    • 使用Tableau对分析结果进行可视化,产出数据分析报告发表至Medium数据科学之路专栏。
  • 纳斯达克新闻情绪对次日股价的影响研究

      该项目通过爬取三个月内纳斯达克十家公司新闻报道,对其进行情绪分析以研究新闻情绪对次日对应股价的影响。

    • 使用Selenium爬取纳斯达克三个月内十家公司共 5000+ 条新闻,对其中 50% 新闻进行情绪标注。
    • 使用Doc2Vec进行词嵌入,XGBoost预测新闻情绪,准确率达 82%。
    • 搭建回归模型,发现了次日股价受纳斯达克新闻情绪影响最大的时间点。
  • 银行营销活动预测项目

      使用分类器模型分析银行客户的定期存款认购可能性,从而对客户展开针对性营销活动。

    • 使用 Python 对 4w+ 银行客户数据进行分析,总结出 21 列变量之间的关系以及客户定期存款认购情况。
    • 设计多种机器学习模型(逻辑回归、决策树、随机森林)预测目标客户,其中随机森林的敏感度达 85%。
  • 老年储蓄投资新模式探索项目

      通过设计、分发、分析问卷,获得老年人对于储蓄的关注特征,并设计适合老人的投资基金。项目获大学生创新项目二等奖。

    • 设计老年储蓄投资意向调查问卷,并在苏南三城分发。
    • 根据问卷反馈,使用 ANOVA 提取影响老年储蓄意向的特征。
    • 根据老年投资意向,使用马科维茨模型搭构建合老人的投资策略。