『字节青训营-4th-大数据』L19:用户数据分析理论与最佳实践
相关链接
🎶 学员手册:【大数据专场 学习资料七】第四届字节跳动青训营 - 掘金
P1:基础篇


为什么要做用户数据分析

数据分析的各个环节
数据分析全景图

指标体系和指标分级

手游业务指标体系示意

口径:你怎么算出来的
搭建指标体系的价值

数据分析的各个环节
埋点简介


常见的分析工具




- 维度:分组项(日期和操作系统),指标:设备去重数
- 聚和,最大最小…
- 可以,但一般会先划分

数据可视化


选择合适的



数据分析的流程和案例
分析流程


案例
获取


激活

思考各个环节,哪些是要重点改进的地方
留存

收入

可以得出结论,这个游戏就是靠头部用户来维持运营的,来指导产品经营
数据分析常见的问题

总结&思考


P2:进阶篇

机器学习概览
为什么要机器学习

什么是机器学习

例:垃圾邮件过滤程序
开发者自己从现有的样本提取特性信息,对于新的样本又要手动增加过滤规则
使用机器学习,自动总结、添加规律
机器学习算法有哪些

机器学习的挑战有哪些

特征工程
概述

流程


- 数据理解
- 结构化/非结构化
- 定量/定性
- 数据预处理
- 衡量数据质量
- 准确性
- 完整性
- 一致性
- 时效性
- 可信性
- 解释性
- 主要步骤
- 数据清洗
- 缺失值
- 异常值
- 噪声
- 数据集成
- 实体识别
- 冗余
- 数据值冲突
- 数据规约
- 维度规约
- 维度变换
- 数据交换
- 规范化
- 离散化
- 稀疏化
- 数据清洗
- 衡量数据质量
- 特征构造
- 聚合
- 转换
- 特征选择
- Filter 方法(过滤式)
- Wrapper方法(封装式)
- Embedded方法(嵌入式)
(这些在学习资料里有很详细的说明)
Embedding 概览

Embedding 产生过程


Embedding 意义作用

Embedding 应用场景

聚类算法
概览简介



指标波动

K-means

聚类画像分析
概览简介

流程

分析过程






左:北极星


应用场景

评论
GiscusTwikoo