# SuccBI课堂练习参考答案
# 简单的数据加工
使用列加工对电影信息表进行数据清洗:
- 将演员列表中的各个演员拆分为多个演员字段,并将演员名称转化为以“·”分割
- 各字段的字段类型正确
- 将影片时长转化为以小时为计量单位
- 影片标题改为小写
- 将租金转为人名币为单位,并过滤掉租金小于1美元的数据
关键步骤:
- 修改【演员id】的字符类型为字符型
- 排除【演员列表】中的空数据,并重命名为【演员】
- 将【演员】根据“,”拆分为多列
- 使用转为计算字段将【影片长度】转为以小时为计量单位
- 将【租金】重命名为【组件(美元)】,并新增字段【租金(人名币)】
- 过滤掉【租金(美元)】小于1的数据
# 复杂的数据加工
使用电影演员表、电影信息表、电影类别表、分类表生成各演员所参演的影片及所属类别的演员信息表:
示例地址:复杂的数据加工 (opens new window)
关键步骤:
- 第1个汇总节点
- 分组字段选择演员ID,类别ID
- 新增一个字段各演员各类别电影,内容为
GROUP_CONCAT([影片标题],', ')
- 第2个关联节点(汇总与分类表、演员表关联),主查询选择汇总
- 列加工节点,新增一个字段类别及电影列表,内容为
CONCAT([类别名称],': ',[各演员各类别电影列表])
- 第2个汇总节点
- 分组字段选择演员ID,演员名称
- 新增一个字段电影信息,内容为
GROUP_CONCAT([类别及电影列表],'; ')
0条评论
评论