# SuccBI课堂练习参考答案

# 简单的数据加工

使用列加工电影信息表进行数据清洗:

  1. 将演员列表中的各个演员拆分为多个演员字段,并将演员名称转化为以“·”分割
  2. 各字段的字段类型正确
  3. 将影片时长转化为以小时为计量单位
  4. 影片标题改为小写
  5. 将租金转为人名币为单位,并过滤掉租金小于1美元的数据

简单的数据加工

示例地址:列加工 (opens new window)

关键步骤:

  1. 修改【演员id】的字符类型为字符型
  2. 排除【演员列表】中的空数据,并重命名为【演员】
  3. 将【演员】根据“,”拆分为多列
  4. 使用转为计算字段将【影片长度】转为以小时为计量单位
  5. 将【租金】重命名为【组件(美元)】,并新增字段【租金(人名币)】
  6. 过滤掉【租金(美元)】小于1的数据

# 复杂的数据加工

使用电影演员表电影信息表电影类别表分类表生成各演员所参演的影片及所属类别的演员信息表

复杂的数据加工

示例地址:复杂的数据加工 (opens new window)

关键步骤:

  1. 第1个汇总节点
    1. 分组字段选择演员ID类别ID
    2. 新增一个字段各演员各类别电影,内容为GROUP_CONCAT([影片标题],', ')
  2. 第2个关联节点(汇总分类表演员表关联),主查询选择汇总
  3. 列加工节点,新增一个字段类别及电影列表,内容为CONCAT([类别名称],': ',[各演员各类别电影列表])
  4. 第2个汇总节点
    1. 分组字段选择演员ID演员名称
    2. 新增一个字段电影信息,内容为GROUP_CONCAT([类别及电影列表],'; ')
是否有帮助?
0条评论
评论