博鱼·(boyu)体育官方网站-Unique Platform

数据转换的主要内容包括哪一些?

新闻来源:博鱼·boyu体育公众号 发布时间:2022-11-15 17:23:56

  数据转换是将数据从一种表示形式转换为另一种表示形式的过程。数据转换的常见内容包括:数据类型转换、数据语义转换、数据值域转换、数据粒度转换、表/数据拆分、行列转换等。下面就由博鱼·boyu体育来为你详细的介绍一下吧!


数据转换


  1、数据类型转换


  当数据来自不同的数据源时,不同类型数据源类型的不兼容性可能会导致系统报告错误。此时,需要将不同数据源的数据类型视为兼容的数据类型。


  2、数据语义转换


  基于第三范式的传统数据仓库可能有维度表、事实表等。此时,在事实表中,许多字段需要与维度表相结合才能进行语义分析。例如,如果字段M的业务意义是浏览器类型,则其值分为1/2/3/4/5。如果这五个数字没有转换,就很难理解为商业语言,更不用说未来的解释和应用了。


  3、数据粒度转换


  业务系统通常存储详细的数据,有些系统甚至存储基于时间戳的数据。数据仓库中的数据用于分析,不需要非常详细的数据。一般来说,业务系统数据将根据数据仓库中的不同粒度要求进行聚合。


  4、表/数据分割


  有些字段可以存储多中数据信息,如时间戳包含年份、月、日、小时、分、二等信息,有些规则需要拆分部分或全部时间属性,以满足多粒度数据聚合的需要。同样,表中的多个字段也可能被拆分。


  5、行列转换


  在某些情况下,表中的行列数据需要转换(也称为转移),例如在计算协同过滤之前,user和term它们之间的关系相互排列,可以相互转换,可以用来满足基于项目和用户相似性的推荐计算。


  6、数据离散化


  将连续值的属性分为几个范围,以帮助减少连续值的数量。例如,对于收入字段,为了便于统计,根据业务经验可分为几个不同的范围:0~3万、3001~5000、5001~10000、10001~30000、大于300000,或在此基础上分别使用100000、2、3、4、5来表示。


  以上就是数据转换的主要内容介绍了。数据转换一定要注意,不能不顾一切的进行转换,因为,有时候转换会严重扭曲数据本身的内涵。


线

咨询电话:

400-860-5558

预约演示:
免费试用:

·请填写表单,我们将第一时间与您取得联系

有什么可担心的?申请“免费试用”不就行了!

填写下方表单

*
*
*
*
*
*