数据收集的类型
—记录、图表或网络,有序序列
—空间、图像和多媒体等。
数据对象
数据集由数据对象组成;数据对象代表一个实体。
示例:
-销售数据库:客户/顾客,商店商品
医学数据库:名患者,治疗
-大学数据库:学生、教授、课程(学生、教授、课程)
也称为样本、实例、实例、数据点、对象、元组等。
数据由属性描述。
属性
属性(也称为维度、特征和变量):数据字段代表一条数据。
物体的特征。
-例如,客户标识、姓名、地址
:型
-名义属性-与名称相关。
-Binary) -属性-是一种特殊的名义属性或布尔属性。
-序数属性-有意义的顺序,但连续值之间的差异未知。
以上三种都是定性的。
-数字)-数量
区间刻度-没有实际零点的等单位刻度,如年份和温度。
比例缩放-带有固定零的数字属性,如重量、高度等。
属性类型
名义属性
-类别、状态等
-头发颜色={赤褐色、黑色、金色、棕色、灰色、红色、白色}
-婚姻状况、职业、身份证号码、邮政编码
二进制属性
-只有2种状态(0和1)的标称属性
-对称二进制):同样重要。
例如性别(性别)
-非对称二进制):并不同样重要。
例如,医学检查中的阴性和阳性(阳性对阴性)
套路:1分配更重要的一方。
序数属性
-值具有有意义的顺序(排序),但连续值之间的大小未知。
-服装尺码号Size={小、中、大}、军衔、军阶