首页 > 编程知识 正文

简述数据挖掘流程,传统数据挖掘的步骤

时间:2023-05-06 13:09:44 阅读:142179 作者:635

大数据的挖掘步骤是什么? 【导读】数据挖掘的基本步骤。 数据挖掘的过程定义问题,建立数据挖掘库,分析数据,准备数据,建立模型,评价并实施模型。 如果挖掘潜在模式,帮助决策者调整市场战略,降低风险,做出正确的决策,大数据挖掘步骤包括什么?

1、定义问题

在开始知识发现之前,最重要的要求是了解数据和业务问题。 必须明确定义目标。 也就是说,你需要决定你想做什么。 例如,如果想提高电子邮件的利用率,想做的事情可能是“提高用户的利用率”,也可能是“提高一次用户的利用价值”。 为了解决这两个问题而建立的模式几乎完全不同,必须决定。

2、建立数据挖掘库

数据挖掘库的构建包括数据采集、数据描述、选择、数据质量评估和数据清理、集成与集成、元数据的构建、数据挖掘库的加载、数据挖掘库的维护步骤

3、分析数据

分析的目的是找出对预测输出影响最大的数据字段,并决定是否需要定义导出字段。 如果数据集包含数百个字段,则浏览和分析这些数据会很费时间和精力。 为了帮助这些工作,必须选择良好的界面和强大的工具软件。

4、准备数据

创建模型前最后一步的数据准备。 该过程可以分为选择变量、选择记录、创建新变量和转换变量四个部分。

5、建立模型

建立模型是一个反复的过程。 要确定哪种模式最有助于面临的业务问题,必须仔细考虑各种模式。 使用部分数据创建模型,然后使用剩余数据测试并验证此模型。 还有第三个数据集,称为验证集。 这是因为测试集可能会受到模型特性的影响。 在这种情况下,需要另一个数据集来验证模型的正确性。 数据挖掘模型的训练和测试至少需要将数据分为两个部分。 一个用于模型训练,另一个用于模型测试。

6、评价模型

模型完成后,应评价所得结果,并说明模型的价值。 从测试集中获得的精度只对用于创建模型的数据有意义。 在实际应用中,需要进一步了解错误的类型和随之而来的相关费用的多寡。

关于大数据挖掘的步骤,我们分享到了这里。 想学习大数据技术的人,要好好关注,多学习大数据技术,请抓住机会加油。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。