大数据分析技术是指改进已有的数据挖掘和机器学习技术,开发新型的数据网络挖掘、特异群组挖掘、图挖掘等数据挖掘技术,突破大数据融合技术,以及面向领域的大数据挖掘技术。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含的、潜在有用的信息和知识。
数据挖掘涉及的技术方法很多,根据挖掘任务可分为分类或预测模型发现、数据总结、聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、异常和趋势发现等方法。根据挖掘对象可分为关系数据库、面向对象数据库、空间数据库、时态数据库、文本数据源、多媒体数据库、异质数据库、遗产数据库以及环球网 Web。
从挖掘任务和挖掘方法的角度,需要重点突破以下几个方面:
1. 可视化分析。数据可视化是最基本的功能,可以让数据自己"说话",让用户直观地感受到结果。
2. 数据挖掘算法。数据挖掘使用的算法要能够应对大数据量,同时还具有很高的处理速度。
3. 预测性分析。预测性分析可以让分析师根据可视化分析和数据挖掘的结果做出前瞻性判断。
4. 语义引擎。语义引擎需要涉及足够的人工智能,从而可以从数据中主动地提取信息。
5. 数据质量和数据管理。通过标准化流程和机器对数据进行处理可以确保获得预设质量的分析结果。
FAQs:
Q: 什么是大数据分析技术?
A: 大数据分析技术是指改进已有的数据挖掘和机器学习技术,开发新型的数据网络挖掘、特异群组挖掘、图挖掘等数据挖掘技术,突破大数据融合技术,以及面向领域的大数据挖掘技术。
Q: 数据挖掘的主要技术方法有哪些?
A: 根据挖掘任务,数据挖掘技术方法包括分类或预测模型发现、数据总结、聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、异常和趋势发现等。根据挖掘对象,可分为关系数据库、面向对象数据库、空间数据库、时态数据库、文本数据源、多媒体数据库等。
Q: 大数据分析技术需要重点突破哪些方面?
A: 大数据分析技术需要重点突破可视化分析、数据挖掘算法、预测性分析、语义引擎,以及数据质量和数据管理等方面。