P128

spss教程中文完整版 文档

中文完整版统计要与大量的数据打交道,涉及繁杂的计算和图表绘制。现代的数据分析工作如果离开统计软件几乎是无法正常开展。在准确理解和掌握了各种统计方法原理之后,再来掌握几种统计分析软件的实际操作,是十分必要的。

doctor007 2018-04-02   156   0
P29

  数据挖掘算法以及其实现 文档

基于线性回归模型拟合一个班学生的学习成绩,建立预测模型。数据可由自己建立100个学生的学习成绩。

maoying 2017-04-26   59   0
P9

  数据挖掘最常见的十种方法 文档

下面介绍十种数据挖掘(Data Mining)的分析方法,以便于大家对模型的初步了解,这些都是日常挖掘中经常遇到的算法,希望对大家有用!(甚至有数据挖掘公司,用其中的一种算法就能独步天下)

maoying 2017-04-26   46   0
P20

  kettle 基础整理 文档

Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。

junb_chen 2017-04-23   56   0
数据挖掘   培训   HTTP   SQL   XML  
P1

基于云计算的数据挖掘平台架构及其关键技术研究 (1) 文档

随着科学技术水平的提高,新型的云计算技术已经逐渐的被运用到数据挖掘之中。云计算和传统的数据挖掘系统有着很大的优越性,云计算技术具有处理大量数据的能力,具有为更多的社会群体服务的性能,而且它的成本低廉,这些都超越了传统的技术。本文着重阐述了云计算和数据挖掘的一些概念,以及对云计算的平台架构和关键技术进行了研究。

dszhao 2017-04-05   50   0
P31

  pentaho61教学文件 文档

chiangandy 2017-04-01   53   0
数据挖掘   教学   手册   HTTP   Go  
P4

【数据挖掘】数据挖掘模型的9条经验总结 文档

数据挖掘是利用业务知识从数据中发现和解释知识(或称为模式)的过程,这种知识是以自然或者人工形式创造的新知识

aowushuang 2017-03-07   2780   0
P6

【数据挖掘】聚类算法总结 文档

层次法(Hierarchicalmethods)先计算样本之间的距离。每次将距离最近的点合并到同一个类。然后,再计算类与 类之间的距离,将距离最近的类合并为一个大类。不停的合并,直到合成了一个类。其中类与类的距离的计算方法有:最短距离法,最长距离法,中间距离法,类平均法等。比如最短距离法,将类与类的距离定义为类与类之间样本的最短距离。

aowushuang 2017-03-07   44   0
P6

  etl构建数据仓库五步法 文档

在数据仓库构建中,ETL贯穿于项目始终,它是整个数据仓库的生命线,包括了从数据清洗,整合,到转换,加载等的各个过程,如果说数据仓库是一座大厦,那么ETL就是大厦的根基,ETL抽取整合数据的好坏直接影响到最终的结果展现。所以ETL在整个数据仓库项目中起着十分关键的作用,必须摆到十分重要的位置。

opengzmaq 2017-03-03   39   0
P16

  hive1.2.1安装部署说明书 文档

shenxxPH 2016-12-26   29   0
数据挖掘   x86   SQL  
P9

  kettle规范文档 文档

ETL的开发目前使用IBM的Datastage Designer工具,在开发人员的客户机上这客户端工具进行开发,不允许使用远程登录到服务器的方法进行开发,ETL的开发原则涉及很多方面,本文档根据DataStage的对象的分类,从大到小分Project、Job、Stage等几块来描述:

snowyon 2016-11-21   62   0
P3

  elt 之 kettle 开发规范 文档

本ETL流程规范试图建立一个通用的ETL流程开发规范,针对不同项目组的实际情况,可自行进行逐步的完善和修改。

snowyon 2016-11-21   64   0
P2

  数组 文档

【数组】数组是同一数据类型的一组值数组属于引用类型,因此存储在堆内存中数组元素初始化或给数组元素赋值都可以在声明数组时或在程序的后面阶段中进行定义-数组定义时[]必须接在类型后面,不能接在数组名后面。

1994_ 2016-10-07   2331   0
P314

sas 操作入门 文档

SAS 是处理数据强有力的统计软件,SASV8 版是 SAS 的最新版本,界面友善,操作方便.编写<<SAS 操作入门>>的目的为了帮助初次接触 SAS 软件者,减轻他们使用该软件的困难,<<SAS 操作入门>>包括了常见数据处理方法,指导人们处理数据时编相应 SAS 程序或调用SAS 菜单系统完成处理工作. <<SAS 操作入门>>用 Word 编写存于光盘,使用者处理数据时只要很方便地将<<SAS 操作入门>>中相应例子的程序里的数据改成自己的数据,再粘贴到SAS 的编辑窗口运行即可;或者按<<SAS 操作入门>>中使用菜单系统的每一指示步骤轻松地完成处理任务.

jacky_liu8 2016-09-21   65   0
P189

datastage学习版文档v0.67 文档

数据中心(数据仓库)中的数据来自于多种业务数据源,这些数据源可 能是不同硬件平台上,使用不同的操作系统,数据模型也相差很远,因而数 据以不同的方式存在不同的数据库中。如何获取并向数据中心(数据仓库) 加载这些数据量大、种类多的数据,已成为建立数据中心(数据仓库)所面 临的一个关键问题。针对目前系统的数据来源复杂,而且分析应用尚未成型 的现状,专业的数据抽取、转换和装载工具 DataStage 是最好的选择。

nantongbin 2016-09-09   44   0
P31

实时OLAP数据仓库架构优化演进 文档

* 最初的架构 * Druid简介 * Druid和其他OLAP的对比 * 使用Druid以后的架构

码头工人 2016-09-09   64   0
P235

数据仓库 文档

信息系统领域是一个“不成熟”的领域。 “不成熟”这个词通常具有消极的含义,因而公开使用这个词不得不多加小心。但是从历史的观点来看的确如此。如果我们将信息处理的历史与其他技术领域的历史进行比较的话,就没有争议了。我们知道古埃及的象形文字主要是当时的帐房先生用来表示所欠法老谷子的多少。当漫步在罗马市区,我们就置身于两千多年前土木工程师所设计的街道与建筑物之间。同样,许多其他的领域也可追溯到远古时代。

melodyres 2016-08-12   64   0
P43

  teradata数据仓库简介 文档

Teradata数据库简介Teradata数据仓库事业部华南区Agenda关于TERADATATeradata数据库原理Teradata数据库架构Teradata数据库工作原理Teradata特性Teradata数据仓库构建基本概念常用工具介绍管理的一些约定关于TERADATATeradata最初产生于1976年,由加州理工学院和花旗银行的高科技项目-创建一个能够分析10的12次方bytes数据的系统。

zimeng2008 2016-05-27   65   0
P257

core_data_by_tutorials_v1.1 文档

What is Core Data? You'll hear a variety of answers to this question: It’s a database! It's SQLite! It's not a database! And so forth. Here's the technical answer: Core Data is an object graph management and persistence framework in the OS X and iOS SDKs. That means Core Data can store and retrieve data, but it is not a relational database like MySQL or SQLite. Although it can use SQLite as the data store behind the scenes, you don’t think about Core Data in terms of tables and rows and primary keys.

yi_mi_ 2016-05-11   33   0
1 2 3 4 5 6 7 8 9 10