一、数据挖掘和 SPSS Modeler 初中级培训

培训对象
对数据挖掘或Modeler感兴趣的使用者和数据分析人员。

培训概要
课程将介绍数据挖掘原理、SPSS Modeler数据挖掘软件的基本操作和环境;学习如何使用SPSS Modeler读取,处理数据。

培训目的
培训人员能够掌握数据挖掘理论和常用的建模技术、掌握机器学习的常见技术,比如神经网络、决策树等,并将其应用到具体业务操作中。

培训大纲

1、数据挖掘简介

      CRISP-DM方法论

2、SPSS Modeler 15.0简介
      SPSS Modeler15.0的C/S架构和界面介绍
      SPSS Modeler可视化程序的使用基础

3、读取数据文件
      SPSS Modeler可以读取的数据格式
      读取文本数据与查看数据、SPSS数据、数据库数据(SDAP)
      SPSS Modeler中的字段类型、字段方向
      保存SPSS Modeler流

4、数据理解---数据质量评估
      数据理解
      缺失值定义
      数据审核节点介绍
      分布图节点----初步理解字符型字段的分
      直方图/统计节点----初步理解数值型字段的分布

5、简单数据整理
      Clem语言简介
      选择节点,过滤节点和导出节点介绍
      自动生成操作节点

6、寻找数据中的关系
      矩阵节点、网络图节点、统计节点、散点图节点、直方图节点

7、SPSS Modeler中的数据建模技术
      神经网络、规则归纳模型、模型比较
      聚类分析、关联规则、序列检测

 

二、数据挖掘和 SPSS Modeler 高级培训

培训对象
对数据挖掘或Modeler感兴趣的使用者和数据分析人员和已经修过基础培训的学员。

培训概要
本课程将介绍数据挖掘原理、SPSS Modeler的高级数据处理技术,学习如何合并和处理文件,样本数据,处理缺失值和时序数据。详细介绍SPSS Modeler的建模技术以及Meta Modeling技术,并学习如何将其应用到具体业务操作中。

培训目的
培训人员能够掌握数据挖掘理论和复杂的建模技术、并将其应用到具体业务操作中。

培训大纲

1、高级数据准备技术

      合并多个数据源数据
       抽取样本,选择和缓存数据
      处理日期数据、时序数据
      文件操作技术
      RFM汇总及RFM分析
      分箱节点
      自动整理数据

2、SPSS Modeler分类技术
      决策树技术、Logistics回归、神经网络

3、SPSS Modeler细分技术
       Kohonen网络/两步聚类/K-means

4、SPSS Modeler关联分析技术
      GRI/Carma/Apriori
      序列节点

5、SPSS Modeler自动建模技术: 自动聚类节点、自动分类节点、自动数值节点

6、SPSS Modeler其他技术

      线性回归、特征选择、Cox回归
      支持向量机(SVM)
      主成分/因子分析
      使用SPSS Syntax

7、SPSS Modeler中的数据建模技术: 评估图、分析节点

8、SPSS Modeler demo演示

 

三、SPSS Statistics初中级实战应用培训

培训对象
SPSS统计分析软件入门使用者,或希望将SPSS使用效果掌握到最好的使用者和希望得到正规培训的自学者。

必要技能:
Windows操作技能

培训目的
培训人员能够掌握相关理论、能使用SPSS进行较为复杂的数据统计分析操作。

培训大纲

1、SPSS软件及统计分析过程方法论简介

2、统计分析过程方法论应用:一个调查研究的实例

3、SPSS for Windows的各个模块简介

4、数据输入与建立

       数据文件获取:Execl和其它各种ASCII文本文件,数据库数据等各种格式数据的读取
       数据文件的建立:变量名、变量标签、值标签、变量类型、缺失值等的处理方式,收集数据时的错误和误差。

5、数据管理与变换:
       数据分段
       衍生变量
       变量重新编码 

6、SPSS统计图表和报表展示:
       饼图、直方图、三维直方图、散点图、条图、线图、茎叶图、箱线图、帕雷托图、Q-Q图、P-P图、控制图等 

7、打印与存储输出

8、高级数据修改

9、文件管理

10、SPSS编程

       基本使用方法
       SPSS编程命令语句

11、实用特性举例

12、枢轴表编辑器的用户化输出

13、集中趋势及离散趋势分析

14、正态检验

15、非参数检验

16、变量间关系描述

17、SPSS交叉表分析过程

       交叉列表的分析对象、解决的问题,应用SPSS实现交叉列表分析 

18、单样本及双样本T检验

19、方差分析(ANOVA)

       多选题变量分析及SPSS实现
       多选题变量的编码形式、分析指标;多选题变量的建立、频数分析、交叉列表分析;多选题变量的探索性分析 

20、如何选择合适的统计学方法

 

四、SPSS Statistics高级实战应用培训

培训对象:
想学习SPSS的高级统计功能,扩展适当统计过程的背景知识的用户,或希望将SPSS使用效果掌握到最好的使用者和希望得到正规培训的自学者。

必要技能
有使用SPSS for Windows的经验, 有一定的统计学基础。

培训目的
培训人员能够掌握相关理论、能使用SPSS软件进行复杂的数据处理。

培训大纲

1、SPSS软件及统计分析过程方法论

2、SPSS的数据描述方法

3、图形的修改编辑 

4、数据正态分布: 

       数据正态分布的重要性
       数据正态检验的SPSS实现

5、假设检验:
       假设检验的基本思想、概念、步骤组间的均值差异:简单情况
       方差齐性检验
       单样本均值检验

6、样本均值检验

7、独立样本及配对样本均值比较

8、方差分析:

       单因数方差分析
       方差分析中的多重比较
       因素水平影响程度的对比设计及检验
       多因素方差分析
       协方差分析简介

9、非参数检验: 
       两个独立样本
       两个相关样本
       K个独立样本
       K个相关样本

10、相关分析:
       变量间的关系
       相关分析基本方法简介
       Person相关系数的计算及检验
       偏相关分析

11、回归分析:
       回归方程的假定条件、分析步骤、常用指标
       一元线性回归分析实例
       回归的诊断、优化
       回归结果的解释

12、判别分析:
       判别分析的基本目标
       常用方法简介

13、聚类分析:
       非系统聚类简介、方法、实例
       系统聚类方法简介、方法、实例

14、数据降维技术:
       主成份分析 
       因子分析 

15、讨论与总结