论坛风格切换
正版合作和侵权请联系 sd173@foxmail.com
 
  • 帖子
  • 日志
  • 用户
  • 版块
  • 群组
帖子
购买邀请后未收到邀请联系sdbeta@qq.com
  • 2807阅读
  • 4回复

[教程资料]SPSS Clementine 数据挖掘入门 [复制链接]

上一主题 下一主题
离线120746663
 

发帖
358
今日发帖
最后登录
2015-06-14
只看楼主 倒序阅读 使用道具 楼主  发表于: 2012-06-05 09:53:02
SPSS Clementine 数据挖掘入门

  了解SPSS Clementine的基本应用后,再对比微软的SSAS,各自的优缺点就非常明显了。微软的SSAS是Service Oriented的数据挖掘工具,微软联合SAS、Hyperion等公司定义了用于数据挖掘的web服务标准——XMLA,微软还提供OLE DB for DM接口和MDX。所以SSAS的优势是管理、部署、开发、应用耦合方便。
  但SQL Server 2005使用Visual Studio 2005作为客户端开发工具,Visual Studio的SSAS项目只能作为模型设计和部署工具而已,根本不能独立实现完整的Crisp-DM流程。尽管MS Excel也可以作为SSAS的客户端实现数据挖掘,不过Excel显然不是为专业数据挖掘人员设计的。
  PS:既然说到Visual Studio,我又忍不住要发牢骚。大家都知道Visual Studio Team System是一套非常棒的团队开发工具,它为团队中不同的角色提供不同的开发模板,并且还有一个服务端组件,通过这套工具实现了团队协作、项目管理、版本控制等功能。SQL Server 2005相比2000的变化之一就是将开发客户端整合到了Visual Studio中,但是这种整合做得并不彻底。比如说,使用SSIS开发是往往要一个人完成一个独立的包,比起DataStage基于角色提供了四种客户端,VS很难实现元数据、项目管理、并行开发……;现在对比Clementine也是,Clementine最吸引人的地方就是其提供了强大的客户端。当然,Visual Studio本身是很好的工具,只不过是微软没有好好利用而已,期望未来的SQL Server 2K8和Visual Studio 2K8能进一步改进。


  所以我们不由得想到如果能在spss 中文版中实现Crisp-DM过程,但是将模型部署到SSAS就好了。
  首先OLE DB for DM包括了Model_PMML结构行集,可以使用DMX语句“Create Mining Model <Model Name> From PMML <xml string>”将SPSS Clementine导出的PMML模型加入SSAS。
  如果我记得没错的话,SQL Server 2005 最初发表版本中Analysis Services是PMML 2.1标准,而Clementine 11是PMML 3.1的,两者的兼容性不知怎样,我试着将一个PMML文件加入SSAS,结果提示错误。


  另外,在SPSS Clementine中可以整合SSAS,通过使用SSAS的算法,将模型部署到SSAS。具体的做法是:


  在SSAS实例中修改两个属性值。
  在Clementine菜单栏选Tools -> Helper Applications。


  然后启用SSAS整合,需要选择SSAS数据库和SQL Server RMDBS,RMDBS是用来存储临时数据的,如果在Clementine的流中使用了SAS数据源,但SSAS不支持SAS数据文件,那么Clementine需要将数据源存入临时数据表中以便SSAS能够使用。


  启用整合后,就可以在工具栏中看到多出了一类Datebase Modeling组件,这些都是SSAS的数据挖掘算法,接下来的就不用说了……


  可惜的是SSAS企业版中就带有9中算法,另外还有大量第三方的插件,但Clementine 11.0中只提供了7种SSAS挖掘模型。
离线guanyongfeng

发帖
906
今日发帖
最后登录
2024-11-13
只看该作者 沙发  发表于: 2020-12-16 14:19:16
好东西确实事好东西~!~!~
离线fpaoli

发帖
159
今日发帖
最后登录
2024-11-23
只看该作者 板凳  发表于: 2021-02-20 07:55:18
挺好了,正需要这个,谢谢!
离线luogang1221

发帖
204
今日发帖
最后登录
2024-04-14
只看该作者 地板  发表于: 2021-04-27 17:35:37
感谢分享,虽然看不懂这是干嘛的
离线power3

发帖
1469
今日发帖
最后登录
2024-11-22
只看该作者 地下室  发表于: 2021-08-09 10:45:42
好资料,先收蒧下,谢谢分享。