随着云计算、大数据、物联网、移动互联、人工智能技术的蓬勃发展,我们已经正式进入DT 时代,越来越多的基于数据的应用正在彻底的改变着我们的生活,也在改变着商业世界。越来越多的企业都已经认识到,数据是企业核心的战略资产,数据分析是挖掘数据价值的有效手段,是企业数字化转型成败的关键。然而,我们也很遗憾的看到,数据分析在企业中的应用并不容乐观,企业的数字化转型,仍然存在较大的困局。究其原因,除了数据基础条件差、数据文化意识低等因素外,主要存在数据分析的门槛较高、数据分析的工具碎片化、分析成果应用率较低等问题。
泰迪智能科技企业数据挖掘平台是由广东泰迪智能科技股份有限公司自主研发,面向人工智能大数据挖掘项目的工具。平台使用 JAVA 语言开发,采用 B/S 结构,用户不需要下载客户端,可通过浏览器进行访问。平台提供了基于 R、Python、Spark、PaddlePaddle 引擎的大数据分析功能。平台支持工作流,用户可在没有编程语言基础的情况下,通过拖拽的方式进行操作,以流程化的方式将数据输入输出、统计分析,数据预处理、分析与建模等环节进行连接,从而达成大数据分析的目的。
它是一款通用的、企业级、智能化的数据分析模型构建与数据应用场景设计工具,能够一体化地完成数据集成、模型构建、模型发布,为数据分析、探索、服务流程提供支撑,提供完整的数据探索、多数据源接入、特征处理、模型搭建、智能分析、服务部署以及平台管理等功能。 打通了“从数据到模型,从模型到场景化应用”的数据价值应用过程,打造面向全用户全场景的人工智能分析与应用构建平台,助力企业 AI 时代数据化运营。
一、企业数据挖掘平台价值
1、对于最终用户
为用户提供一体化、自助式的人工智能 AI 计算平台,降低企业级数据分析门槛,帮助企业充分利用数据价值,促进企业的数据文化建设,推动企业数据驱动转型。同时也为用户提供模型管理、模型共享的完美解决方案。
2、对于 IT 解决方案供应商
为 IT 解决方案供应商提供完善的数据应用开发工具与灵活的集成机制,大幅度降低数据应用开发的难度与复杂度,适应灵活多变的业务需求,降低 IT 企业的研发成本。
二、企业数据挖掘平台产品构成
产品主要由首页模块,数据源模块、算法组件模块、工程模块、个人组件模块,模型模块,任务模块、接口拓展模块构成。
三、企业数据挖掘平台产品特色
1、丰富的数据源支持
人工智能 AI 计算平台支持多种数据源:Hive、HBase、HDFS(json、parquet、ORC 以及 text等数据格式)、ElasticSearch、Redis、Kafka、本地文件(csv、json、image 等数据格式)、JDBC(MySQL、DB2、Oracle、Sqlserver 等)数据集导入。支持图片集导入(png、jpg、bmp 格式,压缩为 zip 或tar.gz 格式)数据导入。
2、协同共享机制
平台内置完善的角色、资源、部门机构管理体系,以及完善的空间、应用、成果的共享管理机制,能够帮助政企打破部门壁垒,构建业务开发、数据分析、决策支持的组织链条,让分析过程高效协同,让分析结果灵活共享。
3、个性化扩展
平台可自定义算法节点,允许用户编制 R\Python\pySpark 脚本实现个性化的算法脚本。基于平台灵活的扩展机制,增强平台的业务适应能力,充分满足企业级用户的个性化需求。
4、 API 二次开发
平台开放丰富的 API 接口,满足用户对系统功能层面及分析成果层面的接口调用需求。平台提供产品各功能模块的 API 二次开发接口,满足产品的二次开发需求,同时支持多样化、开放的合作模式,包括但不限于定制化开发、提供以平台为基础的信访、电力、广电、交通运输等行业解决方案等。
5、 微服务架构
平台基于平台框架使用 JAVA 语言开发,采用分布式架构,基于 Spring Cloud 构建,提供稳定可靠的服务调用、服务治理、服务降级能力。使用 Nacos 对服务进行管理,快速实现动态服务发现、服务配置及服务注册:一是降低二次开发门槛,可以让开发人员无需关注产品本身人工智能 AI 计算平台白皮书复杂的开发逻辑,通过独立服务方式,拓展自己的功能模块。二是统一用户与权限体系,平台
将用户、授权、认证等相关内容形成独立公共的微服务模块,降低系统集成难度。三是带来更好的扩展性与弹性高可用,每个微服务可根据业务实际增长情况来进行快速扩展、独立进行服务升级、更新,同时服务具备资源的隔离性,以保障系统整体稳定性。四是基于微服务架构设计风格,与 Docker、k8s 能够很方便地结合。
6、权限集成
平台支持 Apereo CAS 服务器集成,快速实现系统登录(个人版),OAuth2 第三方登录,如:微信、QQ、支付宝、等等(专业版)。支持用户权限区分,默认系统管理员权限、普通用户权限,可自定义权限。
四、典型案例
1、中国电科院:电力大数据分析平台
电力大数据平台拥有数据采集、数据存储、数据加工处理、数据分析挖掘、数据管控、平台管控、安装部署等功能,但是平台在组件融合、权限控制、对外接口封装等方面还存在不足,不能够满足企业未来不同类型的大数据应用。
运用大数据挖掘算法完善数据分析挖掘模块,实现对 Mahout、Rhadoop 等分析挖掘工具中的算法封装,通过企业数据挖掘应用流程化的模式,使得数据应用开发速度更快,成本更低,让企业的大数据挖掘应用更简单。
2、石油勘探开发研究院:油气行业数据挖掘系统
基于石油勘探大数据平台,运用大数据分析挖掘相关技术,构建适合多种业务场景数据特点的挖掘分析模型,提供交互式、可扩展的数据分析算法库,能够面向石油勘探业务,深入发掘隐藏在石油勘探数据中的规律性与关联性,提升数据深度应用的支撑能力。
3、珠江数码:大数据营销推荐应用平台
构建有线电视用户标签库 3000 多个,对不同的有户实现多维度画像,通过分类、聚类挖掘等模型,从不同角度实现用户细分。使同一群体用户具备某些共同特征,如“家中有儿童”等,从而为后续的精准推荐提供基础,如付费频道、点播的专区服务或片子、回看与应用。
详细了解企业数据挖掘平台,可到泰迪智能科技官网咨询了解更多~