数据为王

数据为王
关于大数据的那些事儿

机器学习

机器学习,SparkMLLib

机器学习

25 个 Java 机器学习工具和库

阅读(536)评论(0)

本列表总结了25个Java机器学习工具&库:1. Weka集成了数据挖掘工作的机器学习算法。这些算法可以直接应用于一个数据集上或者你可以自己编写代码来调用。Weka包括一系列的工具,如数据预处理、分类、回归、聚类、关联规则以及可视化。2.Massive Online Analysis(MOA)是一个面向数据流挖掘的流行开...

机器学习

Linux下面安装OpenCV3.3.0

阅读(372)评论(0)

最近写了一个J2EE的项目,其中用到了OpenCV的相关内容,所以下载了一个OpenCV库,并且在Windows下面做了开发测试,话不多说,这里直接给下载链接 https://opencv.org/opencv-3-3.html 。在这个链接页面中,可以找到不同平台下的OpenCV库,分别是windows、iOS、安卓以及源码包,如下图:...

机器学习

centos6使用c++11

阅读(126)评论(0)

CentOS 6.4 使用C++11,需要安装 devtools21.下载 repo 到本地wget http://people.centos.org/tru/devtools-2/devtools-2.repo -O /etc/yum.repos.d/devtools-2.repo12.安装yum install devtoolset-2-gcc devt...

机器学习

Spark机器学习API之特征处理(二)

阅读(159)评论(0)

Spark机器学习库中包含了两种实现方式,一种是spark.mllib,这种是基础的API,基于RDDs之上构建,另一种是spark.ml,这种是higher-level API,基于DataFrames之上构建,spark.ml使用起来比较方便和灵活。Spark机器学习中关于特征处理的API主要包含三个方面:特征提取、特征转换与特征选择。本文通过例子介绍和...

机器学习

Spark机器学习API之特征处理(一)

阅读(245)评论(0)

Spark机器学习库中包含了两种实现方式,一种是spark.mllib,这种是基础的API,基于RDDs之上构建,另一种是spark.ml,这种是higher-level API,基于DataFrames之上构建,spark.ml使用起来比较方便和灵活。Spark机器学习中关于特征处理的API主要包含三个方面:特征提取、特征转换与特征选择。本文通过例子介绍和...

机器学习

Spark MLlib之朴素贝叶斯分类算法

阅读(466)评论(0)

分类算法何为分类算法?简单来说,就是将具有某些特性的物体归类对应到一个已知的类别集合中的某个类别上。从数学角度来说,可以做如下定义:已知集合: C={y1,y2,..,yn}C={y1,y2,..,yn} 和 I={x1,x2,..,xm,..}I={x1,x2,..,xm,..} ,确定映射规则 y=f(x...

机器学习

机器学习库SparkMLlib实战

阅读(693)评论(0)

1、MLlib实例1.1 聚类实例1.1.1 算法说明聚类(Cluster analysis)有时也被翻译为簇类,其核心任务是:将一组目标object划分为若干个簇,每个簇之间的object尽可能相似,簇与簇之间的object尽可能相异。聚类算法是机器学习(或者说是数据挖掘更合适)中重要的一部分,除了最为简单的K-Means聚类算法外,比...