mahout-examples-0.8-job.jar包下载

分类:编程辅助 软件版本:官方免费版 大小:36.9M 更新日期:2024年11月6日
本站评级:★★★★☆ 语言:简体中文 授权版本:免费 运行环境:Windows 11,Windows 10,Windows 8,Windows 7

mahout-examples-0.8-job.jar包 官方免费版


mahout-examples-0.8-job.jar包是配置mahout环境所必须的文件包,能够为mahout环境提供更多算法实例,更加便捷的辅助经常用的软件开发,包括分类、过滤等功能,是一份及其重要的文件包。感兴趣的朋友欢迎前来万能驱动网下载体验吧!

mahout-examples-0.8-job.jar包

mahout基本介绍

Mahout是Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。Mahout包含许多实现,包括聚类、分类、推荐过滤、频繁子项挖掘。此外,通过应用于 Apache Hadoop 库,Mahout 可以有效地扩展到云中。

mahout主要特性

虽然在开源领域中相对较为年轻,但 Mahout 已经提供了大量功能,特别是在集群和 CF 方面。Mahout 的主要特性包括:

Taste CF。Taste 是 Sean Owen 在 SourceForge 上发起的一个针对 CF 的开源项目,并在 2008 年被赠予 Mahout。

一些支持 Map-Reduce 的集群实现包括 k-Means、模糊 k-Means、Canopy、Dirichlet 和 Mean-Shift。

Distributed Naive Bayes 和 Complementary Naive Bayes 分类实现。

针对进化编程的分布式适用性功能。

Matrix 和矢量库。

上述算法的示例。

Mahout环境的安装和配置

在安装运行mahout之前,需要配置好hadoop。我的hadoop是vmware8.0+ubuntu12.04+ubuntu12.04.两台虚拟机搭建的集群。网上资料很多。这里主要介绍mahout的安装和运行。

1、首先在下载mahout0.8.我选择是的mahout-examples-0.8-job.jar。(如果你在windows下运行,可以下载zip)

2、下载完毕,我们拷贝到虚拟机ubuntu系统桌面上中,然后把它拷贝到本地目录下cd Desktop/cp mahout-examples-0.8-job.jar/home/sun/(把mahout安装包拷贝到用户sun的目录下)

然后解压 tar zxvf mahout-examples-0.8-job.jar。

解压之后 ls -l 。可以看到解压之后的文件

如果想修改文件名可以应用于mv。google 百度之...

3、配置文件

找到etc/profile 进行编辑。

sudo gedit /etc/profile

提示你输入密码,输入密码之后就进入了profile文件里面,在最下面可以看到

修改完毕之后,一定要运行source /etc/profile命令,使其生效。

4、在mahout安装目录下的bin文件内找到mahot 文件

比如这个路径:/home/sun/mahout-examples-0.8-job.jar/bin,在mahout文件里添加hadoop路径,必须要添加的,否则运行出错。打开之后,在#!/bin/bash的下面添加hadoop的安装路径和配置路径  (不要直接复制粘贴,请参照你的安装路径)

#    HADOOP_HOME=/home/sun/hadoop-2.2.0

#    HADOOP_CONF_DIR=$HADOOP_HOME/conf

添加这两行,保存退出!

5、安装完毕。下面我们可以测试是否安装成功。

退回根目录下,运行mahout。如实看到下面两行则表示成功。等待片刻(时间有点长,大概1分钟左右),会列出所包含有的算法。

6、启动hadoop-- 。 ./sbin/start-dfs.sh和./sbin/start-yarn.sh。

运行jps.可以看到

6331 jar

7555 SecondaryNameNode

8308 RunJar

7288 NameNode

5045 FsShell

2906 RunJar

8402 Jps

4733 RunJar

表示已经成功!!!

7、接下来就是测试阶段了。

下载测试文件synthetic_control.data,并把这个文件放在$MAHOUT_HOME目录下。(这个好像是必须,我放到其他目录下,运行时会出错!!!不知why)

然后把synthetic_control.data拷贝到hdfs文件系统下面。新建一个testdata(名字必须为testdata).

hdfs dfs -mkdir testdata

然后拷贝

hdfs dfs -put $MAHOUT_HOME/synthetic_control.data testdata/

我们只用kmeans算法。输入例子为hadoop jar /home/hadoop/mahout-distribution-0.8/mahout-examples-0.8-job.jar org.apache.mahout.clustering.syntheticcontrol.kmeans.Job

然后就开始运行了。需要一段时间。因为内容比较多。

版权声明:mahout-examples-0.8-job.jar包所展示的资源内容均来自于第三方用户上传分享,您所下载的资源内容仅供个人学习交流使用,严禁用于商业用途,软件的著作权归原作者所有,如果有侵犯您的权利,请来信告知,我们将及时撤销。


软件下载信息清单:


软件名称 发布日期 文件大小 下载文件名
mahout-examples-0.8-job.jar包安装包 2024年11月6日 36.9M mahoutexamples_qudong9.com.zip
下载地址:
相关推荐: 驱动大全 / 软件下载

软件评论

昵称*

手机*

网址

驱动总数
22526+
文章总数
3520+
评论条数
265+
运行天数
300+