
使用方便
可用于 Java、Scala、Python 和 R。
MLlib 适合Spark的 API,并与 Python(从 Spark 0.9 开始)和 R 库(从 Spark 1.5 开始)中的NumPy互操作 。您可以使用任何 Hadoop 数据源(例如 HDFS、HBase 或本地文件),从而轻松插入 Hadoop 工作流。
表现
高质量算法,比 MapReduce 快 100 倍。
Spark 擅长迭代计算,使 MLlib 能够快速运行。同时,我们关心算法性能:MLlib 包含利用迭代的高质量算法,并且可以产生比有时在 MapReduce 上使用的单遍近似更好的结果。
无处不在
Spark 在 Hadoop、Apache Mesos、Kubernetes 上独立运行,或在云中针对不同的数据源运行。
您可以使用其独立集群模式在EC2、Hadoop YARN、Mesos或Kubernetes上运行 Spark 。访问HDFS、 Apache Cassandra、 Apache HBase、 Apache Hive和数百个其他数据源 中的数据。
数据评估
关于MLlib(ApacheSpark)特别声明
本站米卡智搜导航提供的MLlib(ApacheSpark)都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由米卡智搜导航实际控制,在2024年4月28日 下午4:23收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,米卡智搜导航不承担任何责任。
相关导航

工程师在几个月内就从完全的初学者变成了分析从业者。”

RapidMiner
数据科学最适合作为一项团队运动

OpenNN
它解决了能源、营销、健康等领域的许多实际应用。

飞桨PaddlePaddle
飞桨致力于让深度学习技术的创新与应用更简单。具有以下特点:同时支持动态图和静态图,兼顾灵活性和效率;精选应用效果最佳算法模型并提供官方支持;真正源于产业实践,提供业界最强的超大规模并行深度学习能力;推理引擎一体化设计,提供训练到多端推理的无缝对接;唯一提供系统化技术服务与支持的深度学习平台

MAHOUT
开箱即用的分布式后端,或者可以扩展到其他分布式后端。

NLTK
NLTKPython自然语言处理工具包

Keras
KerasPython版本的TensorFlow深度学习API

PyTorch
PyTorch开源机器学习框架
暂无评论...