Spark 分布式计算 (一)-XGBoost 计算

2023-03-28 08:14:00 ⋅ 8366 ⋅ 0 ⋅ 0

算法框架对比

批处理和流式处理的形象比喻：
file

流式计算：storm、Flink
批处理：MapReduce、Spark

如：1T 的数据切割为 10 个 block，处理的思路方式不同；

spark 微批处理，可以做到秒级的处理

spark诞生之初，主要是用作机器学习，机器学习更多的需要迭代，mp不合适迭代，spark更适合迭代。

为者常成，行者常至

成为第一个点赞的人吧

回复数量: 0

暂无评论~~

请注意单词拼写，以及中英文排版，参考此页
支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`, 更多语法请见这里 Markdown 语法
支持表情，使用方法请见 Emoji 自动补全来咯，可用的 Emoji 请见 :metal: :point_right: Emoji 列表 :star: :sparkles:
上传图片, 支持拖拽和剪切板黏贴上传, 格式限制 - jpg, png, gif
发布框支持本地存储功能，会在内容变更时保存，「提交」按钮点击时清空