kafka中文文档:http://kafka.apachecn.org
github:https://github.com/apachecn/kafka-doc-zh
pyenv实现多个python版本并存
pyenv实现多个python版本并存
由于python 2和3存在不小的区别,尤其个别第三方库并不是都兼容,所以有时候我们需要在同一台服务器上运行多个不同的python版本
1.安装pyenv
(1)安装到$HOME/.pyenv目录:
|
|
(2)配置环境变量
|
|
(3)添加pyenv初始化到你的shell并生效
|
|
Centos 6.9 安装CDH 5.14教程
1.前置准备
上篇文章我讲了安装CDH的一些前置准备,可以参考《CDH安装前置基础准备条件》一文,这里就不再多说。
到此已完成:
- 集群服务器配置,包括安装操作系统、关闭防火墙、同步服务器时钟等;
- 外部数据库安装
- CDH和CM版本均为5.14且已配置本地yum源
2.Cloudera Manager安装
2.1.安装Cloudera Manager Server
1.yum安装Cloudera Manager Server
|
|
CDH安装前置基础准备条件
CDH安装前置基础准备条件
1.基础环境
1.1.节点规模
测试环境,最小规模,最少4台服务器。一台做管理节点Cloudera Manager和NameNode等,另外三台用作worker,DATANODE节点,这种最小规模一般仅用于开发和测试。
如果是生产环境,最少6台,3台管理节点包括1个Cloudera Manager,2个NameNode做高可用,3个工作节点。
常见的较小规模的生产系统一般为10-20台。
###1.2.操作系统
CDH支持大部分主流的64位操作系统,我这里会以centos 6.9部署CDH 5.14版本为例子。其他CDH版本及其对应的操作系统版本可参考:CDH版本及其支持的操作系统版本
【Scikit-Learn 中文文档】二:使用 scikit-learn 介绍机器学习 | ApacheCN
中文文档: http://sklearn.apachecn.org/cn/0.19.0/tutorial/basic/tutorial.html
英文文档: http://sklearn.apachecn.org/en/0.19.0/tutorial/basic/tutorial.html
GitHub: https://github.com/apachecn/scikit-learn-doc-zh(觉得不错麻烦给个 Star,我们一直在努力)
贡献者: https://github.com/apachecn/scikit-learn-doc-zh#贡献者
内容提要
在本节中,我们介绍一些在使用 scikit-learn 过程中用到的 机器学习 词汇,并且给出一些例子阐释它们。
机器学习:问题设置
一般来说,一个学习问题通常会考虑一系列 n 个 样本 数据,然后尝试预测未知数据的属性。 如果每个样本是 多个属性的数据 (比如说是一个多维记录),就说它有许多“属性”,或称 features(特征) 。
我们可以将学习问题分为几大类: