先谈谈我对机器学习的理解
#

什么是机器学习?
#

我们人类有从婴儿开始就开始学习,父母教我们穿衣吃饭、老师教我们读书写字，我们开始能辨别好人坏人，开始通过自己的经验来判断新事物。

机器学习很简单，就像人一样，我们教机器通过我们教的来判断新的事物，或者在从新的事物里面学习处理新的事物。
#

这看起来很复杂的样子,但是从我们神经网络来看,我们可以把学习当做建立一个神经元连接,通过输入的信号得到一个输出的信号.我们只要简单的把输入的信号分类就可以了.通过无数个分类我们就可以建立复杂的神经系统,进而实现’学习’这个功能.

如何分类?
#

涉及到分类,假如输入的信号种类只要两种,我们就可以简单用if-else来实现分类功能,但是有时候输入信号种类个个都有细微的差别,只是遵循某种规律,这时候我们不能用简单的if-else来进行分类了,下面我就按照书的顺序来解释各种强大的分类方法.

K-近邻算法 ( k-Nearest Neighbor )
#

作为本书的第一个机器学习算法,K-NN算是我感觉原理最简单的一个了.

假设我们有两个点, 红点为(-1, -1)分为红类, 绿点为(1, 1)分为绿类

接下来我一个点(0, -1),这个点应该分为红还是绿呢,我们添加两条辅助线
#

蓝点离红点距离为1,蓝点离绿点距离为2.2,我们很轻松的可以知道这个点应该分为红类.
现在我们进一步推广,当有很多种类点的时候,当我们二维扩展到N维,给一个点a我们只要选取距离a最近的K个种类,我们就基本能判断他属于这K个种类的,这就是K-近邻的原理了.

K-近邻算法是最简单最有效的算法了,但是他也有缺点,比如他必须保存所有训练样本的数据,当训练样本很大的时候就会占用很多内存空间,我们后面会学到的KVM只取支持向量的训练样本来计算可以减少很多占用内存
#

而且K-近邻算法对训练数据集都要计算距离值,实际使用可能会非常耗时,我们后面学到的logistic回归能很好解决这个问题.
#

######### 总而言之,KNN作为小样本时非常简单粗暴,但是他无法给出任何数据的基本结构信息.接下来我们要学习用概率测量解决分类问题,这个算法能解决这个问题

(决策树)[]

GitHub Education Pack

2016-07-18·3 分钟

后端软件

GitHub推出一个对学生和教师的福利包,对于学生来说这是一个不小的福利,只要通过一个edu邮箱就可以领取,但奈何国内有些无良人买卖邮箱,所以GitHub对于.cn的邮箱一律拒绝,但是可以通过上传学生证的方法得到验证,题主刚开始用学校邮箱试了试,失败了,抱着试一试的心态,上传了学生证,没想到第二天就给我回复,并给我这个豪华大礼包,接下来我就介绍介绍如何用这个包来.

Numpy的简析

2016-07-18·3 分钟

后端框架 Python

numpy简单来说就是python的C版数组实现,因为python原生列表虽然好使,但是生成大量数据时开销很大,而numpy是基于C的,生成大量数组非常简单,而且操作他们速度非常快.

PIL （Pillow）

2016-07-18·3 分钟

后端框架 Python

Pillow 是 PIL的对Python3支持的另外一个分支，当然他对Python2也兼容，由于PIL安装起来比较烦，而使用pip可以很轻松的安装Pillow，所以我选择Pillow使用，但是其核心还是PIL库的。

Python 线程(threading) 进程(multiprocessing)

2016-07-18·6 分钟

后端框架 Python

# 最近学了两个python库，一个负责管理线程，一个负责管理进程，原来一直写的都是些单线程的程序，虽然web也关于并发和多涉及到线程，但都是框架管理的，学习>过后发现了解线程和进程对python的web开发也有一定帮助。下面先谈谈这对python对线程和进程的支持再谈谈对这两个库的应用。

python学习

2016-07-18·1 分钟

后端框架 Python

由于有其他编程语言基础，所以对于python的学习并不吃力，但是整体感觉python的确与前面学习c、c——— # 1. 实时编译VS静态编译 # 不需要输入任何前缀，直接将代码放在python解释器上面就能运行，虽然window下不支持直接点开文件就能使用，但是只要安装了python解释器就能很轻松的运行。

python的编码问题研究------使用scrapy体验

2016-07-18·5 分钟

后端框架 Python

基于python2 scrapy是一款非常轻量级的爬虫框架，但是由于它隐藏了太多关于网络请求的细节，所以我们有时候会遭遇到一下很尴尬的bug，当然这主要是因为碰到一些不规范的网站。

<<机器学习实战>>心得.

先谈谈我对机器学习的理解
#

什么是机器学习?
#

机器学习很简单，就像人一样，我们教机器通过我们教的来判断新的事物，或者在从新的事物里面学习处理新的事物。
#

如何分类?
#

K-近邻算法 ( k-Nearest Neighbor )
#

接下来我一个点(0, -1),这个点应该分为红还是绿呢,我们添加两条辅助线
#

K-近邻算法是最简单最有效的算法了,但是他也有缺点,比如他必须保存所有训练样本的数据,当训练样本很大的时候就会占用很多内存空间,我们后面会学到的KVM只取支持向量的训练样本来计算可以减少很多占用内存
#

而且K-近邻算法对训练数据集都要计算距离值,实际使用可能会非常耗时,我们后面学到的logistic回归能很好解决这个问题.
#

相关文章

先谈谈我对机器学习的理解 #

什么是机器学习? #

机器学习很简单，就像人一样，我们教机器通过我们教的来判断新的事物，或者在从新的事物里面学习处理新的事物。 #

如何分类? #

K-近邻算法 ( k-Nearest Neighbor ) #

接下来我一个点(0, -1),这个点应该分为红还是绿呢,我们添加两条辅助线 #

K-近邻算法是最简单最有效的算法了,但是他也有缺点,比如他必须保存所有训练样本的数据,当训练样本很大的时候就会占用很多内存空间,我们后面会学到的KVM只取支持向量的训练样本来计算可以减少很多占用内存 #

而且K-近邻算法对训练数据集都要计算距离值,实际使用可能会非常耗时,我们后面学到的logistic回归能很好解决这个问题. #

相关文章

先谈谈我对机器学习的理解
#

什么是机器学习?
#

机器学习很简单，就像人一样，我们教机器通过我们教的来判断新的事物，或者在从新的事物里面学习处理新的事物。
#

如何分类?
#

K-近邻算法 ( k-Nearest Neighbor )
#

接下来我一个点(0, -1),这个点应该分为红还是绿呢,我们添加两条辅助线
#

K-近邻算法是最简单最有效的算法了,但是他也有缺点,比如他必须保存所有训练样本的数据,当训练样本很大的时候就会占用很多内存空间,我们后面会学到的KVM只取支持向量的训练样本来计算可以减少很多占用内存
#

而且K-近邻算法对训练数据集都要计算距离值,实际使用可能会非常耗时,我们后面学到的logistic回归能很好解决这个问题.
#