@@ -119,5 +119,12 @@ $$
5. 测试算法
6. 应用算法
-###
+### Scikit-learn介绍
+
+
+Scikit-learn源于Google Summer of Code项目,由David Cournapeau在2007年发起,它提供了机器学习可能用到的工具,包括数据预处理、监督学习(分类、回归)、非监督学习(聚类)、模型选择、降维等。
+官网地址:<https://scikit-learn.org/stable/index.html>
+安装方法:`pip install scikit-learn`
@@ -20,3 +20,20 @@ k值的选择对于kNN算法的结果有非常显著的影响。下面用李航
实际应用中,$k$的取值通常都比较小,可以通过交叉检验的方式来选择较好的$k$值。
+### 算法优缺点
+优点:
+1. 简单有效
+2. 重新训练代价低
+3. 适合类域交叉样本
+4. 适合大样本分类
+缺点:
+1. 惰性学习
+2. 输出的可解释性不强
+3. 不擅长处理不均衡样本
+4. 计算量比较大
@@ -377,7 +377,7 @@ Python在以下领域都有用武之地。
#### Day80 - [推荐系统实战](./Day71-90/80.推荐系统实战.md)
-### Day81~90 - 大数据分析实战
+### Day81~90 - [大数据分析实战](./Day81-90)
### Day91~100 - [团队项目开发](./Day91-100)