Cabbage

Cabbage

The very things that in the moment dampen our moods can later be sources of intense gratification and delight.

Sklearn特征工程与特征选择

Sklearn特征工程与特征选择这里我将使用dorothea数据集和Logistic回归,当时负样本的效果很差,有数据倾斜,而且特征数据大于样本量,也没有做预处理等等,所以这里就用其来做实验。我...

Sklearn算法调用及参数说明(CART,kNN,LogisticRegression,SVM,GBDT,线性回归,Kmeans)

Scikit learn 也简称 sklearn, 是机器学习领域当中最知名的 python 模块之一.Sklearn 包含了很多种机器学习的方式:Classification 分类Regres...

Pandas基础与进阶教程

Pandas基础操作Pandas 是一个 Python Data Analysis Library。在Pandas里面有三种基本数据结构:Series 可以理解为一维的同类型的均匀的数组Data...

KNN算法理解与实现

k-近邻算法是基于实例的学习方法中最基本的,我认为也是算法思想最简单的。很暴力的一个算法,主要思想就是用当前要预测数据去一一对比训练集中数据,找出最相似的K个数据,然后使用投票的方法决定当前该数...

数据挖掘基本流程

做数据挖掘最重要的是要清楚做什么分析,理清分析的对象,要通过不同维度细分,趋势发展以及其他分析方法呈现分析结果,从中发现异常与规律。先给出一张思维导图(图很大,可以下载下来放大看)主要流程如下:...