十月头条:四大语言的统治地位不断提高 截至今日,Python、Java、C 和 C++ 语言已经在 TIOBE 榜单的前 4 位盘踞了相当长的一段时间。它们在榜单排名远远领先于其他语言,并且差距似乎只会越来越大。去年,这 4 种语言总共占据了 40% 的市场份额......
十二、数据归一化、标准化处理 1,基本介绍 (1)在机器学习领域中,不同评价指标(即特征向量中的不同特征就是所述的不同评价指标)往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进⾏数据归一化或标准化处理......
十一、随机森林算法 1,基本介绍 (1)集成学习方法(Ensemble Method),或称集成学习算法。它并非一种机器学习算法,更像是一种模型优化方法。简单来说就是通过训练若干个个体弱学习器(weak learner),通过一定的结合策略,就可以最终形成一个强学习器......
十、神经网络分类算法 1,基本介绍 (1)神经网络算法是目前最知名、应用最为广泛的机器学习算法,而深度学习的本质就是神经网络算法(深度学习是神经网络算法的一个分支)。 (2)神经网络算法是一种具有网络结构的算法模型,这决定了它具有非常好的延展性......
九、K-means 聚类算法 1,基本介绍 (1)K-means 算法是一种无监督的聚类算法,它实现起来比较简单,聚类效果也不错,因此应用很广泛。 有监督学习与无监督学习区别: 有监督学习:有监督学习主要对有标签的数据集(即有“参考答案”)去构建机器学习模型......
九月头条:Julia 离榜单前 20 名的位置仅差一步之遥 在 9 月榜单中,有一种语言的增速引人注目,它就是广泛应用在数值分析和计算科学设计领域的 Julia 编程语言。它距离 Top 20 之位只差毫厘,仅有 0.05% 的差距。其实放眼数据分析领域,Julia 面临着诸多强劲的对手......
八、SVM 分类算法 1,基本介绍 (1)支持向量机,英文全称“Support Vector Machines”(简称 SVM),它是机器学习中最常用的一种“分类算法”。在深度学习没有普及之前,“支持向量机”可以称的上是传统机器学习中的“霸主”。 (2)建立一个最优决策超平面......
七、决策树分类算法 1,基本介绍 (1)决策树(Decision Tree)又称为判定树,是一种典型的分类方法,它是一种以树结构(包括二叉树和多叉树)形式来表达的预测分析模型。 (2)决策树算法一种基于 if-then-else 规则的有监督学习算法。它首先对数据进行处理......
六、朴素贝叶斯算法 1,基本介绍 (1)贝叶斯方法是以贝叶斯原理为基础,使用概率统计的知识对样本数据集进行分类。由于其有着坚实的数学基础,因此贝叶斯分类算法的误判率是很低的。 贝叶斯方法的特点是结合先验概率和后验概率,即避免了只使用先验概率的主观偏见......
五、KNN 最邻近分类算法 1,什么是 KNN 算法? (1)K 最近邻分类算法,简称 KNN(K-Nearest-Neighbor),它是有监督学习算法的一种。该算法的思路就是如果一个未知样本最近的 K 个样本中的大多数属于某一个类别,则该样本也属于这个类别......