A platform for cluster computing.
Bash for Data Manipulation
Do complex things with just a few keystrokes!
机器学习相关概念解读P1
今天开始准备对机器学习相关概念做个总结,part1会包括以下概念:Cross Validation、Confusion Matrix、Sensitivity 与 Specificity、Bias 与 Variance、ROC 与 AUC、Odds Ratios 与 Log(Odds Ratios)。
加密货币市值分析
自从08年比特币发布以来,数以百计类似的基于区块链技术的产品层出不穷。我们称这些为加密货币,时至今日,某些加密货币已经大幅上涨,某些在未来可能也极具上涨空间。实际上,在2017年12月6日,比特币的市值超过2000亿美元。
Python 神经网络分析基础
今天我们学习神经网络与nexworkX.
机器学习:泛化误差与随机森林
这一篇文章我们来了解误差,如何处理误差,以及学习随机森林的基础知识。
机器学习:Classification and Regression Trees
机器学习决策树的第一部分,分类与回归树(CART)的原理(多图)。
非监督学习:PCA and NMF
非监督学习的最后两章,我们会学习 Dimension reduction, Dimension reduction就是从数据中发现一定的模式,通过这种模式我们就可以对数据进行压缩,这对于计算和存储来说都是非常有利的,特别是在大数据时代。
非监督学习:Clustering and Visualization
非监督学习:即根据现有的数据去发掘存在数据中的一些模式,比如根据用户的购买记录,(clustering) 定义用户画像, 或根据数据的模式来压缩数据(dimension reduction.
机器学习:处理Jira工单的分类问题
如何根据jira工单的category自动找到处理它的组呢?这是一个利用机器学习中knn算法的小实践.
监督学习实例:学校图书数据分类
我们学校比旁边的学校在教科书上面花了更多的钱吗?这是否有用呢?
Scikit-Learn 与监督学习
给机器学习的能力,让它可以根据数据自己做决定的一种技术。
Numpy NDArray 基本操作
> 为什么要使用Numpy?给你两组数据运算,然后对比一下性能就知道了.
PowerShell 通过 Http, Https, Ftp 下载文件
利用 PowerShell 发起请求,不仅可以下载文件,还可以利用管道对文件进行解析,这一点比 CMD 命令行和 Linux 下的 wget 还要好用。
NumPy 操作数组
对数组的操作是 NumPy 中很重要的一部分,了解这些内置的方法,可以让你的效率事半功倍。
Numpy Universal Functions
Numpy中一些基本函数参考。