炼数成金 商业智能机器学习
订阅

机器学习

基于Docker的机器学习--Tensorflow-GPU环境
基于Docker的机器学习--Tensorflow-GPU环境
基于 NVIDIA-Docker 的 CPU 环境中,GPU是可以复用的,可以将1个GPU挂载到多个 docker 容器中使用提高了GPU的使用效率,这是 KVM 虚拟机通过硬件透传无法实现的。由于多个容器共享一个GPU,不能做到对 GPU 资源进行 ...
Andrej Karpathy:神经网络是软件2.0,而非机器学习的一种工具
Andrej Karpathy:神经网络是软件2.0,而非机器学习的一种工具
我有时看到人们把神经网络称为“机器学习工具箱中的另一种工具”。神经网络作为一种工具有这样那样的优点和缺点,在这个任务或那个任务工作,有时你可以利用它们赢得Kaggle的比赛。不幸的是,这种解释只见树木,不见 ...
为什么XGBoost在机器学习竞赛中表现如此卓越?
为什么XGBoost在机器学习竞赛中表现如此卓越?
机器学习算法的目标是减少预期的泛化误差,这也被称为风险(risk)。如果我们知道真实的分布 P(x,y),那么风险的最小化就是一个可以通过优化算法解决的最优化任务。但是,我们并不知道真实分布,只是有一个用于训练 ...
呼之欲出的量子计算机,和它漫长的最后一英里
呼之欲出的量子计算机,和它漫长的最后一英里
图:中国科学院院士、量子计算专家、图灵奖获得者姚期智11月4日,中国科学院院士、量子计算专家、图灵奖获得者姚期智在腾讯WE大会的五周年论坛上远程发布了最新演讲。姚期智用RSA的密码系统作例子说明了量子计算机的 ...
数据缺失的坑,无监督学习这样帮你补了
数据缺失的坑,无监督学习这样帮你补了
无监督学习(UL)有很多没开发的潜力。它是一门从“未标记”数据中推导一个函数来描述其隐藏结构的艺术。但首先,从数据中找到其结构是什么意思呢? 让我们来看以下两个例子:Blobs气泡状分布:这个简单。任何人看到 ...
AUC越大,正确率就越高?
AUC越大,正确率就越高?
近日,一位朋友拿着两个模型预测效果比较的结果来咨询,当然是遇到了一个好像不太正常的现象才来咨询的。两个模型都是二分类结局的,应用常见的Logistic回归模型得到结果如下:模型A的正确率为85%,AUC为0.98;模型B ...
机器学习之确定最佳聚类数目的10种方法
机器学习之确定最佳聚类数目的10种方法
在聚类分析的时候确定最佳聚类数目是一个很重要的问题,比如kmeans函数就要你提供聚类数目这个参数,总不能两眼一抹黑乱填一个吧。之前也被这个问题困扰过,看了很多博客,大多泛泛带过。今天把看到的这么多方法进行 ...
适合入门的8个趣味机器学习项目
适合入门的8个趣味机器学习项目
谈到机器学习,相信很多除学者都是通过斯坦福大学吴恩达老师的公开课《Machine Learning》开始具体的接触机器学习这个领域,但是学完之后又不知道自己的掌握情况,缺少一些实际的项目操作。对于机器学习的相关竞赛挑 ...
亚马逊CTO:机器学习的进步是如何推动企业发展的
亚马逊CTO:机器学习的进步是如何推动企业发展的
Vogels博士认为往往在事情发生以后我们才能明确是否科技进步了,但是人工智能和机器学习这两项技术有点不同。机器学习作为AI(人工智能)的一部分,对于大规模数据从规则和认知模型上进行描述,完成针对未来数据的预 ...
DARPA再出新招:射频频谱+机器学习=射频学习?
DARPA再出新招:射频频谱+机器学习=射频学习?
近日,美国国防高级研究计划局(Defense Advanced Research Projects Agency, DARPA)推出新项目:运用机器学习技术识别数以亿计不同的无线电讯号。如今人们的生活中,应用射频的电子设备无处不见,数以亿计的移动电 ...
千锤万凿出深山:且谈特征工程最佳实践
千锤万凿出深山:且谈特征工程最佳实践
作为为机器学习创建新特征的实现过程,特征工程已经成为改进预测模型的最具实效的方法之一。获取特征难度极高、相当耗时且要求具备专业知识。“应用机器学习”在本质上其实就是在实现特征工程。通过特征工程方法,你 ...
大规模机器学习的编程技术、计算模型以及Xgboost和MXNet案例
大规模机器学习的编程技术、计算模型以及Xgboost和MXNet案例
大家好,很高兴和大家一起分享大规模机器学习相关的知识,希望大家能有所收获。现在,机器学习的趋势从传统方法中的简单模型 + 少量数据(人工标注样本),到简单模型 + 海量数据(比如基于逻辑回归的广告点击率预测 ...
基于机器学习的KPI自动化异常检测系统
基于机器学习的KPI自动化异常检测系统
在实际的运维场景中,构建一个异常检测系统往往需要两个角色共同参与:领域专家和算法开发人员。领域专家也就是我们的运维人员,他们对KPI曲线的行为很熟悉,可以通过观察KPI曲线并结合自己的领域知识,判断KPI曲线 ...
重新思考机器学习:大数据消耗已无必要
重新思考机器学习:大数据消耗已无必要
从很多方面看,机器学习可以说是大数据革命的一个延伸,但它比大数据更难攻克。虽然希望常在,但是正如Gartner分析师Nick Heudecker指出的那样:“只有15%的机构能在生产中成功应用大数据”。那么,机器学习呢?Nick ...
横向对比三大分布式机器学习平台:Spark、PMLS、TensorFlow
横向对比三大分布式机器学习平台:Spark、PMLS、TensorFlow
机器学习(尤其是深度学习)最近已经在语音识别、图像识别、自然语言处理和推荐/搜索引擎等方面取得了变革性的成功。这些技术在自动驾驶汽车、数字医疗系统、CRM、广告、物联网等方面的应用非常有前途。当然,资本带 ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

      GMT+8, 2017-12-12 12:10 , Processed in 0.377013 second(s), 16 queries .