炼数成金 商业智能机器学习
订阅

机器学习

机器学习之确定最佳聚类数目的10种方法
机器学习之确定最佳聚类数目的10种方法
在聚类分析的时候确定最佳聚类数目是一个很重要的问题,比如kmeans函数就要你提供聚类数目这个参数,总不能两眼一抹黑乱填一个吧。之前也被这个问题困扰过,看了很多博客,大多泛泛带过。今天把看到的这么多方法进行 ...
适合入门的8个趣味机器学习项目
适合入门的8个趣味机器学习项目
谈到机器学习,相信很多除学者都是通过斯坦福大学吴恩达老师的公开课《Machine Learning》开始具体的接触机器学习这个领域,但是学完之后又不知道自己的掌握情况,缺少一些实际的项目操作。对于机器学习的相关竞赛挑 ...
亚马逊CTO:机器学习的进步是如何推动企业发展的
亚马逊CTO:机器学习的进步是如何推动企业发展的
Vogels博士认为往往在事情发生以后我们才能明确是否科技进步了,但是人工智能和机器学习这两项技术有点不同。机器学习作为AI(人工智能)的一部分,对于大规模数据从规则和认知模型上进行描述,完成针对未来数据的预 ...
DARPA再出新招:射频频谱+机器学习=射频学习?
DARPA再出新招:射频频谱+机器学习=射频学习?
近日,美国国防高级研究计划局(Defense Advanced Research Projects Agency, DARPA)推出新项目:运用机器学习技术识别数以亿计不同的无线电讯号。如今人们的生活中,应用射频的电子设备无处不见,数以亿计的移动电 ...
千锤万凿出深山:且谈特征工程最佳实践
千锤万凿出深山:且谈特征工程最佳实践
作为为机器学习创建新特征的实现过程,特征工程已经成为改进预测模型的最具实效的方法之一。获取特征难度极高、相当耗时且要求具备专业知识。“应用机器学习”在本质上其实就是在实现特征工程。通过特征工程方法,你 ...
大规模机器学习的编程技术、计算模型以及Xgboost和MXNet案例
大规模机器学习的编程技术、计算模型以及Xgboost和MXNet案例
大家好,很高兴和大家一起分享大规模机器学习相关的知识,希望大家能有所收获。现在,机器学习的趋势从传统方法中的简单模型 + 少量数据(人工标注样本),到简单模型 + 海量数据(比如基于逻辑回归的广告点击率预测 ...
基于机器学习的KPI自动化异常检测系统
基于机器学习的KPI自动化异常检测系统
在实际的运维场景中,构建一个异常检测系统往往需要两个角色共同参与:领域专家和算法开发人员。领域专家也就是我们的运维人员,他们对KPI曲线的行为很熟悉,可以通过观察KPI曲线并结合自己的领域知识,判断KPI曲线 ...
重新思考机器学习:大数据消耗已无必要
重新思考机器学习:大数据消耗已无必要
从很多方面看,机器学习可以说是大数据革命的一个延伸,但它比大数据更难攻克。虽然希望常在,但是正如Gartner分析师Nick Heudecker指出的那样:“只有15%的机构能在生产中成功应用大数据”。那么,机器学习呢?Nick ...
横向对比三大分布式机器学习平台:Spark、PMLS、TensorFlow
横向对比三大分布式机器学习平台:Spark、PMLS、TensorFlow
机器学习(尤其是深度学习)最近已经在语音识别、图像识别、自然语言处理和推荐/搜索引擎等方面取得了变革性的成功。这些技术在自动驾驶汽车、数字医疗系统、CRM、广告、物联网等方面的应用非常有前途。当然,资本带 ...
聊一聊「特征工程」的最佳实践
聊一聊「特征工程」的最佳实践
特征工程是指为机器学习算法创造新特征的过程,这是提高模型预测表现的有力手段。创造新的特征是一件十分困难的事情,需要丰富的专业知识和大量的时间。机器学习应用的本质基本上就是特征工程。——Andrew Ng通过特 ...
成熟的机器学习流如何设计:微博大规模机器学习框架Weiflow揭秘
成熟的机器学习流如何设计:微博大规模机器学习框架Weiflow揭秘
模型训练只是其中耗时最短的一环。如果把机器学习流比作烹饪,那么模型训练就是最后翻炒的过程;烹饪的大部分时间实际上都花在了食材、佐料的挑选,洗菜、择菜,食材再加工(切丁、切块、过油、预热)等步骤。在微博 ...
爬虫工程师如何绕过验证码?寻找阿登高地之路
爬虫工程师如何绕过验证码?寻找阿登高地之路
网站验证码就如同马奇诺防线一样,阻挡了爬虫工程师的正面进攻。随着爬虫和反爬虫双方围绕验证码的不断较量,最终导致了验证码识别难度的不断上升。正面硬刚验证码,想要识别它,是件挺复杂的事,涉及到图像处理技术 ...
Keras之父、谷歌研究员拆解机器自主学习
Keras之父、谷歌研究员拆解机器自主学习
在机器学习领域,我们可以期待的一个必要的转变是:从只能做模式识别和获得局部的泛化,到能够执行抽象和推理的模型,这能获得极端的泛化。当下,具有基本推理形式能力的AI程序都是由人类程序员硬编码的:例如,依赖 ...
Yelp 是如何无损压缩图片的
Yelp 是如何无损压缩图片的
Yelp 承载了上亿张用户上传的照片,这些照片涵盖了美食、发型,甚至我们最新发布的 #yelfies 功能等内容。用户通过手机应用或网站下载这些图片时会占用大量带宽,而图片本身的存储和传输也需要 Yelp 付出不菲的成本 ...
七种常用回归技术,如何正确选择回归模型?
七种常用回归技术,如何正确选择回归模型?
回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于预测分析,时间序列模型以及发现变量之间的因果关系。例如,司机的鲁莽驾驶与道路交通事故数量之间的关系 ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

      GMT+8, 2017-10-22 14:18 , Processed in 0.103397 second(s), 16 queries .