当前访客身份:游客 [ 登录  | 注册加入尚学堂]
直播

我来了!

拥有积分:3960
尚学堂雄起!!威武。。。

博客分类

笔记中心

课题中心

提问中心

答题中心

解答题中心

  • 基于Flume的美团日志收集系统(二)改进和优化
    在《基于Flume的美团日志收集系统(一)架构和设计》中,我们详述了基于Flume的美团日志收集系统的架构设计,以及为什么做这样的设计。在本节中,我们将会讲述在实际部署和使用过程中遇到的问题,对Flume的功能改进和对系统做的优化。 1 F...
  • 基于Flume的美团日志收集系统(一)架构和设计
    美团的日志收集系统负责美团的所有业务日志的收集,并分别给Hadoop平台提供离线数据和Storm平台提供实时数据流。美团的日志收集系统基于Flume设计和搭建而成。 《基于Flume的美团日志收集系统》将分两部分给读者呈现美团日志收集系统的...
  • Kafka文件存储机制那些事
    Kafka是什么 Kafka是最初由Linkedin公司开发,是一个分布式、分区的、多副本的、多订阅者,基于zookeeper协调的分布式日志系统(也可以当 做MQ系统),常见可以用于web/nginx日志、访问日志,消息服务等等,Link...
  • 实例详解机器学习如何解决问题
    前言 随着大数据时代的到来,机器学习成为解决问题的一种重要且关键的工具。不管是工业界还是学术界,机器学习都是一个炙手可热的方向,但是学术界和工业 界对机器学习的研究各有侧重,学术界侧重于对机器学习理论的研究,工业界侧重于如何用机器学习来解决...
  • 机器学习中的数据清洗与特征处理综述
    背景 随着美团交易规模的逐步增大,积累下来的业务数据和交易数据越来越多,这些数据是美团做为一个团购平台最宝贵的财富。通过对这些数据的分析和挖掘,不仅能 给美团业务发展方向提供决策支持,也为业务的迭代指明了方向。目前在美团的团购系统中大量地应...
  • CentOS6.5安装Docker
    笔者这里是用CnetOS6.5系统  开始安装daoker之旅: [root@localhost ~]# uname -r 2.6.32-431.el6.x86_64 [root@localhost ~]# cat /etc/issue C...
  • 机器学习常见算法分类汇总
    机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。这里IT经理网为您总结一下常见的机器学习算法,以供您在工作和学习中参考。 机器学习的算法很多。很多时候困惑人们都是,很多算法是一类算法,而有些...
  • Apache Mahout中的机器学习算法集
    Apache Mahout 是 ApacheSoftware Foundation (ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序,并且,在 Mahout 的最近版...
  • Paper Rush-1: The Google Big Table
    Big Table是Google的一种分布式数据库,以: <row, column, time64> --> value 的映射形式存储数据,现在的主要使用产品为Google Earth, Google Analytics。以下为Big T...
  • Installation Path C - Manual Installation Using Cl
    This is the documentation for Cloudera 5.2.x. Documentation for other versions is available at Cloudera Documentation. I...
北京总部地址:北京市海淀区西三旗桥东建材城西路85号神州科技园B座三层尚学堂 咨询电话:400-009-1906 010-56233821
Copyright 2007-2015 北京尚学堂科技有限公司 京ICP备13018289号-1 京公网安备11010802015183