About 3,650,000 results
Open links in new tab
  1. 什么是 Flume? Flume 应该如何使用? - 知乎

    Apache Flume 的 HTTP Source 主要支持通过 HTTP POST 方法接收数据。HTTP Source 可以配置为监听特定的端口,并使用不同的处理器(handler)来解析 HTTP 请求体中的数据。默认 …

  2. 日志采集系统flume和kafka有什么区别及联系,它们分别在什么时 …

    Flume/Logstash/Beat 是同一类软件,如果抽象功能的话可以认为是一个插件执行器,有一些常用的插件(例如日志采集,Binlog解析,执行脚本等),也可以根据需求将自己的代码作为插件 …

  3. 如何评价大数据 Hadoop 生态圈各个组件介绍? - 知乎

    Sqoop利用数据库技术描述数据架构,用于在关系数据库、数据仓库和Hadoop之间转移数据。 9. Flume (日志收集工具) Cloudera开源的日志收集系统,具有分布式、高可靠、高容错、易于 …

  4. flume机制原理 - 知乎

    what's flume? flume 是系统, 是高可用的,高可靠的,分布式的海量 数据日志 采集,聚合和传输的系统 总结就是 两个特点。高可用,高可靠 三个功能:数据的采集,聚合和传输.。 体系架 …

  5. logstash 和 flume 之间的优劣,和各自所适合的场景? - 知乎

    flume kafka source&sink contributor。 12年选型的时候, logstash 主要因为是ruby写的,还要运行在 jruby, grok 也很麻烦,相比之下,flume的框架比较清晰,比如source,channel,sink …

  6. flume写入到hdfs,中间需要加kafka吗? - 知乎

    Nov 1, 2021 · 简单介绍下Flume日志采集系统,内容不多大概一天就学完了,但是正所谓学得快忘得也快,所以把其中一些常用的、配置类的内容进行一个记录,方便每次温习。 第一章 …

  7. Hadoop到底是干什么用的? - 知乎

    Hadoop是专为离线和大规模数据分析而设计的,并不适合那种对几个记录随机读写的在线事务处理模式。 实际应用: (1)Flume+Logstash+Kafka+Spark Streaming进行实时日志处理分析 …

  8. 大数据方面核心技术有哪些? - 知乎

    大数据技术的体系庞大且复杂,基础的技术包含数据的采集、数据预处理、分布式存储、NoSQL数据库、数据仓库、机器学习、并行计算、可视化等各种技术范畴和不同的技术层面。 首先科 …

  9. hadoop集群到底是干什么的? - 知乎

    一. Hadoop 集群的核心作用 Hadoop 集群是大数据领域的基础设施,主要解决海量数据的存储与计算问题,其核心价值体现在以下三方面: 分布式存储: 解决数据存储的瓶颈,传统单机存储 …

  10. 大数据开发工程师必备的技术栈有哪些? - 知乎

    Flume 是 Cloudera 提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume 支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行 …