SQL是IBM公司于1975—1979年之间开发出来的,在20世纪随着数据库技术的发展,数据库产品越来越多,如Oracle、DB2、MongoDB、SQLServer、MySQL等。 查看全文>>
大数据技术文章2019-11-01 |传智播客 |常用的数据库
Hive是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。Hive 定义了简单的类 SQL 查询语言,称为 HQL,它允许熟悉 SQL 的用户查询数据。课程内容是Hive基础教程。 查看全文>>
大数据技术文章2019-10-17 |传智播客 |Hive视频教程
ZooKeeper是以Fast Paxos算法为基础的,Paxos 算法存在活锁的问题,即当有多个proposer交错提交时,有可能互相排斥导致没有一个proposer能提交成功,而Fast Paxos作了一些优化,通过选举产生一个leader (领导者),只有leader才能提交proposer,具体算法可见Fast Paxos。因此,要想弄懂ZooKeeper首先得对Fast Paxos有所了解。 查看全文>>
大数据技术文章2019-10-17 |传智播客 |zookeepe视频教程教程
图论算法在计算机科学中扮演着很重要的角色,它提供了对很多问题都有效的一种简单而系统的建模方式。很多问题都可以转化为图论问题,然后用图论的基本算法加以解决。 查看全文>>
大数据技术文章2019-10-16 |传智播客 |图论及其应用
Flink CEP是在flink之上实现的复杂事件处理(CEP)库,它允许我们在事件流中检测事件的模式,让我们有机会掌握数据中重要的事项。本文章主要是介绍了flink cep中可用的api调用,首先介绍Pattern API,它允许你指定要在事件流中检测的模式,并介绍匹配事件并对其进行操作。最后分析下CEP库在处理事件时间延迟问题。 查看全文>>
大数据技术文章2019-10-16 |传智播客 |Flink cep库,处理事件时间延迟
目前云平台逐渐火热起来,国内如:阿里云、腾讯云、华为云等平台,国外如:AWS、Azure、Google GCP等平台,都有不少用户,并在持续的增加中。特别是在大数据领域,主流的云平台均提供了相应的解决方案,从分布式存储到分布式计算,从批处理框架到流式计算,从ETL到数据管道,从BI分析到数据挖掘等等方面均有对应的产品来解决企业的需求。我们有必要对云平台增加一定的了解,并最好能上手尝试一番,对我们提升眼界思维有很大帮助。本篇文章就给大家带来主流云平台中的AWS平台的相关介绍。 查看全文>>
大数据技术文章2019-10-16 |传智播客 |云平台AWS
搜索引擎的热门搜索排行榜功能你用过吗?你知道这个功能是如何实现的吗?实际上,它的实现并不复杂。搜索引擎每天会接收大量的用户搜索请求,它会把这些用户输入的搜索关键词记录下来,然后再离线地统计分析,得到最热门的 Top 10 搜索关键词。 查看全文>>
大数据技术文章2019-10-14 |传智播客 |求热搜关键词,大数据算法
概率图模型是在概率模型的基础上,使用了基于图的方法来表示概率分布,是一种通用化的不确定性知识表示和处理方法,在人工智能、机器学习和计算机视觉等领域有广阔的应用前景。 查看全文>>
大数据技术文章2019-10-14 |传智播客 |大数据概率图模型