大数据教程
当前位置| > 博客

大数据教程

大数据-大数据(Big Data)又称为巨量资料 ...
  • 系统和网络拓扑中建设性能模型   欢迎各位阅读本篇,网络拓扑指构成网络的成员间特定的排列方式。分为物理的,即真实的,或者逻辑的,即虚拟的两种。本篇文章讲述了系统和网络拓扑中建设性能模型。   这个文档和附带的脚本详细介绍了如何构建针对各种系统和网络拓扑的高性能可拓展模型。这个技术在本文档中用了一些低级的 Tensorflow Python 基元。在未来,这些技术将被并入高级 API。   ... 继续阅读系统和网络拓扑中建设性能模型

    :
    2018-05-16
  • 了解大数据那些事?及其未来发展趋势如何?   “大数据”炙手可热,将逐渐成为很多行业企业实现其价值的最佳途径,能够在大数据行业崛起的初期进入这个行业当中,才有机会成为时代的弄潮儿。既然这样,对于大数据,我们需要做些了解。  1.大数据是什么?  简单的说,大数据指的是通过计算分析大数据集,以揭示与数据某一方面相关的模式或趋势。对于大数据而言,数据量没有一定的要求,只要足够得出可靠的结论即可。 ... 继续阅读了解大数据那些事?及其未来发展趋势如何?

    :
    2018-05-16
  • 什么是大数据和大数据平台?大数据能做什么?   “大数据”时下一个热门的词语,近几年来,关于大数据的著作和文章铺天盖地,似乎也在共同在传递一个信息:越来越多的行业、人士开始关注并实际探索大数据的应用,我们正在一起描绘着大数据巨大效用的蓝图,但在实践的路上,我们都孩子起步阶段小步前行。  大数据根基于互联网,数据仓库、数据挖掘、云计算等互联网技术的发展为大数据应用奠定基础。对于任何一个大数据的从... 继续阅读什么是大数据和大数据平台?大数据能做什么?

    :
    2018-05-16
  • 不要让Hadoop有机会成为Had oops!   欢迎各位阅读本篇,Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。本篇文章讲述了Hadoop&Had oops之间,课课家教育平台提醒各位:本篇文章纯干货~因此大家一定要认真阅读本篇文章哦!   过去几年里,数据量的生成以每两年翻翻的速度增长,但企业的预算却没有... 继续阅读不要让Hadoop有机会成为Had oops!

    :
    2018-05-16
  • 数据的性能优化   其实,对于庞大的用户群以及海量的用户数据意味着基础设施的构建必须兼顾高效与稳定,更经济,扩展更方便的云服务平台就成为了选择,而且很多情况下,为了避免使用DISTINCT使用DISTINCT是为了保证在结果集中不出现重复值,但是DISTINCI关键子会产生张工作表,并进行排序以删除重复记录,这会大大增加查询时间和1O的次数。   因此应尽量免使用DISTINCT例如,不使用... 继续阅读数据的性能优化

    :
    2018-05-16
  • Kette介绍及简单入门教程   ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程),对于企业或行业应用来说,我们经常会遇到各种数据的处理,转换,迁移,所以了解并掌握一种etl工具的使用,必不可少,这里我介绍一的ETL工具Kettle。这个工具真的很强大,支持图形化的GUI设计界面,然后可以以工作流的形式流转,在做一些简单或复杂的数据抽取、质量检测、数据... 继续阅读Kette介绍及简单入门教程

    :
    2018-05-16
  • Apache Hadoop文件格式与存储引擎   欢迎各位阅读本篇,ApacheHadoop是一套用于在由通用硬件构建的大型集群上运行应用程序的框架。本篇文章讲述了Apache Hadoop文件格式与存储引擎。   主题   这篇文章提出了在Apache Hadoop 生态系统中对比一些当前流行的数据格式和可用的存储引擎的性能:Apache Avro, Apache Parquet, Ap... 继续阅读Apache Hadoop文件格式与存储引擎

    :
    2018-05-16
  • 互联网SEO营销(下)   Seo可以帮助政务网站避免犯错通过对搜索引擎收录、筛选、索引、推荐网站的原理的了解,政务网站从设计架构上、内容编制的过程中就可以知道搜索引擎将怎样看待建设中的网站,而不一定非要等到到网站上线后才能分析出来。   值得得注意的是,由于不懂搜索引擎规律而制作出来的网站无法导引搜索引摹完整、准确地抓取、概述网页的内容,在“断章取义”的情况下,有些时候在搜索结果中出现的信... 继续阅读互联网SEO营销(下)

    :
    2018-05-16
  • 外排序指的的是什么?   我们一般提到排序都是指内排序,比如快排、堆排序、归并排序等,所谓的内排序就是把所有待排序的数据外进内存之中,比如,一个数组之中。但是如果文件太大,文件中的所有数据不能一次性的放入内存之中,快排,堆排序,归并排序等内排序就无法工作了。在这种情况下,我们使用外排序。下面我们就来讲解外排序,需要的朋友可以参考学习!  外排序(External sorting)是指能够处理极... 继续阅读外排序指的的是什么?

    :
    2018-05-16
  •   欢迎各位阅读本篇,垂直电子商务是指在某一个行业或细分市场深化运营的电子商务模式。通常电子商务网站旗下商品都是同一类型的产品。   亚马逊又往零售业丢了一个深水炸弹——豪掷137亿收购了美国著名的有机食品连锁超市Whole Foods。这次亚马逊史上最大的并购交易,明明白白地展示了这家美国电商巨头进军垂直领域的野心。   再加上沃尔玛3亿美金收购男装电商企业Bonobos,不难想到,这些过去... 继续阅读大数据将如何改变垂直电商?

    :
    2018-03-24