更多课程 选择中心

Java培训
达内IT学院

400-111-8989

关于Java应用程序数据的强度

  • 发布:Java培训
  • 来源:Java教程
  • 时间:2020-09-11 16:18

1、WikipediaSearch。一部大众百科全书应该运行在开源软件上,并且具有一个由Java驱动的搜索引擎,这是再合适不过的了。Lucene是由DougCutting于1999年编写,并以他妻子的中间名命名的,它实际上是Cutting开发的第五个搜索引擎。他作为工程师先后为XeroxPARC(施乐帕克研究中心)、Apple和Excite创建了其他的引擎。2014年,Wikipedia用Elasticsearch代替了Lucene引擎,Elasticsearch是一个分布式的、支持REST的搜索引擎,也是用Java编写的。

2、Hadoop。Lucene并不是唯一一个进入我们这个榜单的Cutting创建的作品。2003年,Google在一篇研究论文中描述了在大型商用计算机集群上处理数据的MapReduce算法,受该论文的启发,Cutting用Java编写了一个MapReduce操作开源框架,并以他儿子的玩具大象命名,称为Hadoop。Hadoop1.0于2006年发布,催生了大数据趋势,并激发了许多公司开始收集“数据湖”(datalakes),制定挖掘“数据排放”(dataexhaust)的策略,并将数据描述为“新石油”(thenewoil)。到2008年,Yahoo(当时的Cutting曾在该公司工作)宣称他们的SearchWebmap运行在10,000个内核的Linux群集上,是现有的最大的产线Hadoop应用程序。到2012年,Facebook声称在全球最大的Hadoop集群上拥有超过100PB的数据。

3、并行图形分析(ParallelGraphAnalytiX,PGX)。图形分析是有关理解数据中的关系和连接的。根据基准测试,PGX是世界上速度最快的图形分析引擎之一。PGX是用Java编写的,由OracleLabs研究员SungpackHong领导的团队于2014年首次发布,PGX允许用户加载图形数据并运行分析算法,比如,社区发现(CommunityDetection)、聚类、路径查找、页面排名、影响因素分析、异常检测、路径分析和模式匹配等算法。在健康、安全、零售和金融领域,它的用例比比皆是。

4、H2O.ai。机器学习(ML)的曲线非常陡峭,这可能会阻止领域专家实现伟大的ML想法。自动化ML(AutoML)可以通过推断ML流程中的某些步骤(例如特征工程、模型训练和调整以及转译等)来提供一些帮助。由Java冠军CliffClick创建的基于Java的开源H2O.ai平台,旨在实现AI的大众化,并能为那些刚入门的人们充当虚拟数据科学家,同时能帮助ML专家提高效率。

免责声明:内容来源于公开网络,若涉及侵权联系尽快删除!

预约申请免费试听课

填写下面表单即可预约申请免费试听!怕钱不够?可就业挣钱后再付学费! 怕学不会?助教全程陪读,随时解惑!担心就业?一地学习,可全国推荐就业!

上一篇:关于Java应用程序最后的边界
下一篇:Java类加载的过程概述
Java程序员学习路线指南

Java程序员学习路线指南

Java培训中的基础知识

Java培训中的基础知识

掌握6条技能快速Java入门

掌握6条技能快速Java入门

如何学习Java的三大框架?

如何学习Java的三大框架?

选择城市和中心
贵州省

福建省

  • 达内厦门软件园中心
广西省

海南省