【发布日期】2016-05-31 【来源】经管之家
当前社会经历的过程就是数据化的过程,并且衣食住行都在逐步数据化。服装品牌公司为了描述自己的服装而花费巨大,设计师、模特、灯光、摄影、后期处理、文案表述、数据库、反馈下信息等等。人们出行需要依赖数据表达的地图,寻找餐馆银行需要依靠数据建立的地图模型。公司决定策略需要详尽的市场描述,收集巨量的数据模拟的模型。借助于物联网以及个人设备;数据已经成为一种常态出现在生活中,或许很多人没意识到而已。而意识到的人就在努力掘金。
近年来,很少有IT细分市场可以像大数据市场一样吸引企业家的关注。如今,商业和消费者正在产生TB乃至PB级数据,大量公司也加大了研发,致力于收集、存储、管理、分析数据。
以下是2014年大数据领域格外瞩目的十家新兴大数据创业公司。
1. Aerospike
Aerospkie创建于2009年,总部位于加州山景城。该公司研发了一组用于高性能应用的、实时的、闪存优化的NoSQL数据库。内存数据库满足可靠事务处理的ACID(原子性、一致性、隔离性、持久性)需求。Forensiq是一家提供在线广告诈骗检测服务的公司,11月Forensiq宣称其每个月需要用Aerospike提供的数据库处理1万亿次请求。年初Aerospike获得2000万美金的C轮融资。11月,Aerospike对数据库性能进行了优化,提升了存储能力,并进行了新功能和Hadoop的整合。
2. Altiscale
Hadoop在2014年很火,但是其大数据平台仍然十分复杂,并且很难用。这也是Altiscale和它的Hadoop服务引人注目的原因。Altiscale的服务主要目的是解决Hadoop的抽象性与复杂性,为工程师搭建一个完整的Hadoop环境,并且对其进行维护与管理,让用户可以更专注于他们的数据与应用。当客户的需求发生变化的时,Altiscale也会做出相应的调整与变化。他还可以将Apache Hadoop加上业务支持作为云服务进行交付。
Altiscale,总部位于加州Palo Alto,成立于2012年。今年10月这家公司开始提供Hadoop上的SQL服务,这使得可以通过使用SQL用户接口或API访问Hadoop数据。
Altiscale的高层包括CEO Raymie Stata和CTO David Chaiken都来自雅虎,雅虎也是Hadoop的发源地。这些人知道他们自己在做什么。这个月初Altiscale获得了3000万美元的二轮融资。
3. Databricks
2014年,Apache Spark是大数据领域最火的技术之一,它是一款可以像Hadoop一样提高大数据系统性能的内存数据处理引擎。这个开源软件来自加州伯克利大学的一个项目。
Databricks提供了一个基于Spark的平台(该平台发布于六月),用于处理数据转换、探测、分析等大数据任务。2013年成立的Databricks公司不是一家以开源技术为噱头的创业公司。DatabrickCEOIon Stoica(加州伯克利大学的计算机科学的教授)和CTO Matei Zaharia创建了Spark,他们借助大数据一站式服务软件将他们的专业技术发挥的淋漓尽致。
4. DataStax
DataStax是下一代数据库市场的另一个引领者,该公司支持Apache Cassandra。Apache Cassandra是高扩展性、容错的NoSQL数据库,思科、eBay和Twitter都在使用这种数据库。
DataStax销售DataStax企业版,这是商化版本的Cassandra,还销售支持该平台的工具和服务。这个月初,公司推出了DSE4.6,其具备新的Spark流分析性能,这表明该公司开始涉足物联网。
DataStax成立于2010年,总部位于加州圣克拉拉,在9月的E轮融资中获得惊人的1亿600万美元的融资,当下总计获得1.9亿美元融资。
5. DataTorrent
DataTorrent是帮助用户即时处理、监控、分析数据的企业级实时流分析平台。该公司声称基于Hadoop的DataTorrent RTS系统每秒可以执行数亿次、甚至十亿次处理。
当今,很多行业在大数据领域面临的一大挑战是延迟——如处理类似事务的流数据。DataTorrent的联合创始人兼CEO Phu Hoang曾在雅虎领导Hadoop的研发,也看到了类似Data Torrent RTS类产品的发展机会。这家在圣克拉拉的创业公司成立于2012,在该年6月发布了DataTorrent RTS,10月发布了RTS 2.0。
6. Qubole
基于Haddop的Qubole数据服务是一个云平台,企业可以用该平台存储和管理大量的结构化和非结构化数据,且可执行数据分析和一些其它任务。你可能说Qubole很自恋:公司注重于使自己的平台尽可能随着规模及其他内置管理性能进行自管理;此外,友好的用户交互自服务和数据整合功能都不需要数据科学家或程序员。
该公司CEO Ashish Thusoo与印度总裁Joydeep Sen Sarma在2012年一起创立了Qubole。先前他们共同管理Facebook的数据基础建设团队,负责大数据处理,之后他们共同参与了Hadoop的Apache Hive数据仓储基础建设项目。月初,这家公司在B轮融资获得1300万美元融资。
7. Snowflake Computing
Snowflake Computing于10月悄然出现,推出了基于云的数据仓储服务,其服务定位是成为复杂、昂贵本地数据仓库系统的替代者,旨在实现灵活和易于管理等特性。Snowflake的Elatic数据仓储目前还是测试版,在未来将很有可能替代亚马逊网络服务Redshift和Google的Big Query。
CEO Bob Muglia说:“Snowflake的Elastic数据仓储服务相较于本地数据仓储可以节省90%的成本,而且比竞争者AWS和Google的产品更易于使用。Snowflake Computing目前研发的数据库系统既可以处理结构化和半结构化的数据”。
8. SumAll
SumAll认为不仅大企业需要大数据分析,中小型也需要。这家在纽约的初创公司为企业提供了一个可以收集企业电子商务、邮件市场、社交媒体、广告系统(如谷歌的AdWords)上的数据并在一个互动可视化界面进行展示的在线分析平台。
SumAll成立于2011年,侧重于产品的易用性,其产品不仅销往大企业,也销往中小型企业。该公司网站的统计数据显示,公司拥有23.3万的SumAll用户,获得1400万美元融资,雇员平均年龄32.6岁,每年消费22桶啤酒。
9. Tamr
大数据的一个问题是数据太大了,大数据通常有很多不同的数据源,而且这些数据源一直在变换。
Tamr公司的软件通过机器学习技术为这些数据源提供单一视角,同时为企业提供一个完整的数据资产库存并寻找分布数据集之间的联系。该公司的技术最早来自MIT的计算机与人工智能实验室。
2013年,数据库专家Michael Stonebraker、行业资深专家Andy Palmer和Ihab Ilyas共同创建了Tamr,今年5月,公司正式运行。同时,这家基于剑桥和麻省的公司筹集了1600万美元的风险投资。
10. WibiDat
大家都很了解亚马逊可以为商户提供定制化的体验。位于旧金山的WibiData创建于2010年,研制了一款可提供类似服务的实时应用。
该公司的Wibi企业平台使用先进的分析技术给消费者提供推荐、定制化的内容和相关搜索结果。该平台基于一组开源Apache技术,其中包括Hadoop、HBase和Cassandra,也包括用于实时收集、分析、服务数据的Kiji开源框架。年初该公司发布了WibiRetail,该应用是公司为零售商提供的首个“开箱即用”的应用。投资人包括谷歌董事长Eric Schmidt和Cloudera创始人Mike Olson。
|