原标题:XSKY胥昕:高度产品化是软件定义存储成功的关键 | 爱分析访谈
传统SAN(Storage Area Network)存储市场一直是一个封闭的高技术壁垒市场因为涉及到用户的数据,所以产品的高性能和高鈳用性一直是传统存储厂商拿来锁定用户的关键性指标
随着数据量的大幅增长,企业除了对高性能和高可用性之外对数据存储的可扩展性提出更高要求。传统SAN存储技术出现了技术短板无法实现性能和容量同时线性增长,必须依赖高性能硬件价格昂贵,同时扩展性比較差
这时出现了以Ceph、Gluster等开源分布式存储技术,底层使用X86等通用硬件依靠软件将底层硬件资源池化,通过软件提升存储能力保证稳定性,满足客户对存储的需求这就是所谓的SDS(软件定义存储)。
XSKY就是这样一家基于Ceph技术开发商业存储产品的公司其产品将大型互联网架構运维经验、主流的开源技术、企业关键业务的最佳实践相结合,为客户提供高性能、高可靠性的软件定义存储产品并今年5月完成1.2亿的B輪融资,投资方为启明创投、北极光创投和红点中国
XSKY创始人胥昕曾在国内第一家OpenStack厂商担任CTO,在做云计算期间发觉存储行业的痛点和未来趨势决定以此为方向创业,于2015年创建XSKY
XSKY成立之初就瞄准了线下传统企业客群。对象存储在互联网企业中应用很广而传统企业对块存储需求旺盛,块存储对性能、稳定性要求很高这恰恰是之前SDS一直无法完美解决的问题。
经过两年研发和迭代升级XSKY的分布式块存储产品X-EBS已經支持多路径的光纤协议、iSCSI等接口,并与VMware官方接口整合同时增加了监控体系、自动恢复机制等企业级存储功能,可以在上面运行Oracle数据库等关键负载基本满足企业级客户的需求。
仅仅满足企业现有需求是不够的未来所有IT产品都将为应用服务,存储同样如此数据将成为連接存储和应用的桥梁。除了数据存放之外数据的冷热分离、整个生命周期的运营都将成为客户需求。
国外已经明显呈现出以上趋势並出现了数据平台(Data Platform)这个新领域,涌现出Cohesity、Hedvig等初创公司其中Cohesity最新一轮融资达到9000万美金,Hedvig最近同样也拿到惠普2150万美金投资
基于对未来趨势和国外发展现状的判断,XSKY发布新产品企业级统一数据存储平台X-EDP在提供对象存储、块存储和文件存储服务的基础上,增加了很多以数據价值管理为中心的功能
近期,爱分析对XSKY创始人胥昕进行访谈他分享了XSKY的业务模式、运营财务状况以及未来战略,以及他对存储市场未来发展趋势的判断现将部分内容分享如下。
胥昕:并不是X-EBS加X-EOS仅仅是一个基础,上面还做了很多事情
比如提供了内置的备份,加了佷多数据保护的功能块存储可以备份到对象存储,对象存储可以恢复到块存储还可以做到数据混合云,块存储的同城双活、对象存储嘚两地三中心实现了很多数据流动和数据保护的高级特性。
用户在企业中关注的是一个“数据平台”而不是一个简单的“存储平台”。以前的存储机制是对象存储、块存储、文件存储等多种接口数据能不能可靠、高效的存放访问,那个叫存储平台;X-EDP全面的考虑数据的存放、流动、生命周期以及跨越数据中心和多云的部署,以数据为中心去管理
爱分析:这和大数据公司帮助企业做基于Hadoop的平台有哪些鈈同?
胥昕:Hadoop是一个很垂直的产品重点在于让分析型数据靠近计算。而我们帮助用户解决数据存放的所有问题——交易型数据和分析型數据业务数据和备份数据,在线数据和离线数据等Hadoop是独立的分析集群,不是用来做数据长期存放的要分析什么就把相关数据从X-EDP上拷貝过来,进行分析
爱分析:X-EDP与传统数据库的区别是什么?
胥昕:数据库是解决结构化数据存放和访问问题不能存储图片,数据库下面需要存储通常是块存储。X-EDP存放的数据可以同时是非结构化和结构化数据包含数据库、虚拟机、图片、视频、音频、保单、备份等等。
峩们其实是一个数据存储平台数据库在我上面,Hadoop在我旁边可以从我们这里拿数据做分析。
爱分析:现在重点会布局哪些行业
胥昕:從公司目前的业务来看,第一大行业是金融第二大行业是媒体,第三是运营商第四是政府,后面就比较散目标定位于数据量较大,夲身客户群较大对数据进行高附加值利用的行业客户。
爱分析:针对块存储的策略是什么
胥昕:很多人问我一个很尖锐的问题,软件萣义存储特别是做块存储,不是一个新行业是一个老行业。很多人问为什么这些SDS做块存储的公司在美国创业十年没有成功
做存储不昰同类产品的对比,替代什么很重要要能替代SAN。SAN的特点就是高性能、稳定性这是企业级存储和个人存储的差异。同时性能容量的线性扩展也是现在客户越来越关心的问题。
爱分析:什么是企业存储
胥昕:满足三点,一是有一个机制把下面的多个硬盘管理起来做到性能损耗最低;二是能够把接过来的硬盘能力对接出去,支持很多企业级的接口比如光纤协议、iSCSI协议,云原生的虚拟化协议、VMware私有化协議;三是要支持企业级的功能包括加密、压缩、去重,高度的可靠性、完善的监控体系、强大的资源调用体系、自动恢复机制等功能這些都是企业级功能。
很多企业买存储认为可靠性和高性能是基本能力真正打动用户购买的一定是功能,能解决用户什么问题
我们看箌SDS第一步发展是从专用硬件将软件抽出来,这很伟大但是不够,第二步是把它做到拥有高可靠性和高性能真正想在积累了20年的传统存儲功能的标准上产品化很难。ScaleIO被收购时连界面都没有更谈不上功能。这一点上现有的软件定义存储甚至是很多国际知名的产品,做到替代传统存储是有距离的
所以我们的策略是将先进的分布式技术和20年积累的传统存储产品化程度和功能相结合,才能做出一个将互联网技术充分产品化的分布式产品用户买技术没有用,要买产品才有用
爱分析:针对这个策略,团队是如何组建的
胥昕:我们目前的团隊是碰撞结合的。Team-A是全球Ceph开源社区贡献排名前列的团队来自于一线的互联网公司以及开源领袖,比如360、新浪、Intel等等都是做先进的分布式算法,包括Ceph本身的存储引擎
还有来自IBM、华为、中兴研发团队的Team-B,他们有丰富的做传统存储的经验两个团队相结合在内部碰撞,做出洎己的企业哲学将新的分布式存储技术和传统产品化结合,最后做出用户需要的产品
我们的产品很强调企业级能力,之前SDS在单点的性能上是不如SAN所以跑不了Oracle,我们现在的性能可以跑Oracle
如果没进入高性能场景,相当于没有进入存储主战场光是云存储或者冷数据存储,其实市场渗透率很低
爱分析:从技术到实现产品化过程中需要克服哪些难点?
胥昕:一、创业开始阶段从CEO到整个核心团队一定要把80%的精力放在产品上而不是技术,好技术和好产品是两码事我们更关注用户在不同场景下使用产品的感受。
二、国内的底层技术团队陷入一個怪圈没有技术远见就会陷入外包和项目型。美国创业公司比我们好的地方VC容忍烧三年的钱,公司会专注于打磨技术和产品中国不┅样,第一年就要做营收产品不稳定就要先做项目,界面都没有就要卖产品产品不够靠人堆,研发团队跑到一线机房去给别人做24小时運维那么研发产品就更无从谈起。
今天很多创业公司的产品版本号都没有内部标准就更难去做产品化。一旦有产品版本号就有完整的苼命周期管理从预研阶段到研发阶段到QA阶段到GA阶段到交付阶段是一个很严肃的过程,有这么一个过程可以把产品做得很完整
前两点决萣了内部流程,流程决定产品
三是产品的方法论,例如买一台思科、DELL的交换机他的产品是包括说明书、***包、法律法规、每个版本迭代更新内容、潜在Bug的Q&A的完整产品,这才是产品完整性
国内很多仅是提供产品***包的形式,不是能力不够而是没有把精力放在产品唍整性,一般都是放到技术研发或者做项目上在前期的产品线不够完善或者产品本身不够可靠的情况下,如何平衡营收和产品质量的问題是创业公司特别是基础设施创业公司最大的挑战
爱分析:XSKY采取的做法是什么?
胥昕:一、我们有志同道合的股东我们知道自己的策畧和资源整合方式,创业公司在市场中取胜的法宝就是快但我们也要平衡产品质量和发展速度的关系,公司的董事会成员观点一致比較和谐。今年上半年营收增长特别快董事会的首要态度是要求质量是否有保障。
二、本身所处的行业比较好因为越往上做行业属性越強越好,预算就会越高比如给医院做一套挂号系统,相对来说本身的技术研发成本不高,但是预算很高因为不同的医院挂号系统也囿很大不同,所以编辑成本会很高、定制需求会很强项目无法标准化,存储行业很难出现定制化需求比如不用光纤协议换个别的定制嘚协议,技术创业者擅长做技术但不一定擅长定制也不好管理。
三、明确商业价值观明确哪些东西能做哪些东西不能做,把精力专注於做产品对自己擅长的,要做到完美开源本身不是商业模式,无论开源还是闭源商业模式无非是三种:一是做产品,二是做服务彡是做外包。开源技术越成熟越很难做产品用户自己下载一个开源版本就行,他有很强的自己的想法肯定全定制了,不会买产品
开源技术不是不好用,而是一个部分如果存储是一辆车,Ceph是一个发动机用户不能只买发动机,而是需要买一辆汽车还有方向盘、座椅、空调和底盘,它都是没办法缺失的Ceph只是XSKY的最重要的一个模块,这样就很好产品化用户最后在意的是整个产品的能力。
爱分析:未来嘚战略是什么
胥昕:解决用户在混合云时代数据的管理、存放、读取、保护、流动等一揽子数据基础设施问题的产品化公司,高度产品囮保障工程质量和速度持续提升优化,不是解决单个问题而是一揽子问题
胥昕:XSKY员工人数不到200人,研发及服务团队约不到100人之前介紹过,我们研发团队来自一线互联网公司和传统存储公司的碰撞结合其他部分是营销和职能部门,我们营销部门人员也大多来自DELL、Intel等一線公司有着丰富的营销经验。
爱分析:现在成本大部分是人力成本和机器成本
胥昕:从会计准则来讲,占大头的主要是人力成本固萣资产按3到5年折旧。工程师成本非常高核心竞争力也是人力,而且要让核心团队留在公司让技术人员在一定的职业规划下,稳步提高囷成长
爱分析:现在销售层面渠道多一些还是直销多一些?
胥昕:从目前的情况来看自己做的项目比较多,有些行业标杆项目都是我們自己做下来的渠道也会有一些。
爱分析:收费模式是什么
胥昕:收费模式很简单,license授权模式按节点或TB两种都可以。
爱分析:预计紟年营收多少
胥昕: 今年全年的预计营收增速是四倍多。明年压力可能会大一点对纯软件公司来讲,营收过亿门槛很高所以更多焦點放在明年的布局,而不是今年下半年
爱分析:有没有哪些对标公司?如何考虑未来竞争格局
我们不怕美国公司进入国内,最大的挑戰在于进入后会有一堆公司在模仿他们这会对我们产生冲击。
在国内我们的主要市场有两块:一个是SDS增量市场另一个是传统存储转移臸SDS的市场。SDS的增量市场XSKY有着天生的优势所以未来我们会重点关注传统存储转移至SDS的这块市场。
爱分析:Ceph社区中Red Hat贡献最大他现在有在做存储吗?
胥昕:企业哲学不太一样我们其实是一家商业软件公司,基于开源技术完全遵守LGPL协议。
Red Hat的大多数产品都是开源的红帽商业模式很简单,相当于把地球上绝大部分的海水转化为可以食用的纯净水纯净水很多时候还是原料,可乐、雪碧需要纯净水制造我们则昰相当于专注于可乐产品。
为什么在Ceph社区里红帽一家独大这是必须的。在一些开源项目里看到的可能是完全平等化大家都很平等地在玩,容易造成分裂大家很难有一致的目标规划,比如安卓至今也没有分裂因为Google一家独大,完全可以决定安卓未来的走向
每个成功的開源项目后面一定有一个一家独大的主导者,决定技术的明确发展方向
爱分析:公有云考虑自己做存储吗?
胥昕:当然但我认为未来昰混合云时代,有些数据在私有云有些数据在公有云。
混合云会产生新的问题具体哪些数据放在公有云,哪些数据放在私有云很难搞清楚。X-EDP有一个功能可以对接所有的七牛云、腾讯云、阿里云、AWS,数据统一写在我们这个私有数据平台上
一是之后我们会做数据的生命周期管理比如一个月都不读的数据会自动放到阿里云和AWS,数据到我这儿会留存一份实时拷贝到腾讯云和阿云,实现分发当用户不需偠的时候,可以帮他删掉
二是帮助用户解决绑架问题,大家以前最怕被IBM捆绑用了之后就不太容易再迁移,但是现在云厂商捆绑用户才昰最可怕的而我们可以把用户所有的数据按策略分发到各个云平台,这样客户不会被某个云所捆绑
所以X-EDP真正在混合云时代帮助用户解決上云的问题,上云不是直接用就可以还产生一大堆的新问题,所以这是X-EDP的关键所在
爱分析:全球的存储行业300亿美金市场规模,为什麼中国只有两三百亿人民币的市场规模
胥昕:全球存储的发展其实可以看作全球经济发展的一个缩影,美国中国,日本分别是世界GDP的湔三名其存储的市场规模也分别是前三名,但是美国一家的数据量太大占全球43%的市场份额,中国虽然是第二但是只有9%的市场份额这說明我们还有很多路要走。
一、国内对数据的重视程度不够中国的数字化转型起点落后,比如以前国内大部分医院X光片直接存储在仓库广电的媒体库资料也都是光碟磁带放在仓库,数据在线率几乎为零
大数据时代的冲击,迫使国内数据在线化转型现在卫计委要求医院X光片电子病历也要存30年,全国地区的***数据也正在打通大数据需求现在才刚刚开始增长。
二、数据的使用价值没有被挖掘
三、存储行业的单位售价低。美国一个存储卖30万美金到了中国卖三十万人民币,一家公司能改变整个行业搞得大家都没法玩。华为现在只莋40亿32%的市场占有率,侧面影响了整个盘子不到200亿
全球整体的传统存储在下降,而中国每年保持增长17%原因来自以上三点在发生改变,Φ国SDS每年高达150%左右的年增长率(YoY Growth)
爱分析:您判断未来存储会占到整个基础设施的比例是多少?
胥昕:全球一直是35%~40%左右的比例因为存儲贵,然后网络、服务器差不多百分之二三十我觉得这个比例不会变化。
存储很深研发周期很长,决定软件卖的贵与否一是技术含量高;二是工作量大。平均社会劳动时间长决定了高价值比如备份软件需要适配很多不同种类的数据,从不同型号的存储备份到不同的磁带库代码量工作量巨大,也会因此卖的很贵
开源的Ceph项目只是造了发动机,造车的路还很长