首页 > 精品范文库 > 7号文库
阿里价值观
编辑:梦回唐朝 识别码:16-981783 7号文库 发布时间: 2024-04-30 18:01:27 来源:网络

第一篇:阿里价值观

客户第一共享共担,平凡人做非凡事

1分:积极融入团队,乐于接受同事的帮助,配合团队完成工作——基本

2分:决策前积极发表建设性意见,充分参与团队讨论;决策后,无论个人是否有异议,必须从言行上完全予以支持——执行

3分:积极主动分享业务知识和经验;主动给予同事必要的帮助;善于利用团队的力量解决问题和困难 ——主动

4分:善于和不同类型的同事合作,不将个人喜好带入工作,充分体现“对事不对人”的原则——水准 5分:有主人翁意识,积极正面地影响团队,改善团队士气和氛围——带动

拥抱变化诚实正直,言行坦荡

1分:诚实正直,表里如一——准则

2分:通过正确的渠道和流程,准确表达自己的观点;表达批评意见的同时能提出相应建议,直言有讳 ——建议

3分:不传播未经证实的消息,不背后不负责任地议论事和人,并能正面引导,对于任何意见和反馈“有则改之,无则加勉”——不负面,能引导

4分:勇于承认错误,敢于承担责任,并及时改正——承担责任

5分:对损害公司利益的不诚信行为正确有效地制止——主人翁

激情专业执着,精益求精

1分:今天的事不推到明天,上班时间只做与工作有关的事情——基本

2分:遵循必要的工作流程,没有因工作失职而造成的重复错误 ——克尽职守

3分:持续学习,自我完善,做事情充分体现以结果为导向——结果

4分:能根据轻重缓急来正确安排工作优先级,做正确的事——效率

5分:遵循但不拘泥于工作流程,化繁为简,用较小的投入获得较大的工作成果——成果

第二篇:阿里

1、数据库范式

a)1NF:属性不可分割成更小部分

b)2NF:每个非主属性完全依赖于R的某个候选集 c)3NF:非主属性不传递依赖R的候选集 d)BCNF:每个属性不传递依赖R的候选集

2、垃圾收集

Java使用垃圾收集器的技术监视Java程序,当对象不再使用的时候,就自动释放对象所使用的内存。垃圾收集器是自动运行的,一般情况下无须显示的请求垃圾收集器,程序运行时,垃圾收集器会不时检查对象的各个引用,并回收无引用对象所占的内存。可以使用静态方法gc进行垃圾回收,但不能保证立即回收。(引用为0的时候就是标记,引用次数。)

3、抽象方法不能被那些关键字修饰

final,private,static,protected(无法访问)

4、堆栈区别

堆是运行时数据区,类的对象从中分配空间,不需要程序员显式的释放,堆有垃圾回收负责。优势可以动态分布。缺点运行时分配内存,存取速度慢。

栈的优势存取速度比堆快,数据可以共存,但缺乏灵活性。栈中只能存放一些基本的数据类型变量

5、Hasptable和hashmap区别

Hashmap没有分类或排序,允许键值为null Hashtabl不允许键值为空,是同步的,执行速度比较慢

Hashtable的方法是synchronize,而hashmap不是,因此多线程要用hashtable

6、Hashmap如何实现同步的

Hashtable中的方法是同步的,而HashMap中的方法在缺省情况下是非同步的。即是说,在多线程应用程序中,不用专门的操作就安全地可以使用Hashtable了;而对于HashMap,则需要额外的同步机制。但HashMap的同步问题可通过Collections的一个静态方法得到解决:

Map Collections.synchronizedMap(Map m)这个方法返回一个同步的Map,这个Map封装了底层的HashMap的所有方法,使得底层的HashMap即使是在多线程的环境中也是安全的。

7、Hashmap如何实现

一个是数组,另外一个是模拟指针(引用),所有的数据结构都可以用这两个基本结构来构造的,HashMap也不例外。HashMap实际上是一个“链表散列”的数据结构,即数组和链表的结合体。

从上图中可以看出,HashMap底层就是一个数组结构,数组中的每一项又是一个链表。当新建一个HashMap的时候,就会初始化一个数组。Table的每一项是Entry。

Entry就是数组中的元素,每个 Map.Entry 其实就是一个key-value对,它持有一个指向下一个元素的引用,这就构成了链表。当我们往HashMap中put元素的时候,先根据key的hashCode重新计算hash值,根据hash值得到这个元素在数组中的位置(即下标),如果数组该位置上已经存放有其他元素了,那么在这个位置上的元素将以链表的形式存放,新加入的放在链头,最先加入的放在链尾。如果数组该位置上没有元素,就直接将该元素放到此数组中的该位置上。

8、Wait和sleep方法

sleep来自Thread类,和wait来自Object类

sleep是Thread的静态类方法,谁调用的谁去睡觉,即使在a线程里调用了b的sleep方法,实际上还是a去睡觉,要让b线程睡觉要在b的代码中调用sleep 最主要是sleep方法没有释放锁,而wait方法释放了锁,使得其他线程可以使用同步控制块或者方法。

sleep不出让系统资源;wait是进入线程等待池等待,出让系统资源,其他线程可以占用CPU。一般wait不会加时间限制,因为如果wait线程的运行资源不够,再出来也没用,要等待其他线程调用notify/notifyAll唤醒等待池中的所有线程,才会进入就绪队列等待OS分配系统资源。sleep(milliseconds)可以用时间指定使它自动唤醒过来,如果时间不到只能调用interrupt()强行打断。Thread.Sleep(0)的作用是“触发操作系统立刻重新进行一次CPU竞争”。

使用范围:wait,notify和notifyAll只能在同步控制方法或者同步控制块里面使用,而sleep可以在任何地方使用

synchronized(x){

x.notify()

//或者wait()

} sleep必须捕获异常,而wait,notify和notifyAll不需要捕获异常

9、Synchronized同步的方法 wait方法:

该方法属于Object的方法,wait方法的作用是使得当前调用wait方法所在部分(代码块)的线程停止执行,并释放当前获得的调用wait所在的代码块的锁,并在其他线程调用notify或者notifyAll方法时恢复到竞争锁状态(一旦获得锁就恢复执行)。

调用wait方法需要注意几点:

第一点:wait被调用的时候必须在拥有锁(即synchronized修饰的)的代码块中。

第二点:恢复执行后,从wait的下一条语句开始执行,因而wait方法总是应当在while循环中调用,以免出现恢复执行后继续执行的条件不满足却继续执行的情况。

第三点:若wait方法参数中带时间,则除了notify和notifyAll被调用能激活处于wait状态(等待状态)的线程进入锁竞争外,在其他线程中interrupt它或者参数时间到了之后,该线程也将被激活到竞争状态。

第四点:wait方法被调用的线程必须获得之前执行到wait时释放掉的锁重新获得才能够恢复执行。notify方法和notifyAll方法:

notify方法通知调用了wait方法,但是尚未激活的一个线程进入线程调度队列(即进入锁竞争),注意不是立即执行。并且具体是哪一个线程不能保证。另外一点就是被唤醒的这个线程一定是在等待wait所释放的锁。

notifyAll方法则唤醒所有调用了wait方法,尚未激活的进程进入竞争队列。synchronized关键字:

第一点:synchronized用来标识一个普通方法时,表示一个线程要执行该方法,必须取得该方法所在的对象的锁。

第二点:synchronized用来标识一个静态方法时,表示一个线程要执行该方法,必须获得该方法所在的类的类锁。

第三点:synchronized修饰一个代码块。类似这样:synchronized(obj){ //code....}。表示一个线程要执行该代码块,必须获得obj的锁。这样做的目的是减小锁的粒度,保证当不同块所需的锁不冲突时不用对整个对象加锁。利用零长度的byte数组对象做obj非常经济。

10、Session和cookie

11、http1.0和http1.1 HTTP 1.0 规定浏览器与服务器只保持短暂的连接,浏览器的每次请求都需要与服务器建立一个 TCP 连接,服务器完成请求处理后立即断开 TCP 连接,服务器不跟踪每个客户也不记录过去的请求。

HTTP 1.1 支持持久连接,在一个 TCP 连接上可以传送多个 HTTP 请求和响应,减少了建立和关闭连接的消耗和延迟

HTTP 1.1 还允许客户端不用等待上一次请求结果返回,就可以发出下一次请求,但服务器端必须按照接收到客户端请求的先后顺序依次回送响应结果,以保证客户端能够区分出每次请求的响应内容,这样也显著地减少了整个下载过程所需要的时间。HTTP 1.0 不支持 Host 请求头字段

HTTP 1.1 中增加 Host 请求头字段后,WEB 浏览器可以使用主机头名来明确表示要访问服务器上的哪个 WEB 站点,这才实现了在一台 WEB 服务器上可以在同一个 IP 地址和端口号上使用不同的主机名来创建多个虚拟 WEB 站点。

HTTP 1.1 还提供了与身份认证、状态管理和 Cache 缓存等机制相关的请求头和响应头。

12、项目难点

13、系统架构

14、数据库设计15、3个词形容自己的优缺点

第三篇:阿里木

阿里木·哈力克,新疆维吾尔族,1971年生,新疆维吾尔自治区库尔勒市和静县人。1989年在新疆石河子某部服役,1992年退伍后,在当地供销社工作。1997年供销社破产后,阿里木离开新疆走南闯北,靠卖每根仅有3毛左右利润的羊肉串谋生。202_年,阿里木来到毕节。202_年毕节学院设立阿里木助学金。烤羊肉串的慈善家,贵州省第二届“助人为乐”道德模范。

8年来,阿里木卖出30多万串羊肉串攒下的10多万元,全部捐献出来资助了上百名贫困学生。很多网友被他的故事所感动,亲切地称他为:烤羊肉的“慈善家”。

202_年12月,新华社发起“中国网事·感动202_”网络人物评选活动。28日,新疆维吾尔自治区党委书记张春贤在网上为阿里木投票,并号召网民力挺阿里木。此后,阿里木的得票数节节攀升,最终获得了245050张选票。

202_年1月13日,阿里木等10位草根英雄从60多名候选人中脱颖而出,当选新华社“中国网事 感动202_”网络人物,并在北京参加盛大的颁奖典礼。

202_年1月25日,新疆维吾尔自治区团委十一届四次全委(扩大)会议召开。为弘扬社会新风正气,促进社会主义精神文明建设,大力宣传阿里木江·哈里克的先进事迹,共青团新疆维吾尔自治区委员会、新疆维吾尔自治区青年联合会决定授予阿里木江·哈里克同志“新疆青年五四奖章”荣誉称号。

编辑本段经历

阿里木是个快乐的卖烤羊肉串的新疆人。

毕节学院202_年阿里木助学金颁发现场

[1]

8年前,他流浪到了贵州省毕节市(一个县级市),一下车,哇,那么多背箩筐的人,显然这里太穷了!他很开心,立刻决定在这里落脚烤羊肉串:一定没有人跟我竞争!

阿里木的生意从不好到火得不得了,羊肉串好吃,风趣善良的阿里木更可爱啊!毕节人爱上了他的烤羊肉串,也爱上了快乐开朗的阿里木。有一年春节,他一天卖了七千多块钱的羊肉串,居然赚了那么多钱!他那天高兴得不得了,那可是5毛钱一串的啊!

快乐的阿里木就这样靠烤羊肉串赚钱,从五毛钱一串卖到一块钱一串。赚的钱哪里去了?捐了,捐给贫困的孩子上学去了。小学、中学、大学,在那个穷得要命的毕节地区,哪里都有阿里木捐助的穷孩子。甚至,在贵州大学的外语系,都设有阿里木奖学金。

阿里木很有钱吗?不不不,他说:“我一个人也用不了那么多。”他在毕节租的房子一年就花1200元,他房里的全部家当不超过202_元,他每天的花销是多少呢?“10块钱左右吧,有肉,有菜,有面,很好了。”阿里木很满足地说。

辛辛苦苦赚那么点钱,不拿来让自己过上更好的生活,而是捐给穷孩子读书,这是为什么啊?哦,这可说来话长。阿里木会这样说。

他家里穷,父母没什么文化。他上到高中,无论如何上不下去学,于是当了三年兵。当兵回来做什么呢?唉,阿里木就喜欢烤羊肉串,到内地去闯闯做生意吧!人家劝他,哪有那么容易?去到一个地方,总会有自己的族人把他打出去的。

这是开玩笑吧,阿里木才不相信呢。

他到了西安,结果被自己的族人打跑了,谁让他抢生意的?他到了另一个地方,又被一帮人打跑了。这样一个城市又一个城市,走遍了半个中国,他总是遇到这样的事情。甚至在广西的时候,一些坏人拉他必须跟自己在一起,帮助小孩子偷、骗行人的东西,他们只要他带路就可以。

阿里木不同意,因为古兰经上说,如果吃肉是犯罪,跟着喝汤也是犯罪。为此他被绑在电风扇上折磨,被打伤了腿。

伤好之后他还是在全国各地流浪,他吃尽苦头,但还是不愿像那些打他的族人那样生活。他说,他们是没文化才那样的。他也恨自己没文化,自己要是当初好好读书,早就过上正常的生活了!

没文化自己过不好生活,没文化也会让别人过不好生活。阿里木因此觉得,不能因为穷,就不好好念书。于是他挣了钱之后,便去资助那些穷孩子。他唯一的要求,就是这些被他资助的学生,将来一定要回到贫困地区,告诉大家改变观念,要读书,要有文化。那样,对自己好,对别人好,对国家好。

阿里木忙的时候就快快乐乐地烤羊肉串,闲的时候就会想娶个老婆,要是能娶个穆斯林老婆,那就太好了!

他娶过老婆。他说,穆斯林不兴谈恋爱,都是介绍,一看中意便结婚。人家给他介绍的老婆长得不错,他高兴得马上就决定结婚了,心想终于有了老婆,这下我要好好对待她。

结果阿訇刚刚主持完婚礼,一个喝了很多酒的男人就来请新娘跳舞,新娘欣然与他搂着跳了。

这下阿里木可气坏了:穆斯林的婚礼上是不允许喝酒的,新娘也是不允许这样和别的男人跳舞的,这是个什么新娘!于是决定跟新娘说,我要离开你!

贵州人都笑阿里木,就这么点事你就要离婚么?你就不兴谈个恋爱接触接触再结婚?我们贵州妹子也挺好,干脆当地找个姑娘安家算了。

阿里木认真地说,那样的女人不能要。不谈恋爱。结婚就应该介绍,就算是像赌博,赌上个好老婆挺好的。毕节的姑娘不错,可是穆斯林“缺货”。受过穆斯林文化教育的人,就会明白,我们是很传统的。

阿里木的生活很简单,吃饭、睡觉、烤羊肉串、捐助穷学生。可他真是快乐啊!能吃上那么快乐幽默又善良的人烤出来的羊肉串,真觉得生活也变得美好!

他在毕节烤了8年的羊肉串,因为这里没有他那些没文化的穷同乡们再来打走他了。他也还不知道自己的下一站在哪里,他还在等着自己的穆斯林老婆呢。

可是他仍然那么开心地说:“到哪里,我都会带着自己勤劳的双手嘛!”

第四篇:阿里文化

阿里巴巴从不认为自己是一间科技公司,他们一直认为自己是一家服务型的企业。在阿里巴巴的实时成交显示屏上,马云口中的电商生态系统一目了然。在电商交易平台之下,阿里巴巴还搭建了电子商务交易最重要的前端和后端,即支付环节和物流系统。基于这三个平台所产生的轨迹,又衍生出对大数据的应用。

阿里巴巴集团绩效考核负责人贾老师分享了阿里巴巴如何对30000名员工进行绩效考核的方法论。他的思路是:绩效管理很简单,就是日常管理。

阿里是怎么做新人培训的?

新员工进入阿里之后,都会经历三个时期的培训。首先是入职后27天的专职培训,在这27天之内,新员工将接触到三大类培训,即文化制度类、产品知识类、技能心态类,这三者的课程比例分别是42%、28%、30%。

上岗后,新员工还将接受3-6个月的融入项目培训。一般而言,上岗第一天,新员工将会被介绍给团队成员,在一个月之内,还将安排团队聚餐。接下来,在一年之后、三年之后和五年之后都分别有不一样的培训内容。

阿里的人才观念坚信,很多小白兔其实是放错了位置的明星,因此在阿里人才培养中,最重要的一环便是轮岗。

阿里打造文化的五大工具

阿里巴巴在企业文化的打造上,主要运用五大工具。

第一,文化道具。阿里巴巴会借助一些“物语”来与员工的心连接,通过借物管心。比如,淘宝的所有员工都要学会倒立,淘宝希望员工能够在工作中换个角度看问题。

第二,传承布道。阿里认为,价值观的宣导和传递需要在企业内部形成一定的传播机制,员工不应是卫道士,而应该成为布道者。比如阿里对老员工的管理,一个值得注意的细节是,在阿里,只有五年以上的老员工才能佩戴橙色的工牌,这个工牌只针对工龄,跟职位并无关系,这是阿里给老员工的一种荣誉和尊敬,同时也是激励着老员工主动去传播企业文化。第三,制度与文化的协同。阿里认为,缺乏制度保障的文化是空洞的,缺乏文化支持的制度是乏力的。例如,当严重违规的人员被开除之后,阿里一般的做法是,在一定范围内为员工还原事情本来的真相,而不是让谣言继续传播。

第四,固定仪式。每年的5月10日,是阿里集团集体婚礼的日期,无论多忙,马云都会亲自来主持婚礼。事实上,5月10日对阿里有着重大意义,这一天是阿里战胜“非典”的日子。除了集体婚礼之外,这一天还是阿里开放日,在开放日,阿里员工可以家属一起上班,也可以带上自己的宠物一起到公司。更为有趣的是,202_年的员工大会,阿里的高管在马云的带领下集体演出了一个话剧—白雪公主,马云现在在网络上广为流传的剧照就是出自这场演出。

第五,故事传播。阿里的每一个管理都要成为故事的发现者、收集者和传播者。新员工入职之后,一般都会听到几个故事,有的是当年创业艰辛的,有的是努力工作的。除了讲述之外,阿里还会将自己员工的故事拍成视频,给其他员工做激励。

鼓励轮岗

在阿里巴巴的管理体系中,对人才是特别敏感的。阿里巴巴有一套自己的人才盘点体系,即30%是最有潜力的,60%是潜力一般的,10%是没有潜力的。

每位主管都要给自己的下属打分,并根据361原则对员工素质进行强制排序,这是阿里巴巴绩效管理中特别重要的一点,他们强调的是管理者的责任,就是让主管不断地关注下属。据贾老师介绍,这样的方法,能够让主管对下属的关注提高60%。

阿里巴巴人才管理中最为外界所知的一点是鼓励轮岗,这就意味着,一位员工的能力并不是一位主管说了算,而是多位主管共同评价的结果,这就让员工得到了相对公平的评价。阿里巴巴员工的盘点是随时进行的,主管可以每天对其员工进行评价,甚至可以记录下具体事件,而每换一次主管就会获得一次评价。

每年,阿里巴巴都会有20%的人被评为优秀员工,这个比例是有严格讲究的。贾老师坦言,一个企业的优秀员工,20%的比例是最适合的。这20%的员工将成为公司的正能量,这部分正能量又会影响着60%的人跟随过来。

同时,优秀员工和普通员工之间的收入设定了较大的差距,这个差距激励着60%的员工向前冲,整个人才体系形成一个逆流,不给不思进取的员工留下温床。此外,这个差距也激励着最优秀的那层员工不敢去作弊。

相反地,在贾老师看来,一个企业一旦有15%的员工是负能量,那么这个企业就会非常危险。负能量员工的比例一定要控制在10%以内,适时地干掉5%最负能量的员工。在阿里巴巴的每个业务部门,都相应地设立了“政委”这个角色,“政委”的主要任务就是传播阿里巴巴的价值观。员工的价值观在一定程度上决定了员工的工资、奖金以及晋升。阿里巴巴将员工的能力评价分为三层,包括价值观、专业能力和流程能力。其中,价值观的审核占据了基础能力的75%,其次是流程能力的15%,以及专业能力的10%。

相信员工

每天9点上班的阿里巴巴,电梯最拥挤的时段却出现在9点半到10点之间。在阿里巴巴,员工并不强制打卡,这就是为什么在上班时间在咖啡馆和健身房还能看到阿里员工的影子。“企业文化是习惯,企业文化最终是落实在行为当中的”,贾老师认为,“在企业管理中,硬的东西需要软的来管,而软的则需要硬的来管,文化是软的,行为是硬的”。正如马云推崇的太极运动,讲究的是阴阳调和。

或许在大多数人的观念里面,民营企业的企业文化大多数是由老板决定的,但在阿里巴巴的管理中,他们所遵循的是“企业文化体现在员工行为上,需要发挥群体的力量。”这就是为什么阿里巴巴集团的BBS已经成为了阿里最重要的文化阵地。

在阿里巴巴集团的管理文化中,很重要的一条是相信员工。公司对员工迟到并不敏感,包括简短的审核流程,背后就是对员工的信任。

更具体的做法是,阿里巴巴对加班的员工提供免费晚餐,但是享受免费晚餐并不需要上级的审核。当然,不需要审核的免费晚餐自然会有人蹭吃,当阿里巴巴的管理哲学是选择相信员工,“天天蹭吃又不加班,自然会有人说你”。另外一个不需要审核的福利是,只要怀孕的员工,每人可以领两件孕妇装。“企业文化落到实处就是相信员工,相信员工是很重要的企业文化。”

附:阿里人才管理秘籍

☑ 人才观

“人才可以培养出来的。”什么是“培”?“培”就是多关注他,但也不能天天去关注,因为一棵树,水多了死,水少了也死,如何关注也是艺术。什么是“养”?就是给他失败的机会,给他成功的机会,你要看着,不能让他伤筋动骨,不能让他一辈子喘不过气来。”——马云 ☑ 招聘战略

在阿里巴巴,价值观是决定一切的准绳,招什么样的人,怎样培养人,如何考核人,都坚决彻底地贯彻这一原则。☑ 员工培训战略

“一个公司要成长,主要取决于两样东西的成长。一是员工的成长,一个客户的成长。我们自己成立了阿里学院,主要目的也是培训员工,培训客户。"——马云 诠释企业对新员工进行入职培训的目的

新员工培训的策略--“五行拳”

☑ 马云的用人观

“阿里巴巴是靠团队打天下的,而不是靠个人英雄主义。”——马云

马云能认识到别人的长处,了解自己的不足和需要帮助的地方。互相弥补的心态很重要,否则会有怨气和冲突,这是组建团队的关键。

☑ 员工激励模型

激励对象最好是全体员工,使每一个员工都紧紧和公司捆绑在一起,特别是关键人才,更是要强调“我的就是你的,你的就是我的”,这样才能留住人才。☑ 员工管理

马云注重给员工提供一个良好的成长环境,一个广阔的成长空间,能让他们心甘情愿地留在自己的公司,为实现百年企业的梦想而共同奋斗。☑ 员工考核

优秀人才通常都希望自己的成果能得到别人尤其是上级领导的认可;而不努力的员工则是希望谁也不知道。留住好的优秀员工,淘汰差的员工,绩效考核是很有效的方法。良好的绩效评估系统,可以使企业甄别出优秀的人才,并因此使双方都大大受惠。☑ 培训企业“干部”

一个企业发展到成千上万人的规模,没有一个班子而只靠一个人的领导肯定是不行的。领导要真正树立威信,希望自己制定的东西能够顺利实施的话,就要有一个班子,有了班子,才能群策群力。☑ 留才策略

阿里巴巴在整合雅虎中国的过程中,合理安置了雅虎中国的优秀人才还发明了被人津津乐道的留人四宝:远景吸引高管;事业和待遇留住中层;不变薪酬福利安定员工;注资员工,感情银行。

☑ 经济危机下的人力资源策略

一场金融危机让一些企业因为财务状况紧张而大量裁员时,也有许多企业开始悄悄吸纳人才。

第五篇:阿里数据

阿里数据“达芬奇密码” 202_-06-25 本文很长。本文有些枯燥。

本文是移动吐槽团队成员之一在《21世纪商业评论》最新一期封面大数据专题中的职务作品。本文是作者在婚礼前夜花4个多小时玩命赶出来的。本文大概是关于阿里数据业务近期写得比较全的。本文是最原始的初稿。

============== 阿里数据“达芬奇密码”

大数据时代,阿里巴巴集团是最有资本进行烂漫遥想的公司之一。阿里数据平台事业部服务器上,攒下了超过100PB已“清洗”的数据。

马云曾在202_年公开宣称“平台、数据、金融”是阿里集团和阿里小微集团未来的指导路线。在此前后,战略布局已渐次展开:202_年,推出重要的搜索业务“一淘”,202_年收购数据属性公司CNZZ,近期有接连收购友盟、入股新浪微博和高德,抢占数据源;在物流领域,阿里由天猫主导建设了与各大配送公司对接的“天网体系”,最近牵头成了智能骨干物流网络“菜鸟科技”,并构建物流信息数据平台。阿里数据十年铸剑,如今还只是起手开了个局。

无论是洪七公还是车品觉,他们都说没有心思与精力去想太过务虚的“大数据美梦”到底如何炫目,他们更关注坚实的数据仓库和实在的应用场景。十年进化

从202_年淘宝起步开始,七公就一直在与数据打交道。

他的经历勾勒出这家数据巨人的演变轨迹。最早的数据工作自202_年起步时就是出于业务需求的驱动,起初做得挺粗糙,做数据库、做IT系统,随后开始统计分析一些互联网公司都会关注的基本点,比如PV、UV等,当时的淘宝数据部门只有几名员工。

在数据的童蒙时代,淘宝“依葫芦画瓢”地学习当时最大的对手——易趣。“谁都是从什么都不懂开始,而当时ebay、亚马逊已经由成熟的BI部门了,我们就学起来,”七公说。

与易趣的竞争对阿里数据的推动颇有额外加成。据淘宝数据老人回忆,其间易趣强势地通过排他协议垄断了门户广告资源,迫使阿里将广告投放转向中小网站联盟,而由此催生的广告投放精准化分析需求,也使得淘宝的数据团队积累起了更多的流量数据分析经验。在202_、202_年之交,淘宝逆转易趣。202_年淘宝全年交易额不过2271万元,而202_年全年则攀上了10亿元。随着业务增量和品类的快速扩张,数据量也随着跃升,淘宝开始意识到不再能拍脑袋做经营决策,实时观察掌握交易量和用户增量变化的需求正在不断爆发。

淘宝数据团队开始投入对每个类目的精准化分析。202_年,淘宝成立商业职能部门,成为当时淘宝CEO姜鹏的直属部门。

这一年,阿里拥有了第一严格意义上的数据产品“淘数据”。这是一份经营数据的报表,为各业务公司、部门提供经营报表的检索生成工具。

还是从这一年开始,阿里开始切入搜索、广告业务。这两项有着原生数据基因、天然涉及大量算法的数据属性业务推动了阿里大规模数据运营的开端。七公说,由此阿里对数据和应用场景的理解越来越清晰,目的性也更为强烈——搜索帮消费者更快找到商品,而广告让商家获得更高的ROI(投入回报率)。到了202_年,阿里数据开始进入产品化时代。

“淘数据”从一个内部报表系统跃升为内部数据统称。202_年4月和12月,商业智能部团队又开发出可以预警的“KPI系统”和提供给业务部门使用的“数据门户”。

阿里的对外数据产品也开始浮出水面。脱胎于“雅虎统计”的工具“量子恒道”为外部的商户提供了统计、分析自有店铺中的流量、点击、购买等数据变化的工具。

与数据产品的大裂变同步,这一年阿里的数据技术架构也开始了大变革。此前一年加入阿里出任首席架构师的原微软亚洲研究院常务副院长王坚主导了阿里架构从Oracle商用系统向基于Hadoop开源平台的迁移。

Hadoop是基于google早前放出的其上一版分布式计算架构白皮书所开发出的开源平台,相比IBM、Oracle等商用系统的优点在于不仅成本低廉,且架构可扩展性极强。基于此,全球互联网企业的大规模计算体系多使用这一平台。

这使得阿里看到了处理自身庞大数据的新曙光。此前,阿里已发现传统数据库越发力不从心,越来越多业务部门的分析师发现他们早晨9点上班看数据时难以获得结果——越来越多的数据让传统商用机器难以按时计算完成,而添置设备的代价极为昂贵,更遑论因业务快速发展而及时定制更新功能。一些业务部门则开始自建部分Hadoop集群。

彼时阿里和雅虎关系仍颇为亲密屡有合作,看到雅虎基于Hadoop的平台运营良好,也确实能够支撑未来数据快速扩张的技术需求,阿里也下了这番决心。

202_年,王坚成立阿里集团研究院,将集团内各公司自行搭建的Hadoop集群统一开发出云梯1系统,以实现全集团所有数据的打通、整合的管理和共享。

这一系列变革之后,阿里集团最高层提出了对外数据开放的思维。这一年,淘宝交易规模跃上了3000亿元门槛,淘品牌开始崛起,大卖家聚集的淘宝商城(天猫前身)也已然胎动。阿里意识到了自生生态的力量。202_年初,淘宝推出了一款划时代的产品“数据魔方”。通过这款产品,阿里第一次向市场开放了全局市场数据。这款赫赫有名的付费产品成为了众多大中型商户追捧的数据利器。

这一产品发端于阿里数据平台团队对客户的走访。当时宝洁公司提出,希望对行业数据有所了解,以帮助其经营决策。数据团队的一位员工“空无”提出了与其case by case解决,不如直接产品化的想法,“当时就强烈地感觉到,阿里数据的价值出来了!”

在此之后,阿里内部数据产品的开发开始进入井喷状态。淘宝数据部门开发出了“活动直播间”让买家更好滴参与促销运营。202_年上半年,“卖家云图”、“页面点击”接连出现,一年后,为了配合淘宝的大促销活动,便于及时查看实时数据,这个团队又开发了“活动直播间”。为了让卖家更好地运营,202_年2月,“卖家云图”出世。2个月后,“页面点击”诞生,这款产品可以表示每一页面中卖家点击的位置,并用不同颜色和数字加以明晰标记。

202_年,车品觉加盟支付宝。他发现了阿里数据产品仍存在的一些短板:高层有太多数据,但关联性不够,难以快速全局诊断;而另一端是一线运营曾总喊数据不够,却数据间隔严重,也无法获得关联性。于是,他做了两款产品,一款叫“观星台”给前者,是一个高度可视化的仪表盘,选择最关键的数据以图在几秒内能明了全局运营状况;另一款叫“地动仪”,可以看到用户投诉最多的功能是什么,甚至可以获取最原始的客服电话录音。

随后,车品觉进入淘宝,也开发了两款产品。一款黄金策,能够综合700多项变量进行叠加,数秒内可以就制定人群和特定应用场景行为双向推导查询;而另一款产品“无量神针”则提供用户软件的监控,它的副标题为“倾听用户的痛”,可以以可视化图标直接提示可能存在的风险,如用户来电中退款要求的变量等,每当数据“异动”发生,他的团队就会及时发出预警。

而在七公旗下的另一支数据团队也做出了一系列产品,如能够实时显示消费者购买行为细分搜索、成交指数的可视化产品“淘宝指数”,以及去年“双11”期间推出的推测用户身份和购买场景的产品“淘宝时光机”。

一家互联网公司的数据挖掘负责人说,从淘宝数据门户到数据魔方,再到淘宝指数和淘宝时光机,阿里的数据产品从报表到数据工具,再到可视化图片甚至一组flash,看上去越来越不没有“数据味”,但对消费场景和行为的渗透和数据的掌握却越来越深了。

车品觉说,阿里数据挖掘和分析,维度正越来越多,同时也在从发现、呈现、分析现有数据,开始向更多了解用户、预测业务推演转化。

高速公路与跑车

去年阿里集团的一系列架构调整,重构了阿里数据达芬奇密码盘排序。

在这些调整中,阿里云拆分;阿里系的数据库和大规模运算资源整合为数据平台事业部,由陆兆禧亲带;同时阿里成立了虚拟组织“集团数据委员会”,车品觉出任首任会长。王坚带领的阿里云是这套密码盘中的最底层基础,提供了最基础的运算平台。譬如继云梯1之后,阿里自行研发的云梯2体系,就是建立在阿里云的“飞天”架构之上。

在此之上,是数据平台事业部的七公团队。他们运营着阿里集团共享的数据仓库,阿里集团目前各业务公司产生的数据经清洗之后就存储在数据平台事业部的服务器集团上,并在这里进行大规模运算。车品觉带领的淘宝网商业智能部门在数据平台事业部之上使用数据进行分析。同时,车品觉出任会长的阿里集团数据委员会的成员们分属阿里各业务公司,他们也利用七公团队的工作成果各自进行分析。这三层架构,可以理解为阿里云是IasS(基础设施即服务)。阿里数据平台事业部是PaaS(平台即服务),而车品觉的团队则是SaaS(软件即服务)。

阿里集团内的数据大多都经过这般旅程——譬如用户在淘宝上的一个收藏动作,产生一条数据,首先在淘宝网的前端服务器上产生一条日志,这条日志随后被传送存储到七公团队的服务器上存储,其间经过淘宝团队的清洗,在数据平台事业部的服务器上,这条数据将再度被检查其日志格式是否正确等清洗过程,随后被编入数据库,接着与其他若干数据一同被分入分主题的数据集市。当数据委员会的分析师们进行数据挖掘时,它再度接受挑选是否被采用。

如此架构与流程正是为了更好的支撑大数据的愿景。

车品觉认为,在此202_年之前,阿里的数据产品还算不上大数据,大致是对现有数据的分析挖掘以及呈现。在他的认知中,大数据首先要有足够大的数据规模,同时也要有足够多的跨界维度。只有尽可能穷尽更多的维度,在相应具体应用场景下,才能做出足够精准的判断和推测。

而七公说得则更为实在,“我们就是去解决问题,只看业务发展。我们知道数据非常重要,也希望各家公司的数据用得更好。看到更多数据关联在一起,发展出更大的价值,而不是冲着虚无缥缈的东西去的。所以我们不关注外面说大数据 就是为了解决内部数据互通。”

目前,数据业务平台已整合了阿里集团的全部数据。此外,阿里小微集团中创新金融事业部(即阿里金融)的数据也与这一平台直接相连。

七公说,数据平台事业部成立的使命很简单:就是去做各家公司想做但现阶段没有时间或能力的事,搭平台、把数据整合在一块。“我们提供计算、存储平台即云梯 建模、定义、分析是前段品觉的团队做的。” IBM大数据业务资深人士说,大数据概念有着两层结构。上一层是人们所热议的充满科幻感的分析预测能力,它似乎为大家描绘了如何触碰一个可知可感未来的方法论;而另一层则是实现这一梦想所需的处理大规模、高并发、高关联性甚至是低价值密度数据的运算能力。车品觉做的是前者,而七公维护的是后者。

车品觉说,七公的团队是在修建高速公路,而他的团队则是在高速路上驾驶跑车,“建高速公路是一个漫长的工程,需要巨大的投入、耐心以及细致。”

七公告诉本刊,数据平台事业部的服务器上,所保有的历史数据已超过100PB,而且已经过了清洗。“清洗”是被七公和车品觉反复提及的词,它保障了数据的质量,直接关乎大数据运营的准确性。那么如何清洗数据?七公说,首先得让数据都能对得上,产生关联。尤其是互联网行业,发展迅速且难于规划,通常都在不断试错、快速迭代,这使得不同部门、业务之间的数据往往难于打通,甚至不少公司里业务间连用户cookie、日志格式都不同。

阿里或许是幸运的,从202_年淘宝开始统计日志之后,整个淘宝系的日志格式就已统一,使得现在的麻烦少了不少。

但这才仅仅是一个开始,正如前面所示,数据处理的链条极长,任何一个环节出错都会影响后端,而且越是错在前端,偏差越是明显。车品觉说,数据污染往往有两个原因,一是原来就采集错误,二是数据口径不同。

前者往往来自于部门协作脱节。如前端业务部门的开发人员如果改变了页面功能但未及时通知数据部门,则相关用户行为所对应的数据定义就已失真;而后者则更容易理解,譬如有的电商公司统计转化率只统计到用户点击购买,而有的公司则要考虑点击后是否付费、是否退款?“鸡同鸭讲”也显然会造成错误。这就是数据委员会的工作。它要统一整个集团的统计口径和统计方法,制定关于质量和安全的范式。数据委员会的成员来自各个业务公司,车品觉要主持规范工作,进而影响全局。

今年年内,车品觉将数据质量和数据安全视为其最重要的课题。为此,数据委员会下设置了数据质量和数据安全两个小组。

在安全方面,他们格外小心,因为涉及用户隐私。最终他们设置的规则是不做1000人群体一下的群体购物行为的分析,而且开放多少数据有安全小组进行集体评判。

在数据质量方面,车品觉提出了要尽可能消除杂音,如用户点击统计中要去掉测试、自己员工点击等因素,同时又要尽可能地保证原始场景可还原,以防止失真。

他说,理想中,数据仓储中的数据能还原原有场景是才最好,“七公在后台,我们最希望我们需要还原的时候有足够的数据能够支持。”

“数据是科学的,但清洗中的取舍和分析时维度的选择则要靠分析师的判断修为,这部分不那么科学,而是更像是艺术,”车品觉说。

而七公要做的更多是保障数据存储和运营的技术流程规范、安全,维护系统稳定,降低系统BUG造成的错误并进行修正等。这份工作并不轻松,至今阿里集团的数据都在每年至少翻倍的速度增长。

其实,参与到阿里大数据战略中的团队还有更多。如姜鹏旗下的共享平台事业部下的搜索团队,担负着为全集团各部门清洗非结构化数据的任务。

数据平台事业部下有一个20多人的数据产品部团队,运营着“数据魔方”、“淘宝指数”、“淘宝时光机”等数据产品。根据默契的惯例,车品觉团队主要做对内数据产品,而他们则向阿里外部分享提供数据工具。

此外,各家公司的分析师也都负责这各自业务的数据清洗工作。而车品觉旗下,还有一支数据科学家团队,并不隶属于任一具体业务公司,横跨支付宝和阿里集团两大平台进行数据挖掘分析和数据产品研发。

数据新觉醒

车品觉很推崇数据界前人提出的一段“六字真言”:“对比、细分、溯源”,他说还要加上一个“趋势”。

这便是从传统BI领域跃入“大数据时代”的关键一步。

在此之前,阿里的数据产品更多还是呈现历史和当下的运营状况,仍是决策的辅助。而人们憧憬的大数据方法论则要求着推测未来、洞悉全局、引导决策的能力。

不久前,车品觉曾在一次非正式交流中说,大数据概念目前看来仍是忽悠。而这次与本刊交流时,他特意更正,说“忽悠”是指现在的基础,大数据的前提是拥有足够的数据、关联性,并具备相对应的运算能力和分析能力。

他说,今年以来自己的思维改观也很大。最近几周,他一直在跟BI团队开会,提出要重新定义BI,“今天的BI在未来未必好用了,也许并不完全适合未来的数据世界。”

数据团队的理解更新之外,阿里集团整体的姿态也决定了数据作为的新方向。

车品觉印象深刻的是,202_年时,时任阿里集团首席人力官、支付宝CEO的彭蕾(现任阿里小微集团CEO)对他说,数据团队要尝试着从数据化运营转向运营数据。

这成为了阿里系数据系统跃升的一次重要触发机制。车品觉说,“运营数据”已是大数据的方向。去年,马云的公开表态更明确了这一点。他提出,“平台、数据、金融”是阿里集团和阿里小微集团未来的路线。眼下,平台已成,如何成为一家彻底的数据公司,如何在内外提供数据价值,成为新的攻坚战。阿里集团已然布局深远、行动频频。

早在202_年,马云就曾在国际交流中说,阿里巴巴的交易数据都保存完整,早晚有一天会派上大用场。202_年,阿里推出重整的搜索业务一淘,202_年收购数据属性公司CNZZ,近期又接连收购友盟,入股新浪微博和高德,数据源头开始不断展开。

甚至在物流体系中,阿里先是由天猫主导建设了与各大配送公司对接的“天网体系”,如今又集团出面牵头成立了全国智能骨干物流网络“菜鸟科技”,并提供物流信息数据平台。

马云谋划的是在交易平台同位的庞大数据平台,作为信息流的精华部门它与物流、现金流结合,构建成完整闭环且不断外扩的生态体系。在提供内部数据决策支撑之外,甚至会形成数据的交易平台。

举个例子你便知阿里数据分量。去年大淘宝系交易额已超过万亿,足有一省GDP分量,而他庞大生态中实时地展现出宏观经济走势,阿里研究院每个月都会接待好几波各级政府索要数据的要求。近期不少政府官员也前来向车品觉咨询大数据在公共行政管理中的应用方法。宏大愿景之下,车品觉说,今天的阿里数据团队态势严峻。“我们有很多困哪要解决,数据质量和安全是今年的重头戏,制定范式我们还有很多工作要做”,他说,此外更严峻的新课题是如何让数据“落地”,在公司具体场景中帮业务、产品做得更好。

具体而言,他深感原先做得还远远不足,已经做出来的“黄金策”、“无量神针”等还不够用,不能太高估计,用户对数据的敏感度。尽管“无量神针”每个小二都能用,黄金策的权限都已经发放到中层,感觉门槛还是太高了,“可视化很重要,相关性很重要”。

这使得他们在加紧阿里内部数据的挖掘、关联力度,为数据分析、预判找出更多可靠的参考维度。最近开始,车品觉团队的数据研究广度开始从淘系延生涉及到整个阿里系,同时他们也开始考虑对阿里外部提供数据工具。

车品觉曾说,数据团队应该是CEO直属的战略级团队。之前有不少大互联网公司前来向他讨教,但一被问及“数据团队应该是运营团队还是技术团队”时便深感对方完全走错了路。

而如今,他也坦言,CEO、管理层的注视让他们逐步感到压力。“马云最厉害的是知道数据要耐心养”,但高层们频频布局数据、问及数据落地时,他感觉到团队有非常大的责任,“不能再只是讲故事了,我们到时候必须亮剑了。”

“现在做的事并非是今年要毕其功于一役,但我们要打开局面做出良性循环,”车品觉说,只有数据证明了自己的价值,才能够让人们信任、支持,持续投入,届时阿里才能成为一家数据公司。

车品觉团队今年让数据产生商业价值的意愿变得空前强烈。他们在积极主动地寻找机会,站在商业场景合作伙伴的前面,提供足以改进并指导决策的数据方案——今年以前,数据产品提供的都是诊断辅助,而现在是让数据去引导决策。

这一行动已有成果出现。车品觉团队中的一位数据科学家杨滔牵头为聚划算设计了一套预测报名商品能否成为爆款的数据工具嵌入了这家公司的系统。这款产品参考60多个变量,输出商品的是否爆款、最终销量、库存等数个关键预判数据,并直接作为商品是否能参与活动的判断标准。据分析,这一产品目前预测的准确度已达到80%以上。

这很大程度解决了阿里的管理决策困境。去年聚划算出现腐败案件震动业内,阿里集团首席风险官邵晓锋当时曾对本刊表示,未来将引入数据产品,以尽可能降低人为干预因素的比重。如今数据工具成为了决策系统的关键组成部分。

杨滔还在琢磨着参考更多维度的内外部数据,将这一系统拓展为线上下通用产品,可以帮助综合零售企业统合预测线上下销售和库存状况,直接产生经营决策。他在开发的另一款产品则有着浓烈的“人机对话学习”色彩,即通过研究淘宝上购物推荐达人的行为,分析其规则进而让淘宝系统的推荐工具学习其中规律,提高个性化推荐的能力。

而整个阿里系业务中,最为炫目就是阿里金融的小贷业务。这是一项典型的大数据成功应用,阿里金融的数据团队设计的模型综合淘宝上产生的信用记录、成交数额等结构化数据,以及用户评论等非结构化数据,加上外部采集的用电量、银行信贷等数据,可以精准决策是否放贷和放贷额度,而贷款不良率仅为0.78%堪称业内最低。车品觉认为,今天大数据的机会来自于信息的不平衡,而数据产品可以将更多维度综合关联比照,如同在尽可能多的角度安装摄像头,才能掌握更为真实的商业动向。

目前,阿里数据分析团队们用的仍多是阿里内部的数据,因为仅仅这些他们还远没有挖掘完。但阿里的数据支撑团队已又一次提前开始为他们修路,为他们准备更多维度的外部数据。据阿里数据员工透露,七公的团队已开始接入高德等阿里投资公司的外部信息。

此外,阿里云和平台数据事业部还在致力于底层技术和运算能力给予新的支撑。

在给予Hadoop的云梯1之后,阿里又自行开发出了新的基于“飞天”体系的“云梯2”平台,成为业界除谷歌之外,几乎仅有的自行开发底层分布式计算系统的互联网公司。目前阿里金融、阿里数据科学家团队和数据平台事业部旗下的数据产品部都跑在云梯2上,这一系统更为突出实时运算能力。此前的“淘宝时光机”多是离线运算,而“淘宝指数”则跑在实时平台上。

车品觉说,阿里目前已到了大数据的海边,在国内互联网行业是“做得最狠的”,“如果阿里做不出来,中国在数据化领域上速度会减慢。”

阿里集中了目前大数据领域中国最多的数据、资源、人才,他和他的团队以及相关数据业务部门同僚都深感责任重大。

~~~~~~~关于我们~~~~~~~ [大钾新闻集] 旗下微信公众号 “移动吐槽”(ID:jiaxinwen360)“科技观察”(ID:kejiguancha)微博“钾新闻” 由五位媒体人共同维护

谢璞、王长胜、徐洁云、赵楠、迟有雷 【未经授权,不得转载】 欢迎投稿与爆料: jiaxinwen360@163.com

Yao He(Michael), School of Computer Science, Northwestern Polytechnical University(NPU), Xi’an, 710129, China, Email: heyao.nwpu@foxmail.com.

阿里价值观
TOP