本篇文章3176字,读完约8分钟
airbnb的数据团队,赖利·纽曼是后排右边第五个
五年前,我加入了airbnb,成为了一名数据科学家。当时,只有少数人知道这家公司,而整个公司只有七个人。
招募我是我们创始人的一个特别具有前瞻性的行为。大数据的兴起决定了数据具有竞争优势,但这通常是公司成熟时会注意的部分。那时,airbnb希望迅速发展,我被公司的文化所吸引。尽管当时只有少量的数据,我还是开始从事与数据相关的工作。
硅谷早期的创业公司有着浪漫的特点:行动迅速,只做基本的决定,任何好的想法都有可能成功,我非常同意这一点。
当时,当我们对商业领域的先驱业务知之甚少时,数据基础设施的建设是快速而稳定地实施的。这家公司太小了,每个人都是一个决策周期。数据团队,也就是我,可以有自己的测量标准和方法。
但是当airbnb五年后增长了43,000%时,事情变得有点复杂了。我们使用数据的方式更加复杂,现在数据成倍增加。因此,我认为是时候写这篇文章,回顾一下我们的数据团队是如何伴随公司发展的。
围绕如何将数据科学与其他业务功能联系起来,我将其分为三个概念:我们如何定义数据科学,如何使用它来做出业务决策,以及如何将其扩展到airbnb的所有方面。我不能说我们的解决方案是完美的,但是我们对我们的日常工作很兴奋。
数据不是数字,而是用户
数据科学团队的基础是组织中的数据文化和概念,因此定义我们如何查看数据的先决条件是数据在业务中的作用。
过去,数据被视为冷数字,纯粹被视为测量工具,根据要求提供统计数据。因此,我们经常被要求提供一些事实数据,比如:我们在巴黎有多少所房子?意大利十大旅游目的地是什么?
回答这些问题和测量结果肯定是工作的一部分,但是airbnb有更人性化的数据特征,这是我们用户的声音。在大多数情况下,网站上的行动或事件记录反映了一个人的决定。如果你能在做这个决定之前发现用户的行为,这是一种间接的方式让用户告诉你他们喜欢和不喜欢什么。
这种反馈可以帮助我们做出社区发展决策、产品开发和资源分配,但前提是你能理解它。因此,数据科学是一种解释,我们必须将用户的声音转换成更适合决策的语言。
在airbnb,倾听客人和主人的声音是我们的企业文化。在早期,我们的团队拜访了社区成员,了解如何使我们的产品更好地满足他们的需求,但现在情况仍然如此,但用户规模在不断扩大,我们与每个人的联系无处不在。
所以数据成为我们的盟友。我们使用统计数据来了解个人经历,并总结这些经历来决定整个社会的发展趋势,这告诉我们在哪里推动商业决策。随着时间的推移,我们在其他部门的同事意识到数据团队代表了所有用户的声音,这使得数据科学在airbnb的结构中占据了重要的位置。
良好的伙伴关系和统计数据收集
一个好的数据科学家可以找出谁在使用我们的产品,并了解他们的需求。但是如果他们独自在森林里,没有人会发现他们的洞察力,那么他能为空房间做些什么呢?
当决策者不理解数据的功能时,他们就不会参与,而当他们不参与时,数据的价值就会丧失。我们想要的解决方案是将数据科学家和决策者联系起来。在airbnb中,跨职能协作是正常的。关于数据科学团队的结构是集中的还是嵌入公司内部,有很多争论。
我们开始是一个集中的团队,提供相互学习的机会,并保持一致的工作指标。但我们发现,我们的数据团队不能孤立于业务决策,因为其他同事不了解如何与我们互动,其他人也不完全了解我们。随着时间的推移,我们被视为一种资源,我们被要求提供数据,却没有机会积极思考未来。
因此,我们决定使用嵌入式安排,我们仍然遵循集中管理,但我们打破了自己的小组,让数据团队的合作伙伴与工程师、设计师、产品经理、营销人员等进行更直接的交流。
这样做可以提高整个公司的数据利用率,并使数据科学家成为积极的合作伙伴。嵌入式安排使我们成为一个核心,可以帮助公司的各个方面互相学习。
决策是由用户需求驱动的
在团队中,需要解决的问题之一是如何利用用户的声音来做出商业决策。通过与公司各方面的合作,我们听到了一些关于如何将数据集成到项目中的意见。有些人想先了解他们面临的问题,而有些人会先浏览数据,然后进行计划,但这些人倾向于专注于直觉决策营销。
两种视图都可以,但是在项目的生命周期中,数据在不同的阶段扮演着不同的角色。
我们已经确定了决策过程的四个阶段,其中数据将产生影响:
首先,了解问题的背景,建立一个完整的计划介绍。这更像是一个探索性的过程。
对计划的简单理解,包括优先顺序和假设我们能实现什么。预测分析在这个阶段更重要。当我们做决定时,是基于希望我们能产生最大的影响。
当计划进行时,我们将做一个对照实验。A/b测试是最常用的,但是我们在各个方面的业务合作可以给我们更多的实验机会,基于市场的测试和传统的网络环境测试。
最后,我们测量实验结果并确定结果的影响。如果成功,我们将从社区推广,如果不成功,我们将回到起点,重复这一过程。
有时这个过程很简单,但更多时候我们需要一步一步地演示,以确保这个决定对每个airbnb用户都有效。最后,我们将以这种方式解决用户的需求。
民主化的数据科学
当一个数据科学家能够有足够的精力与他人交流时,一个良好的循环就可以创造出来,但现实是,一个公司的规模和速度将超过数据团队的增长速度。这在2011年尤为明显,因为airbnb开始迅速发展。年初的时候,我们是旧金山的一家小公司,我们三个数据科学家可以有效地与你们合作。然而,6个月后,我们开设了10多个国际办事处,并扩大了我们的产品、营销和客户支持团队。
突然间,我们与每个员工直接沟通的能力消失了。正如它不能满足社区的每个新成员一样,它也不能满足现在每个员工的工作。我们需要找到一种方法使我们的工作民主化,并扩大我们与其他同事甚至整个社区的联系。
以下是我们如何处理各层规模的一些例子:
个人互动:这对数据科学家快速行动非常有效。对数据基础设施的投资很重要,这可以确保更快、更可靠的技术来传输数据。
授权团队:将报告和基础数据探索从数据科学家的工作中分离出来,这样他们就可以专注于更有效的工作,比如使用仪表板和其他工具。我们还开发了一个强大而直观的数据仓库工具来帮助人们查询作者。
除了单个团队,我们更多地考虑数据文化在整个公司中的作用:我们告诉员工我们如何看待airbnb的生态系统,如何使用工具(如airpal),消除数据障碍,激发他们的好奇心,并告诉他们每个人如何更好地利用数据。类似的行为有助于改变他们认为统计是暂时的要求的想法,这可以解放我们。
扩大数据团队:扩大数据科学团队并不容易,但这是可能的。尤其是如果每个人都认为它不仅是必要的,而且是公司的重要组成部分。
在过去的五年里,我们学到了很多。改进了如何使用我们收集的数据,如何与决策者互动,以及如何使我们的公司民主化。但是这些工作在多大程度上被认为是成功的呢?
很难衡量数据科学团队的影响,但一个信号是,现在每个人都同意数据需要由技术和非技术人员来决定。我们的团队成员被视为决策过程中的合作伙伴,而不仅仅是统计数据的收集。
另一个原因是,我们越来越能够细化我们工作的因果影响。这一直是个棘手的问题,因为人们发现生活中的生态系统是复杂的,受到许多因素的影响,如网络效应、强烈的季节性和频繁的交易,但这些挑战使工作更加令人兴奋。在过去的几年里,我觉得我们仍然只是皮肤,有很大的潜力。
我们正处于爆炸点。我们的基础设施稳定,我们的工具有效,我们的数据仓库干净可靠。我们准备好解决那些令人兴奋的新问题。目前,我们期待着从批量实时处理中开发出更强大的异常检测系统,以加深我们对网络效应的理解,提高我们的个性化匹配。
然而,这些想法只是开始。数据是客户的期望和声音,无论我们将来做什么,都将受到这些声音的驱动。
标题:深度剖析:Airbnb快速增长背后 数据在干什么
地址:http://www.jcpa.cn/blgxw/11458.html