在整个数据分析流程中,数据采集是重要的一个环节。只有采集好数据源,才是数据分析的根基,否则“巧妇难为无米之炊”。在数据采集中,我们经常使用埋点的方法采集数据。
什么是埋点?
所谓埋点就是数据领域的术语,也是互联网应用里的一个俗称。它的学名应该叫做事件追踪,对应的英文是Event Tracking。它主要是针对特定用户行为或事件进行捕获、处理和发送的相关技术。
埋点主要目的是为了弥补应用系统(主要是网站或者app)在设计时的不足。任何一个系统在设计初始阶段只关心核心业务的功能,等到系统上线以后,数据分析师对用户行为分析时会发现缺少很多数据,此时需要采用埋点的方法进行采集需要的数据。具体来说就是在系统代码里面添加一些额外的代码来采集需要的数据进行精细化数据分析。比如在电商行业,当用户点击“购物车“时,这是一次交互行为,也是系统的核心功能,但是忽略了用户信息、商品品类等其他维度的信息。我们需要采用埋点的方法嵌入额外的代码来辅助采集数据,进而实现深度的数据分析。
从本质上讲,埋点就是为了对产品的持续追踪,通过深度数据分析不断优化产品。比如用户点击率怎么样?用户在核心使用路径上是否顺畅?有没有得到用户的认可?有没有因为设计按钮过多导致用户行为无效?用户希望有什么样的功能更新?等等问题都可以通过埋点的方法实现。因此它贯穿了产品的整个生命周期,为产品优化指明了方向。
有哪些埋点方式?
埋点是在应用系统中嵌入额外的代码,具体的方式有三种:
l 无埋点(可视化埋点/全埋点)
l 代码埋点(手动埋点)
l 第三方统计工具
如果从系统的前后端来讲,埋点又分为前端埋点和后端埋点。无埋点(可视化埋点/全埋点)是前端埋点,而代码埋点(手动埋点)即是前端埋点又是后端埋点。
无埋点又被称为可视化埋点或全埋点,是通过后端配置或前端可视化圈等方式来完成关键关键事件的定义和捕获。它要求必须在页面上嵌入数据采集基础SDK(基础代码),就可以采集页面上所有的点击行为,并且可以绘制出用户点击的热力图。这等于做了一个统一的埋点,因此又被称为全埋点。
由于无埋点是前端埋点,它自己的缺陷。第 一、无埋点无法采集自定义属性,只使用通用大部门,通用的场景;第二、无埋点的兼容性不好;第三、采集不全 面、传输时效性较差等问题;第四、减少沟通成本
当然,它也有自己的优势,主要体现在以下几点。第 一、它又称为可视化埋点,因为可以可视化展示网站的宏观指标,比如PV、UV等;第二、它技术门槛低,部署简单、第三、可以在系统上线后使用,具有很强的灵活性
代码埋点(手动埋点)又分为前端代码埋点和后端代码埋点。它是手动编码产生的,具有很强的灵活性,进而可以采集一些扩张数据。它的优点主要是采集的数据比较具有针对性,更加适合精细化数据分析;同时也能提高数据的准确性。它的劣势就是埋点之前必须知道目标是什么?还需要注意在产品迭代过程中,或略了埋点的修改。
常见的第三方统计工具有友盟、百度魔方、talkingdata、app annie等等。
如何选择埋点方式
面对上面的埋点方式,我们该如何选择呢?我们的目的是实现深度数据分析,不应该采用与其他企业通用的埋点方法,应该采用适合自己的埋点方法。也就是做到“因系统而异、避免千系统一面的情况。
在系统刚上线的初期阶段,我们可以采用无埋点的方式。因为我们通过UV、PV、点击率等基本指标及即可满足数据分析需求。如果产品上线时间很长,我们需要进行深度数据分析则选择代码埋点。它可以帮我们收集需要的属性。另外,如何埋点既可以在前端实现,也可以在后端实现,我们推荐在后端实现。因为后端数据可以保证数据的准确性。如果您为了方便快捷并且免费,笔者建议您选择第三方统计工具,但是一 定要选择适合自己业务的统计工具。
总之,如果您需要深度分析,笔者建议您选择后端(手动)埋点和无埋点组合的方案;如果您只是想看宏观数据,笔者建议您选择无埋点。无论采用哪种埋点方法,笔者建议您一 定要慎重,根据需要来设置,不要出现错埋或者漏埋的情况,数据分析师一 定要和业务工程团队(部署实施埋点的部门)配合好才能实现完 美的数据采集方案,有时候沟通比选择埋点方式更重要。
合理的埋点才是科学数据采集的方法,而数据采集是数据分析中的重要一环。笔者遇到很多人经常咨询如何提高自主数据分析能力,我认为对数据的敏感度是非常重要的技能之一。除了要了解数据统计的意义,笔者建议您还要了解数据采集的方式是什么?如何设置埋点?与业务又有什么关系呢?这样分析的目的是什么?等等一系列的问题。多思考与数据有关的方方面面才是提供自主数据分析能力的方法之一。希望本篇文章能帮你带来这样的思考,也祝福您的数据分析之路越来越好。