愈愈多企始利用大做分析用,我也常被到:第一是:「我的公司有料,怎做大分析?」第二是:「我的公司料很多,但不知道何始?」 第一,我的答案很:「有料,也就有包袱,在就可以始集有用的料!」 第二就比了,也反映多企正面的。根媒,全家便利商店年集了台北翻社190料,要入大用,些料都不能用,只好重新建立。 可能是比端的例子,但事上,企的料的散各,有的在端、有的在行端,甚至客服端也有,相欠缺清理整合。 整合料前,要先清理料,在步,你很快就很多。我,至少面下面6挑,而些也是我去碰的。 挑1:有料(No Data) 由於去有定目,所以有保存。比如始想到日後回台北翻社客生日,所建立料,有客的生日,日後就少了一可以用的料。 挑2:的料(Out-of-date Data) 有的企然有保存料,但料的保期已,用途不大。例如,5年前集的客email,有些路服可能已止,客已不再使用,或是客早已了工作,email就得重新集才行。 挑3:不完整的料(Uncom台北翻社pleted Data) 然有料,但料位不完整,致只有部分料可以用,或者必才有用值。例如姓名、、地址、交易料都有,但是有交易、金,以至於法做台北翻社一步分析。 挑4:失的料(Missing Data) 是,有料,料位也很完整,但是某些的料位是空白的。 譬如1年12月的料,某些地的交易料是空白的,是代表有交易呢?或者交易金是零?些位必理。若是有交易,就要填入「零」或「平均」,以低料的影。 挑5:稀少的料(Sparse Data) 台北翻社有的位都有,也有,但是到交易行生的料量非常少。例如,消者某部影,但是大部分人都有看部影,造成有的料少,缺乏分析的值。 挑6:不精的料(Inaccurate Data) 最常生的,就是用不同的衡量方法,提供台北翻社不一的料。有位企者我:「整理完後的料,剩下千不到,怎?」不用灰心,千有效的料,比20有清理的料得
文章定位: