卷首语

最初的数据挖掘技术雏形出现在20世纪60至70年代,那时候全球互联网泡沫才刚刚开始膨胀。随着各行各业数据量的激增以及产品生命周期变化的愈发复杂,数字已变成一种珍贵性资产。

从知识发现、商业智能、预测建模到预测分析,数据挖掘相关技术名称的不断变更,不仅体现了其内涵与定义上的延伸,还意味着它在业务流程和商业决策上产生的越来越重要影响。业务驱动的需求扩展促使数据挖掘从简单的数据检索和统计成长为更复杂的分析预测工具。如今,数据挖掘和分析型CRM已发展为主流,不同的数据挖掘软件也随着技术和算法进步而日趋成熟。

同时,数据挖掘是一个分析过程,旨在探索大量数据背后,模式或变量间较为一致的系统关系,并将分析出的模式应用于新的数据子集。也就是说,数据挖掘的最终目标是实现精准预测,特别是对个群体行为、商业决策乃至社会层面的关系和发展预测。几十年来,社会科学将交互的强度和频率量化以衡量个人间的关系,因此便有了弱关系和强关系之说。弱关系(松散的熟人)可以帮助传播不同群体间的思想或创新,有利于信息流动。这种潜在关系的联结也让数据挖掘技术有了真正的用武之地。在这样的运作机制下,关系数据挖掘也对数据特征的准确性提出了更高的要求。

明略数据作为国内领先的企业级大数据技术商业化公司,可以有效帮助企业将多源异构、非结构化的数据进行统一存储并挖掘出其中所隐藏的价值。除了利用传统的数据挖掘方法,如通过人工智能自动地按照一些基本特征对数据进行分类、聚类外,明略还会根据真实的数据样本通过机器学习进行样本训练,从而得出比“人”的主观意识更精确的规则集和模型。在提升数据特征精准性上,明略可以做到从原始数据中提取特征,紧密联系不同领域不同业务选择合适的特征,以实现数据间的区分度。在解决数据关联问题上,明略会把数据转化成类似知识图谱的形式去进行存储,使业务人员能更容易地理解这些数据。

为了在DT时代下为企业变革提供更好的支撑和服务,明略在2015年10月同时发布了数据系统革命性产品SCOPA(数据关联分析)、数据安全与运维安全的大数据平台产品MDP(Mininglamp DataPatform),以及分布式全量数据挖掘产品DataInsight。多条业务线和不同类别产品的拓展,已使得明略能更好地在海量社会数据中洞察出真正的数据之密,在信息浪潮中挖掘出更多隐藏在数据中的“宝藏”。

这正如明略所主张的思想:“孤立无序、种类繁多的数据本身不具备价值,只有将数据统一、关联起来,才能发掘信息,发挥价值。”