news banner

textual analysis1

 

在先前几篇文章中,我们分享了如何透过语音识别技术(Speech to Text、STT),将呼叫中心内专员与客户的对话,转换成可供分析的对话文本。而要将这些文本「数据」转换成对管理者有用的「信息」,那还需要有文本分析的技术,来抽取出文本中有价值的信息。本文会为各位简单介绍何谓文本分析,可能运用的场景与背后基本的技术原理。

文本分析相对于过去传通分析最大的差别在,传统数据分析处理的是「结构化的数据」-数据本身具有明确的定义与质,如一张固定结构的表格或数据库。然而文本分析所处理的数据,一开始并没有特定的结构。就像人讲话一样有长有短。需要经过加工与处理后,才能转换成可供分析的数据。而这些非结构化的数据又来自哪里呢? 如每天发布的新闻、社群媒体(微博、Twitter)上的留言、论坛、部落格等。甚至非文字的声音,图像等都算在非结构数据的范围。

 

文本分析应用场景

现在所谓大数据分析非常火热,也越来越多企业投入研究文本分析相关应用。究竟文本分析能带来什么样的价值。以下分享几个应用场景供各位参考。

 

主题提取:

人类每天产生的文字与内容,数量早已超过我们的想象。不论是专利文件、研究论文或部落格文章。主题提取的技术尝试透过算法自动找出这篇文章的主题为何,将大量的文字压缩成几个重要的关键词词供后续分析使用。

 

情绪分析:

情绪分析最主要的目标是尝试从大量的文字中,辨识出正面与负面等情绪。透过辨识情绪,企业可以找出社群媒体中不满意的客户,或监控几个指标性的论坛部落格,是否出现不利企业的言论。透过提早发现不满意客户的贴文,在事态扩大前尽快响应处理,降低危机的破坏性。

 

意见探勘:

这源自于传统上的舆情分析。网络舆情分析,是透过收集并分析网络上消费者发表的意见,了解目标客群对于企业品牌、产品或服务、甚至促销活动的想法。透过分析的结果,调整优化现有的服务内容或产品研发方向。

回到呼叫中心本身、因近年全渠道客服(Omni-channel)的快速发展,呼叫中心拥有众多文字的对话记录与email文件等。加上透过语音识别技术,我们可以收集到客户更直接的响应。网络上搜集回来的数据,因很难确认数据源的真实性与身份,有时在抱怨的也不一定是你的客户。然而呼叫中心内的数据因纪录的都是实际客户的互动,故更加的精准。应用场景可参考『重新挖掘潜藏在呼叫中心的顾客之声』,该文中有更多如何应用客服中心对话数据的讨论。

 

如何实现?

进行文本分析可初步分成下列几个步骤:

  • 选定目标:根据本次分析目标,决定从何搜集数据。如要针对航空业者的服务进行分析,便会挑选如知名旅游部落客、背包客栈或微博上相关旅游粉丝团进行。
  • 数据搜集:将目标网站的文本数据下载回来,网站的数据透过昵称”爬虫”的技术将文本抓取下来。
  • 断字断句(非结构化转结构化):`将文本转换成可供分析使用的单词。textual analysis
  • 资料分析:根据本次分析目的建立相关模型。趋势性分析用于追踪一定时间内,产品在网络上的声量与热度,以及谈论到相关产品时的热门主题。情绪分析可用于标记高风险的客户,提早找出可能,并提早响应。
  • 数据可视化:将分析的结果,转换成可视化的呈现。提供企业决策时使用。

 

作者:德鸿科技 售前顾问 David