技术能力

联系我们

想了解更多我们的产品和服务?欢迎您和我们联系。
在线留言
+86-(0)21-64049191

申请IWOMmaster ID

现在申请即可免费获得Kantar Media CIC白皮书,趋势观察,社会化商业电子期刊等IWOM资源。
立刻注册

新闻

  • 2016-11-10
    今日,作为中国领先的社会化及数字商业资讯提供商的Kantar Media CIC,在上海发布了"60秒看中国社会化媒体表现"信息图。该信息图提供直观全面的中国社会化媒体表现...
    更多详情

60秒看中国社会化媒体表现

Kantar Media CIC 发布"60秒看中国社会化媒体表现"信息图。
浏览详情

 2016中国社会化媒体格局概览

Kantar Media CIC 2016 中国社会化媒体格局概览正式发布。
浏览详情


CIC on Youku


2015微信影响力白皮书

Kantar Media CIC联合奥美中国发布《微信影响力白皮书 - 母婴营养行业》,统计数据来自92家专注于母婴营养领域媒体微信平台,12个母婴保健行业KOL自媒体以及24家母婴品牌的公众号。
浏览详情

2015社会化聆听中心的新时代白皮书

最新发布的《社会化聆听中心的新时代》白皮书将带您了解社会化媒体聆听中心的演变以及它对商业的意义。
浏览详情

2014从社会化商业迈向大数据白皮书

Kantar Media CIC正式推出2014年《从社会化商业迈向大数据》白皮书---来自2013-2014中国企业社会化商业调研的洞察,向企业提出对于社会化商业到大数据进阶的建议。
浏览详情

社会化商业变革在中国

Kantar Media CIC正式推出《社会化商业变革在中国》一书
浏览详情
首页 >
技术能力

文本挖掘

 

Kantar Media CIC核心技术团队现已自主研发出支持多语言、用于社交网络数据处理的自然语言处理引擎。该引擎专门用于大数据处理,支持论坛、博客、微博、微信、电商、新闻、视频、问答等主要社会化媒体平台的数据;对大规模杂乱的社交数据进行快速过滤,为CIC的分析师提供高质量的分析数据。其内置的语义分析技术与基于实体的情感分析技术可自动找出消费者对品牌、产品以及服务的评价,从而帮助客户挖掘出商业价值。

 

Kantar Media CIC的知识库系统拥有18种语言的语料库,其中包括近200万条中文语料与近500万条英、德、法、西等多语种语料,使自然语言处理引擎具备处理全球主要社交网络数据的能力。其语料库涵盖化妆品、汽车、服装、手机、奢侈品、快速消费品,IT产品等16个行业,为机器学习、文本分析提供更全面、更精确的基础。

 

Kantar Media CIC已对多个行业的知识进行系统化、网络化,并将其整合成知识图谱系统。该系统拥有近200万个节点,相对于传统的本体而言,实体覆盖率更高,节点属性与节点之间的关系更为复杂全面,可用于对多个行业的品牌、产品作深度语义分析,从而提升信息搜索、文本分析研究的速度与准确度。

 

数据抓取

 

Kantar Media CIC拥有自主研发的分布式数据采集系统,此系统伸缩性极强,能够轻松应对海量数据的采集以及数据标准化处理。与同行业相比,我们有如下优势:

1  涵盖社会化媒体丰富。CIC的数据采集系统完全支持现有主流的社会化媒体平台,如论坛、微博、微信、电商、问答、博客、视频、新闻等,并且支持一些海外热门站点的数据采集。

2  数据量质量高。单日的数据采集量已经突破千万,数据处理迅速且数据质量可靠、稳定,为众多合作伙伴提供了非常有力的数据支持。

3  数据采集高效。采用云服务,轻松实现采集系统扩容,提供更加强大的数据采集能力,可在最短时间提供宝贵的数据。

 

了解更多
+86-(0)21-64049191
marketing@cicdata.com

沪公网备
310104100039481

Copyright ©2017 | 沪ICP备15044498号
艾熹信息技术(上海)有限公司