干货 | 大数据时代,这些工具能够帮助你更好地进行专利分析
新闻来源:http://mp.weixin.qq.com/s?__biz=MzA3MTAxMDg4Ng==&mid=400932448&idx=2&sn=ef73fe1297f11cabd2dda805ff4e    点击数:90624      收藏此页
 

干货 | 大数据时代,这些工具能够帮助你更好地进行专利分析
专利
2015年9月5日国务院印发《促进大数据发展的行动纲要》,加快政府数据开放共享,推动产业创新发展。9月15日,国家知识产权局局长申长雨在以“专利运用新业态支撑经济发展新常态”为主题的专利信息年会上指出:“要实现专利信息服务与互联网和大数据的深度结合,既要依托互联网提高专利信息的传播利用效率,也要借助大数据对专利数据信息进行深度整合、加工、挖掘、处理,并实现与经济、贸易等数据的关联分析,使得更有价值的隐性信息浮出水面,加以利用。”



  经过近几年的发展,基于大数据的专利分析已经从“蹒跚学步”逐步迈入到了“茁壮成长”的阶段。然而,要实现专利支撑经济发展新常态的发展目标,仍然任重而道远。这其中有需要自身苦练内功的地方,同时更需要越来越多来自外部的工具的支持与帮助。
  俗话说的好:工欲善其事,必先利其器!一款好的工具可以让你事半功倍,尤其是在大数据时代更是如此。我们需要强有力的工具来帮助处理繁杂的多元数据,需要灵活多样的工具来使数据以有意义的方式呈现,需要更高效的工具来让我们与数据进行交互,需要更便捷的工具来满足跨学科团队的协同工作。

Microsoft Excel

  Microsoft Excel作为日常办公必备工具应该是最为人熟知的数据工具。作为一个入门级产品,它可以进行各种数据的处理、统计、分析和决策等操作,被广泛应用于管理、统计财经、金融等众多领域。随着时代的进步,Excel也在不断加入新的数据处理功能和图表样式,特别是Power BI的加入让Excel的功能更加完备,操作更加便捷,也让Excel始终占据着不可或缺的重要地位。但对于复杂的、多元的数据结构及大数据量的支持仍然较弱,限制了其使用范围。

Thomson Data Analyzer


  Thomson Data Analyzer(简称TDA)是一个具有强大分析功能的文本挖掘软件,可以对文本数据进行多角度的数据挖掘和可视化的全景分析。它主要包括数据导入、数据清理、数据分析、生成报告等功能,其灵活的数据处理和多样的分析报告,加之与Derwent数据的无缝衔接,为发现竞争情报和技术情报,洞察科学技术的发展趋势、发现行业出现的新兴技术、寻找合作伙伴,确定研究战略和发展方向提供了强有力的支撑。从早期TDA作为技术秘密被美国政府限制使用就可看出其重要作用和价值。随着限制的解除,TDA正在向不同领域延伸。

Hadoop

  Hadoop严格来说是一个大数据存储的框架,可以让用户轻松架构和使用的分布式计算平台,开发和运行处理海量数据的应用程序。其具有高可靠性、高扩展性、高效性和高容错性四个特点,能够轻松处理PB 级数据,是目前众多大数据服务商的基础平台。但其部署与开发的复杂度也限制了普通用户的使用,同时其实时处理效率也限制了其应用的范围。

Spark

  Spark是类似Hadoop、MapReduce的通用并行框架,拥有Hadoop和MapReduce所具有的优点,但由于可以将中间步骤通过内存处理,从而提高了整体性能,尤其适合用来构建大型的、低延迟的数据分析应用程序,更有利于实现即席查询和实时统计分析。但与Hadoop类似,其部署与开发的复杂度也限制了普通用户的使用。

R

  R是一套完整的数据处理、计算和制图软件系统。R最早是诞生于1980年的S语言的一个分支。经过多年努力,其功能不断完善,目前功能包括:数据存储和处理系统;数组运算工具(向量、矩阵运算方面功能尤其强大);完整连贯的统计分析工具;统计制图功能;简便的编程语言:可操纵数据的输入和输出,可实现分支、循环,用户可自定义功能。R的灵活性是其一大特点,但需要具有一定的编程能力,这也导致了较高的使用门槛。

Pentaho BI

  Pentaho BI是一个以流程为中心,面向解决方案的框架,较其它工具更接近于实际的应用。Pentaho BI可以将一系列企业级商业智能产品、开源软件、API等等组件集成起来,方便集成应用的开发。它的出现,使得一系列的面向商务智能的独立产品能够集成在一起,构成一项项复杂的、完整的解决方案。作为一个集成框架,需要对其它各类工具有所了解,无疑提高了使用的门槛。

D3

  D3(Data Driven Documents)是一个JavaScript库,这也意味着只要有浏览器的地方就可以使用它。D3能够提供大量线性图和条形图之外的复杂图表样式,例如关联图、树形图、圆形集群和单词云等。需要强调的是,其核心并不是图形,而是将“数据可视化”抽象为数据与可视化元素的匹配,在图形与数据之间搭建了一座桥梁,可以轻松的实现图表互动与复杂图表的设计,是数据可视化和图形交互方面的重要工具。

Echarts

  Enterprise Charts,百度出品的商业级数据图表工具,与D3类似,是一个纯Javascript库,可以流畅的运行在PC和移动设备上,兼容当前绝大部分浏览器。ECharts提供了直观,生动,可交互,可高度个性化定制的数据可视化图表。创新的拖拽重计算、数据视图、值域漫游等特性增强了用户体验。支持12类图表,同时提供标题,详情气泡、图例、值域、数据区域、时间轴、工具箱等7个可交互组件,支持多图表、组件的联动和混搭展现,是一款简单、易用、美观的图表工具。

  当然,这些仅仅是冰山一角,还有很多优秀的工具有待我们去发现、了解和使用。相信随着得到越来越多优秀工具的支持与帮助,“专利支撑经济发展新常态”的目标必将更快实现。