理事观点

谢寿光:大数据时代的学术出版

来源:社科文献 发布时间:2017-04-27

  最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”①大数据在物理学、生物学、环境生态学等领域以及军事、金融等行业存在已有时日,却因近年来互联网和信息行业的发展而备受关注。哈佛大学社会学教授加里·金说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。”学术出版自然概莫能外。互联网浪潮席卷一切,学术出版生态也因之发生变化。而大数据作为互联网浪潮中具有标志性意义的重要技术之一,带来了一场技术与思维的变革,提供了无限的机遇与可能,开启了学术出版的美好时代。

 

146682_400x5000

 

一、 传统学术出版的发展困境

  学术出版是人类思想市场不可或缺的组成部分,是学术交流传播的基本工具和平台,承载着传播学术、传承文明的功能,处于人类出版活动的核心或顶端位置。与今天的学术出版言必称西方不同,中国的学术出版也曾有过辉煌。从历史上来看,中国的学术出版并不落后,20世纪二三十年代,商务印书馆、中华书局代表着亚洲学术出版的最高水平,与欧美老牌学术出版机构不相上下。但从20世纪50年代起,中国的学术出版受到诸多因素制约,自身发展空间狭小,往往依附于大众出版和教育出版生存,发展进入困境,其难点或问题大体可归纳为以下四个方面。

  一是受众面窄,成本高。因为学术作品的专业性强,要求读者具备相应的专业背景和知识储备,所以学术出版的受众规模远不如教育出版和大众出版,是小众的选择。因其固有的专业性限制,学术出版在整个出版市场的占有率低,市场空间拓展也较为困难。这必然导致学术出版的成本比教育出版、大众出版都要高。加之市场和读者因学术出版物的价格在心理接受方面受到制约,学术出版单位难以通过大幅提高书价来消解成本压力。

  二是生产周期长。学术研究成果的生长周期本来就长,出版流程也是费时费力。尤其是审稿编辑方面,除常规的三审三校制外,严肃的学术出版社对部分书稿还会送学科或行业专家评审,审稿周期更难把控。一本书稿的正常出版周期在6个月左右,不少老牌的出版社往往要在10个月甚至一年以上。

  三是专业化要求高。学术出版属专业出版,有极高的专业性要求,处于行业顶端位置。新中国成立后,学术出版尤其是人文社会科学学术出版在特殊历史时期也受到了“左”的影响,专业性被大大降低。实行市场化改革后,图书的商品功能又被过度强化,三大出版边界模糊,学术出版成为教育出版和大众出版的点缀,其专业性被弱化或泛化,始终未形成通行的学术出版规范。截至2015年底,全国共有图书出版社584家②,90%以上的出版机构都涉及学术出版,但真正以学术出版为主业(年学术出版主营业务收入占总收入的50%以上)的不超过十几家。当下中国学术著作泛化、低水平重复甚至剽窃、抄袭等种种乱象,与中国学术出版机构专业化水平低有很大关系。

  四是学术图书出版和学术期刊出版分离。学术图书和学术期刊统属于学术出版范畴,都是学术成果的载体和发表、传播工具,有着内在的逻辑联系。国际上多数学术期刊都是由学术出版机构负责运营的,而中国现行出版管理体制则是学术期刊和学术图书出版分离,大多数学术期刊独立于学术图书出版机构之外,依附于学术研究机构或大学、政府部门生存,市场化程度极低,其结果必然使本来就弱小、分散的学术出版市场空间更加弱小。

 

二、 学术出版生态悄然改变

  互联网浪潮席卷一切,深入一切,学术出版生态也在发生新的变化。

  第一,阅读方式方面,面对信息时代的海量资源,数字化阅读渐成主流阅读方式。截至2015年,我国成年国民数字化阅读方式的接触率已达64%,连续7年持续上升。③通过终端设备尤其是便携的移动终端进行碎片化阅读、泛阅读成为阅读新特点。

  第二,学术知识需求方面,人们对知识的需求呈现更加专业化和多元化的特征,对专业深度资讯、细分领域资讯、个性化研究成果的需求成倍增加。碎片化阅读、泛阅读习惯下的深度专业资讯服务,乃至全方位的知识服务,成为知识提供者的重要竞争力之一。

  第三,学术生产方式方面,学者开始运用技术工具提高科研工作效率。基于大数据技术的新科研工具的应用,更使学术生产能力迅速提升、学术产品呈爆发趋势。大数据促使传统科研范式转型,数据密集型科研成为重要趋势。④过去的学术论文写作耗时费力,现在通过数据库很快就能查询到研究所需资料,大大降低了学术内容生产的时间成本。各种交易数据、海量数据替代了实地调研,在生产领域为学术出版提供了无限可能。传统学术出版所推崇的“十年磨一剑”成为历史,“一年磨十剑”成为常态(至少在社会科学学术领域是如此)。交流互动在学术生产中的作用日益突出,互动式出版成为学术出版新亮点。对此,可成为佐证的是,近年来,学术专著特别是个人学术专著比重下降,而专题论文集、研究报告集等合著、合编式学术图书的比重明显上升。

  第四,出版主体发生变化。数字时代也是自出版时代,学术出版门槛开始降低,学术交流自由的屏障进一步打破。自出版平台、免费出版平台涌现,众筹出版作为一种新的出版方式登上舞台,知识生产者与编辑的界限开始模糊,“研而优则编,编而优则研”成为学术研究和学术出版的常态。

 

三、 大数据开启学术出版美好时代

  无论是对于学术研究,还是出版社决策,数据都是基础性资源。信息时代带来了数据的爆发式增长,而大数据技术则使出版社数据资产的内在价值得以实现,使以用户需求为导向提供全方位知识服务成为可能,开启了学术出版的美好时代。

  (一)驱动学术生产的智能化、跨界化

  1. 大数据智能分析推动学术生产由模拟化向智能化转型

  大数据能够将模拟数据转变为可制表分析的量化形式,使图书文字由信息变为数据,不仅人可以阅读,机器也可以对其进行分析。⑤基于大数据的智能化信息抓取与分析工具,能快速处理不断增长的海量数据资源,从而得出有意义的结论,使学术生产过程更加智能,得出的结论更加精确。尤其是在信息时代,知识生产呈幂数级增长,研究范式与知识体系更新变化频率加快,大数据智能分析能为知识体系的动态构建提供支持,为信息时代的学术生产提供强有力的指导与支撑,催生了大量个性化的研究成果。

  2015年,南京大学社会学系陈云松副教授发表的《大数据中的百年社会学》一文,为我国利用大数据技术进行人文社科研究提供了初步经验。一直以来,社会学发展史的研究都急缺数据的经验支撑,大数据技术则在数据支持方面提供了无限可能。就数据基础而言,该文作者利用的谷歌图书最新语料库含811万种书籍、8613亿词汇,网络搜集、抓取的庞大数据资料为研究分析提供了夯实的基础。数据处理速度方面,传统数据分析技术需要12天才能处理完的数据,大数据技术仅20分钟就能完成。有了这些数据优势,再加上合适的检索词设计,所得结论的精准性可得到极大提升。⑥陈云松的这次尝试,为社会学研究提供了一种新的思路和方法,也很好地说明了大数据对于学术生产的助力。

  2. 数据挖掘与语义分析推动跨学科、跨国别的学术生产

  从学科发展的历史进程看,曾经历了从“合”到“分”的过程,现在正在走向新一轮的“合”。传统经典学科的边界不断被打破,大量交叉学科、多学科研究领域开始出现。基于大数据的知识深度挖掘、语义分析,可建立起知识关联网络,从而实现学科间知识的融合,助力于跨学科的学术生产。

  传统时代主要通过参与国际学术会议、访问学者等方式分享信息、交流研究成果。大数据则快速实现了全球互通互联,通过互联网即可获取全球最前沿的信息数据,推动了国际学术信息共享与跨国别的学术生产。

  (二)驱动学术出版从“小众化”走向“分众化”

  随着学术生产逐渐从专业化走向跨界化,越来越多的小型专业化群体也有逐步变大的需求和趋势。小型专业化群体加入越来越多的跨界研究者,或与其他群体发生交流、合作等关系,使得其群体构成日益复杂、群体规模日益壮大,这就是本文所说的“分众化”。以史学研究为例,最初的史学研究仅限于文献研究;之后人类学、社会学领域的研究者加入,以新的角度和方法研究史学;在量化史学研究中,又有一大批经济学家加入,充实、壮大了史学研究力量。

  而大数据的分类、聚类与关联规则,则能催生学术出版的“受众长尾”,驱动学术出版从“小众化”走向“分众化”,帮助实现“小众需求”市场价值的最大化。首先,大数据的分类技术(根据受众对产品的喜好将其分成不同的类)能有效找到个性化受众。其次,通过聚类分析,以知识要素为基本单位,将具有共同偏好的受众聚集在一起,形成众多个性化的小型学术社区。最后,通过关联规则将知识要素链接、拓展形成知识体系,从而使各小型学术社区之间不断发生联系,形成大的学术共同体。⑦

  (三) 驱动出版业务流程的科学化、互动化

  1. 数据记录与纠偏、调整功能保障学术出版全流程的科学运行

  传统学术出版是相对固定、封闭、单向度的“作者—出版社—读者”模式,大数据使得出版业务流程变得动态、多元、立体。⑧融入大数据建立起的数字化协同编辑平台、数据仓库,不仅可以打通各出版业务部门、不同出版物间的界限与隔离,使作者、编辑、设计人员、营销人员、读者之间的交流互动更加高效,实现资源的优化配置,还能记录下出版全流程中的每一次行为,为审视过往的出版行为提供依据。当某些数据突然报错或有偏离正常轨道的趋势时,系统能迅速报警或预警,从而使相关工作人员及时做出调整,防微杜渐,保证学术出版全流程的良性运转。

  社会科学文献出版社利用大数据技术搭建了数据仓库,通过整合社内多个业务系统的数据,并在此基础上建立BI(Business Inteligence,商业智能)决策分析系统,为企业决策提供依据,取得了非常不错的效果。目前,出版社正在建设基于“社会科学文献出版云”的数字内容生产与管理平台,形成统一的信息流、资金流、物流、人才流,搭建统一协同办公平台、协同编辑平台,形成协同、分享、学习、创新的机制,做到主动、快速、高效地响应内外部需求,实现价值的有效传递。

  2. 预测性分析使各项业务决策更加科学精准、贴近用户

  预测功能是大数据最重要的价值之一,依据记录、抓取的数据科学建模,达到预测未来的目的,实现数据价值增值。预测性分析结果是在长期监测的海量数据的基础上得出的,能够对事物的发展趋势做出较为准确的预测,以它为指导做出的选题策划、印数、馆配发行、营销推广等决策能更加科学、精准,更加贴近市场和消费需求。

  (四) 驱动学术出版服务的个性化、精准化

  1. 语义引擎实现了读者消费体验和阅读需求的实时挖掘

  语义引擎即将大数据分析运用于网络数据挖掘,从用户的搜索关键词或其他输入语义,分析判断用户需求,以便更好地开展服务。互联网搜索已经成为用户获取学术资源最主要的途径,利用语义引擎分析用户偏好,精准推送学术资讯、信息、数据、产品甚至广告,及时改善用户体验,提高用户的内容使用率,有利于实现学术出版服务的个性化、精准化、多样化。

  2. 数据管理强化了“用户关系管理”

  关系营销关注于吸引、发展和保留客户关系。21世纪以来,关系营销受到前所未有的关注。学术出版用户群体规模较小,通过良好的用户关系管理,提高用户忠诚度,是学术出版拓展市场的重要方式之一。大数据无疑为这一方式的实施提供了便利。大数据支持针对每一位用户,将抓取、追踪到的与其相关的数据进行整理并实时更新,形成灵活、动态的个性化用户档案,从而增强对用户的了解以及与用户的关系,达到更好地服务用户、长久地留住用户的目的。

 

四、 传统学术出版单位如何拥抱大数据时代

(一) 转变观念,找准定位

  大数据时代,传统学术出版单位要转变观念,争做服务商,而不再是简单的出版商;生产文化产品,而非简单的图书;把读者当作用户,而不仅仅是知识普及和教育的对象。要认识到融合是出版业未来的生存发展之道,积极融合纸质出版与数字出版,并立足于自己所做的内容产业,和各类媒体实行全方位的融合。

  虽然学术出版的强专业性在一定程度上限制了其受众规模、市场拓展,但专业性也是大数据时代学术出版发展的重要突破口。学术出版单位要找准自身核心优势,立足专业化,先服务好各个细分市场的小众团体的需求,再通过关联网络去建立大型学术共同体。

  (二)创新出版模式

  依靠单本精品书孤军奋战的时代已经过去,打造内容整合平台才是未来出版业之本。以专业数据库为平台、以知识服务为导向、全面整合学术资源的出版模式,将成为学术出版新常态。学术出版单位应搭建专业知识服务平台,并找到适合自身的盈利模式,知识、服务、技术都可能成为新的盈利增长点。社会科学文献出版社结合自身传统出版与数字出版的优势与经验,已与宁夏大学阿拉伯学院、国际教育学院等开展合作,探索人文社会科学学术出版新模式,既做资源整合、产品销售,又提供技术平台和定制服务。

  (三)再造传统出版流程

  传统学术出版的生产力和生产方式已经不能满足大数据时代“快速、个性、全球”的学术研究与传播需求。通过数字出版再造传统出版流程,以数据驱动决策,以数据优化管理,实现传统出版与数字出版的联动,减少资源浪费,提高学术出版生产效率势在必行。

  (四)借力数字出版技术

  传统学术出版单位虽然立足内容资源,但也要保持对新技术的敏感度,重视对新技术的应用,以技术的强大助力实现内容资源价值的最大化,实现用户服务的精细化。在技术路径选择上,没有最好的,只有最合适的,如AR技术能实现少儿出版、教育出版的增值服务,人文社会科学学术出版则更适于打造知识资源库与知识服务平台。而且技术是不断发展的,需求是不断变化的,技术应用不能追求一步到位,但也不能每次都推倒重来,应基于充分完善的底层设计再不断进行迭代开发。

  以技术促进学术研究、传播知识价值,实现智慧型出版,提升我国的学术话语权,是中国学术出版者不可推卸的责任。在新技术的冲击下,不进则退,学术出版单位应树立起大数据时代的学术出版自信,把握机遇,创造学术出版新辉煌。

  注释:

  ①Manyika J,Chui M,et al.Big data:The next frontier forinnovation,competition,andproductivity[EB/OL]. http://www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation.

  ②尹琨.2015年全国新闻出版业基本情况发布.中国新闻出版广电报,2016-09-01.

  ③第十三次全国国民阅读调查结果发布:数字化阅读迅猛增长 微信阅读人数过半[EB/OL].[2016-04-18]. http://news.xinhuanet.com/politics/2016-04/18/c_1118659452.htm.

  ④贺威,刘伟榕.大数据时代的科研革新.未来与发展,2014(2).

  ⑤周煜.大数据时代出版行业发展趋势分析.中国出版,2014(7).

  ⑦邓凤仪,邓海荣.大数据时代数字出版的“长尾效应”.出版发行研究,2014(10).

  ⑧张月萍.出版生产、学术研究与出版业评价的“反转模式”——试论大数据时代出版业的新演变.出版发行研究,2015(3).