习近平总书记提出,让人民生活幸福是“国之大者”。社会学应思考如何立足中华民族伟大复兴战略全局和世界百年未有之大变局,心怀国之大者,服务国家战略,成为当务之急。在这个转型过程中,传统定量社会研究和服务国之大者之间,存在问题意识、分析对象和社会影响三方面不完全匹配现象,在一定程度上削弱了社会学服务国家治理能力现代化的潜力。而大数据为这一瓶颈的破解提供了重要机遇。
问题意识:从传统理论主导转为重大问题导向
从社会研究方法的角度看,一项研究背后的问题意识已经决定了研究的方向和目标。中国社会学的发展在成长阶段大量吸收了西方的传统理论体系和研究范式,这种后发的发展路径使得实证研究往往形成用中国数据来检视西方既有理论的问题取向。一方面,相关经典议题仍习惯以西方社会的问题意识为基本观照,如社会分层、教育回报、女性权力等均扎根于西方社会治理的经验。但西方的议题并不能满足和适应当代中国社会发展的本土理论需求。另一方面,中国社会治理面临或解决了的重大问题,却往往没有得到足够关注,如巨型城市群的融合发展、海量人口城镇化、教育与医疗改革、乡村治理、精准扶贫等。究其缘由,中国尚未成熟的本土化理论建构和以西方理论为导向的学术惯性,使研究者在预设选题甚至设计问卷、收集指标时,往往不知不觉沿袭西方定量研究的传统窠臼,形成问题意识的被动设置。
形式多样的大数据为重新培养定量研究者的问题意识,聚焦本土社会治理过程提供了重要的突破口。多数据来源的大数据信息正在反映当代社会治理过程的方方面面,而这些数据蕴含的社会治理价值也驱动着研究者跳出传统定量研究的方法论范式、议题设置,逐渐关注我们切身经历的本土化问题,并形成扎根中国大地的社会概念、社会指标甚至话语体系。例如,电子政务平台的大数据能精准聚焦于人民的现实问题与需求;社交自媒体平台承载的实时信息能很好地洞察舆情和社会心态;电信数据能动态地展现出人口流动与迁徙的完整图景;基于互联网平台的消费或出行数据能勾勒出城市整体的生活方式和消费结构……大数据正在反映当代中国社会治理中的社会行为、社会心态和社会结构,反映扎根于中国本土社会、与人民幸福息息相关的“国之大者”。
分析对象:从个体人转为社会治理单元
当代定量研究的调查对象为个体人。从社会学的方法论原则上看,长期以来,个体主义方法论传统提倡对社会现象的解释要建立在个体特征上。同时,为了避免分析层次不同带来的区群谬误,对个体变量的解释也多限于个体层面,群体层面的宏观指标则日益被排除在社会学定量研究的分析框架之外。从数据获取的客观原因上看,传统社会学所关注的指标,如社会分层、社会心态、生活方式等,和经济学指标相比,往往具有高度隐藏性,收集起来成本高、难度大、周期长。将个体样本加总成以县、市为单位的群体性指标,又因稀疏样本的限制而难以有统计学上的信度。即使想着眼于群体单位的研究者,也会因为数据可得性的限制而陷入巧妇难为无米之炊的困境。
个体层次的研究使得社会学定量分析可以对基于人理性行动的理论进行解剖,但对于国家治理特别是超大国家治理的借鉴价值有限。在对个体样本进行分析时,已经假设样本是独立的,回归模型估算出的系数是对x对y的平均效应在总体上的统计推算。而这样的回归模型分析对于大国治理,只能做出初步的理论指导,对具体的社会政策施行与评估不能完全胜任。这是因为,中国幅员辽阔,无论是乡、县、市,还是省、国家,不同层面不同单位的行政区划都有着高度差异化的社会特征和地方治理模式。根据模型推算出的统计量,要更直接地助力中国社会治理,就应该以社会政策的制定和执行单元如县、市、省为单位进行样本分析。
带有时间和空间属性的大数据为分析样本从“个体人”转向社会“治理单元”提供了可行路径。社会研究者能从海量大数据中建构群体指标,用以分析宏观社会。大量社会行为、社交网络等大数据能够将个体精准定位在所属的时间地理空间,进而汇集成群体层面的宏观指标。如基于用户搜索行为的大数据能精确到省、市、县的具体数据;地理信息数据能提取各个地理层级的商店数量或基础设施情况。这些以群体为单位的数据分析模型能够清晰地区分出不同社会背景和治理政策下的社会状态,有助于找出可进行干预的相关因素,助力社会治理科学化、有效化。
社会影响:从专业术语走向公共话语
定量研究有一套专业的理论术语和模型术语,理论术语植根于西方社会学话语体系,模型方法术语植根于计量和统计学。一方面,过度依赖全国性社会调查二手数据的研究现实,往往把研究者框定在有限的社会议题和理论框架之内;另一方面,愈加复杂且愈加适用性有限的高级统计方法和实验则成为定量研究者集中发力的方向。从描述走向关联,从回归走向因果推断,虽然提高了专业性,却也日渐削弱着定量社会学的社会吸引力和影响力。只有让老百姓和决策者都能看懂甚至喜欢看,才能提升定量社会学服务“国之大者”的经世致用能力。而定量研究者和从事理论研究甚至质性研究工作者相比,在概念整合包装、理念社会传播方面也存在着差异:前者更多地聚焦同行评议的论文发表。因此,定量社会学研究应更加重视公共话语权和社会影响力的建设,避免躲进小楼成一统地沉浸在模型检验的工作坊中,而是要学会一种新的公共话语方式,提出具有丰富中国内涵和时代特征,具有扎实数据支撑的概念、理论,多多参与到公共话语的引导中去。
在这方面,大数据具有很多独特优势。例如,它可以用描述、结构化、可视化的方式,通俗易懂地展示传统方法所不能反映的社会结构属性和特征。较之原来侧重于描述变量间数量关系的回归模型分析,对大数据的分析可以有很多新的研究范式。比如,基于非监督学习的主题分析方法可以将《马克思恩格斯全集》或《全唐诗》这样的鸿篇巨制化约为大众能够快速理解的主题,并能在大历史时间跨度上直接展示文化脉络和经典理论的发展规律;基于大量数据和监督学习的算法预测能直接给出家暴发生率、群体事件发生率等隐藏性社会指标的准确估值;空间计量分析的可视化能够基于地图直观给出不同社会治理指标的空间地理分布或不同城市间的人口流动形式,宏观复杂的社会系统跃然纸上。通过数据支撑获得的最生动、最有说服力的结果,是定量研究者向中国公众、全球学界和社会展示中国之治、中国方案,发出中国声音的最好武器。
大数据正为传统定量社会学研究注入新鲜血液。社会学定量研究者应以中国当代社会治理重大问题为导向,拓展服务社会治理的宏观分析新疆域,并以提高社会影响力为目标,牢牢把握大数据带给传统量化研究的历史机遇。大数据之于“国之大者”,不仅限于对当时当地社会重大问题的精准把握,亦能助力中国之治扎根地方,立足全国,放眼世界,形成亘古通今、纵目全球的现代化治理能力。从时间维度看,中国社会正在经历百年未有之大变局,而社会治理的方方面面都在因时因地不断进行创新、修改和深化。社会学研究者更应充分利用大数据的时空标签,在历史维度中把握社会治理的运行逻辑与发展经验。从地理维度看,大数据的收集不再局限于中国样本,跨越国家的全球数据将帮助研究者解剖国际社会,在全球治理的相互参照中审视全人类社会的发展规律,形成具有中国本土化和世界影响力的理论关怀,从服务“国之大者”向服务全人类之共同福祉不断努力。
(作者单位:南京大学社会学院)