这篇文章是我和过气文、纯、菲菲、洁洁五个同学在2019年春天写的一篇论文,路人看娱乐~
谢绝转载。
一、选题背景
1)问答社区-以知乎为例
随着网络用户群的增长和UGC网络传播模式的普及,社会化问答社区应运而生,着名的问答社区包括“Quora雅虎问答
截至2018年底,知乎用户超过2亿,问题超过3000万,答案超过1000万.3亿,是国内知名的问答社区平台,流量大。知乎网避免了知识问答社区平台过大、提问者和回答者素质不平衡、管理松散等问题,生产内容优于国内其他平台。2)为什么选择知乎的高赞回答?
文献背景
关于SQA该平台主要研究多集中平台和用户SQA平台内容质量(如孙晓宁等。SQA该系统通过百度了解用户问卷调查,构建了社会问答系统的质量评价模型。),对后者的研究较少,主要集中在答案制作人和意见领袖身上。然而,每个问答平台都有不同的定位和开发模式,不能完全适用于知乎平台。
[1]《基于SQA 建立社会化搜索答案质量评价指标http://xueshu.baidu.com/usercenter/paper/show?paperid=048cd0fd1c75f06ead0157cbb41b8c52&site=xueshu_se
关于知乎
知乎的默认答案排名不是根据高赞的排名,而是有自己的答案评价体系。在这个过程中,知乎进行了一些干预,并不意味着用户必须喜欢这些筛选后的答案。过去,对知乎用户的相关研究主要集中在意见领袖和答案制作人,很少从答案消费者的角度研究高赞的答案,高赞是用户自身行为的结果,更能反映用户的动机和偏好。
高赞Top1000
所以我们会选择知乎Top1000高赞回答(官方列表)从多方面观察高赞回答的特点,从问卷调查和深入访谈中了解用户喜欢的动机,分析高赞回答的特点和偏好。
二、目的意义
目的:通过对知乎的研究TOP通过问卷调查和深入访谈,对1000高赞问答的数据分析,了解知乎高赞回答的特点,探讨用户点赞的动机及其影响因素。
意义:在知乎上,拇指代表了用户对答案的认可和采纳。了解用户拇指知乎答案的行为和动机,有助于知乎平台更好地了解用户拇指行为和心理,更好地为用户提供拇指服务,为知乎未来的设置优化提供参考。同时,这项研究也可以为知乎提供很大的知识V提供更高质量、更被用户认可的答案的参考。
三、研究内容-问卷
赞美回答特征(爬行)人口统计信息(问卷)用户赞美动机(问卷)用户使用知乎行为(问卷)兴趣广泛(手工编码)性别有效性使用时间(爬虫获得)年龄可信度使用频率知乎认可(手工编码)学历同理心每次使用持续时间平均赞数(手工编码)职业社会使用目的类别(手工编码)收入新鲜度赞美频率问题风格(手工编码)感知娱乐话题中心(手工编码)引用数(手工编码)问卷设计-内容分布
问卷分为以下三部分
用户基本信息性别、年龄、学历、职业、收入用户使用知乎行为使用知乎的时长、频率、每次持续时间、点赞频率用户点赞动机(李克特七级量表)效用性、社交性、感知娱乐性、可信度、新鲜度、共情度问卷设计-变量类型
定类变量用户使用知乎行为:是否使用知乎、使用知乎的主要目的等。用户基本信息:用户性别、职业等。定序变量使用知乎的行为:使用时间、频率、每次使用的持续时间等。用户基本信息:收入、学历等。定距/定比变量用户赞(李克特7级量表题)用户赞动机维度-理论支持
1975年,美国学者Fishbei和Ajzen研究有意识行为意向的决定性因素。主要用于分析态度如何有意识地影响个人行为,关注基于认知信息的态度形成过程。
我们的研究参考了理性行为理论的一部分,即人类的信仰-态度-行动意图-行为。在研究用户的拇指动机时,从态度到行为意图,提出了六个维度。
[2]Ajzen I,Fishbei M. Belief,Attitude,Intention And Behavior: an Introduction to Theory and Research.Addison Wesely,Reading MA,1975
用户点赞动机维度
1)效用性: 用户认为回答能提供工作、生活或学习方面的帮助
1974年,卡茨(Katz)和布卢姆勒(Blumler)提出了使用和满足理论[3]。使用和满足理论是强调受众主动性的大众传播研究方向。根据这一理论,在大众传播过程中,重点不是媒体所做的,而是观众根据自己的需要选择媒体和内容。它包括理解的需要,即获取信息、知识和理解。因此,我们推测答案对用户的有效性会影响拇指行为,因此我们将有效性作为用户是否喜欢知乎的动机之一。
2)感知娱乐: 用户认为答案能产生愉悦感和满足感
王勇以TAM以模型为核心,结合TAM模型的变量整合了娱乐信息系统的特点,构建了娱乐系统的技术采用模型。模型结构包括变量因素,如感知易用性、感知有用性、感知娱乐性和采用意图。感知娱乐是指在计算机过程中通过比较产品的性能来体验的乐趣。技术采用模型中第三条认可的附加因素是感知娱乐。因此,我们将感知娱乐作为用户是否喜欢知乎的动机之一。
3)社交: 用户认为回答者与自己有关
Petty 和 Cacioppo研究指出,第三者效应理论 (peripheralcues) 解释了不同用户之间的关系。当个人不愿意或不能审查答案的质量时,第三方效应理论在个人阅读答案时起着重要的作用。根据第三方效应理论,从试图评估沟通效果的观众来看,最大的影响不是‘你’和‘我’,而是‘他(他们)。因此,我们将社交网络作为用户赞扬知乎的动机之一。
4)新鲜度: 用户认为回答从未见过或者与以往有所区别[6]
新鲜度是指用户从未见过或与过去不同的内容,这意味着用户采用答案的动机不仅是为了得到问题的答案,而且是为了得到一些创造性的想法,这也符合知乎笑话的现象。新颖的答案会让用户看起来明亮,并产生积极的印象,这很可能会让用户认为这些答案很有用。
5)可信度: 用户认为回答专业可靠
可信度被认为是一种感知功能,包括对人和事物的可信度和对专业知识的感知[7]。评估可信度包括四个维度:信源可信度、信息结构、内容可信度和媒体可信度。由于只研究知乎,可信度最终细化为信源可信度、信息结构和内容可信度三个维度。
过去的研究认为,信息来源会影响用户对答案的信任。因此,我们认为将可信度作为影响用户识别答案的因素是可靠的。高可信度表明用户对答案有高度的信任,并且更倾向于识别答案。
6)同理心: 用户认为答案与自己产生情感共鸣
最早提到共情的是心理学家罗杰斯,他在《论人的成长》一书中提到共情是作为一种心理治疗方法。此次研究的共情定义是源于对他人情感状态的理解、并与他人当时体验到的或将会体验到的感受相似的情绪情感反应。
借鉴Gladstein两部分理论分为认知同理心和情感同理心。认知同理心是指对他人目的、意图和信念的理解;情感同理心是指对他人情绪状态的感觉。
高度的共情表明用户对答案有强烈的情感共鸣,或者回答者本身有很强的共鸣能力,或者用户本身有很强的共情能力。
[3]传播理论
[4] 娱乐信息系统技术采用模型 王勇
[5] Petty,R. E. &Cacioppo,J. T. Communication and persuasion: Central and peripheral routes to attitude change. New York: Springer,1986.
[6] 阮佩姗、王 娟、任梦婷、刘振盼
[7] WESTERMAN D,SPENCE P R,HEIDE B V D.Social media as infor ** tion source:recency of updates and credibility of infor ** tion,171-183.
参考文献:从用户的角度来看,社会化问答社区信息可信度评价研究-沈旺 康霄普 王嘉欣 饶泽阳
Soojung,K. &Sanghee,O. Uses' relevanc ecriteria for evaluating answers in a social Q&A site. Journal of the American Society-for Infor ** tion Scienceand Technology,2009年,60年( 4)
《Critical issues in the study of empathy》——Nancy Eisenberg,Janet Strayer
问卷投放回收
问卷分发与回收:
主要方式是在线分发,将问卷分发到互联网主要平台,最终收回525份效问卷450份,其中男性138份,女性312份。
调查目的:
探讨影响用户点赞动机和不同动机点赞频率的因素。
问卷分析
表中显示了每个变量及其相应问题Alpha 系数,从表中可以看出,每个变量 Alpha 系数值均大于0.7.表明该研究的问卷具有良好的可信度。
用户特征对点赞动机的影响描述性统计分析
性别
喜欢的时候男女动机不一样吗?
假设1:表扬时,不同性别会影响用户表扬的动机
分析方法:T-test
在社交动机上
t=2 .20 df=448,p= .03
男人时,男人比(M = 4.03 SD = 1.78) 女性 (M = 3.66,SD = 1.55)更注重社会性,根据t-test 假设变异数相等的结果表明,两组的差异在统计学上显著t(448) =2.20,p=.因此,假设1得到数据支持。
感知娱乐动机
t=2 .04 df=448,p= .04
男赞时,男人 (M = 4. ** SD = 1.78)比女性 (M = 4.28,SD = 1.70)更注重回答的娱乐性,根据t-test 假设变异数相等的结果表明,两组的差异在统计学上显著t(448) =2.04,p= .因此,假设1得到数据支持。
假设1的可信度、新鲜度、共情性和有效性动机没有得到验证,即不同的性别不会影响上述赞扬动机。
为什么男生在表扬的时候比女生更注重社交和娱乐回答?(结合问卷数据分析深入访谈回答)
社会性:男生比女生更喜欢,因为他们除了回答自己的外部因素。比如回答者是自己关注的人,回答本身就有很多赞。
娱乐:男孩会花更多的时间浏览知乎上的故事或笑话,更注重幽默和新奇的答案。
描述性统计分析
核心变量 :收入
3000元及以下为低收入
3000为3000-12000元
超过1.2万元的高收入
点赞的时候,不同的点赞动机不同吗?
假设2:点赞时,不同的收入会影响用户点赞的动机
分析方法:ANOVA
在新鲜动机上
F =4.00,df1=2,df2=447,P<.05
ANOVA分析显示,低、中、高收入层的知乎用户对点赞动机新鲜度的认同程度不同,F (2,447) =4.00,P<.05. Tukey事后检定结果显示,中等收入(M=4.73,SD= 1.75)低收入 (M= 4.20,SD= 1.57) 和高收入 (M=3.84,SD= 2.18) 对新鲜动机的认可度较高。假设2被验证。
可信度动机
F =3.84,df1=2,df2=447,P<.05
ANOVA分析显示,低、中、高收入层的知乎用户对点赞动机可信度的认同程度不同,F (2,447) =3.84,P<.05. Tukey事后检定结果显示,中等收入(M=5.44,SD= 1.74)较低收入 (M= 5.06,SD= 1.71) 和高收入 (M=4.29, SD= 2.10) 在可信度动机上的认同程度更高。假设2被验证。
在共情性动机上
F =3.43,df1=2, df2=447, P<.05
ANOVA分析显示,低中高不同收入层的知乎用户对点赞动机共情度的认同程度不同,F (2, 447) =3.43, P<.05. Tukey事后检定结果显示,中等收入(M=5.42, SD= 1.66)较低收入 (M= 4.98, SD= 1.74) 和高收入 (M=4.37, SD= 2.10) 在共情度动机上的认同程度更高。假设2被验证。
在社交性,感知娱乐性,效用性动机上假设2均未得到验证,即收入不同不会对上述点赞动机产生影响。
描述性统计分析
假设3:在点赞时,不同年龄会影响用户点赞动机
分析方法:ANOVA
假设4:在点赞时,不同学历会影响用户点赞动机
分析方法:ANOVA
假设5:在点赞时,不同职业(学生或在职)会影响用户点赞动机
分析方法: T-test
经检验,假设3、4、5均得不到验证,即不同年龄、学历、职业(学生或在职)不会对用户点赞动机产生影响
2、知乎使用行为(除点赞频率)对点赞动机的影响
描述性分析——各动机得分
如图所示,效用性、可信度、共情度、感知娱乐性、新鲜度的平均分值均超过了4(七级量表),说明这些选项得到大多数用户的认同。且效用性、可信度、共情度的平均分值都超过了5,说明大多数用户以这三个选项作为自己是否点赞的首要标准。而社交性的平均值则小于3,说明用户在点赞的时候,社交性对其的影响并不大。
描述性分析-使用目的
由图可知,大多数用户使用知乎的目的是获取知识、解决问题和娱乐消遣。
假设:用户使用目的不同会影响用户的点赞动机
根据用户的使用目的主要是获取知识、解决问题和娱乐消遣,具体提出以下三个假设
假设6:在点赞时,使用目的是否是获取知识会影响用户对可信度的注重程度
分析方法: T-test分析
t =-4.28 df=136.95, P=.000
以知识获取为主要目的的用户对可信度的注重程度(M = 5.26, SD =1.61)要高于目的不是知识获取的用户(M =4.32, SD = 2.01),且根据t-test 的假设变异数相等的结果显示,两组的差别在统计学上显著t(136.95) =-4.28 , p= .000,所以假设6得到检验。
知识的首要标准是可信,目的是获取知识的用户自然在点赞时注重回答的可信度。
假设7:在点赞时,使用目的是否是解决问题会影响用户对效用性的注重程度
分析方法: T-test分析
t =-2.91 df=198.658, P=.004
主要目的是解决问题的用户对效用性的注重程度(M =5.38, SD =1.73)要高于目的不是解决问题的用户(M =4.81, SD = 1.89),且根据t-test 的假设变异数相等的结果显示,两组的差别在统计学上显著t(198.658) =-2.91 , p= .004,所以假设7得到检验。
是否能有效解决问题就取决于回答对用户的效用性,所以用户会更注重回答的效用性。
假设8:在点赞时,使用目的是否是娱乐消遣会影响用户对感知娱乐性的注重程度
分析方法: T-test分析
主要目的是娱乐消遣的用户对感知娱乐性的注重程度(M = 4.39, SD =1.74)要低于目的不是娱乐消遣的用户(M =4.40, SD =1.74),但是根据t-test 的假设变异数相等的结果显示,两组的差别在统计学上不显著t(448) =0.087 , p=0.931,所以假设8未得到检验。
用知乎来娱乐,但不一定会因为娱乐去点赞
出于娱乐消遣的目的去使用知乎的用户,在对回答进行点赞时,并不会因为回答是搞笑而点赞。
我们从采访获知,注重娱乐消遣的用户多是希望通过更加轻松的方式获取知识或独到的见解,其根本动机还是效用性,不会单纯因为回答的娱乐性而去点赞。
由上图可以看出,使用知乎时长为1年以上的用户占大多数,那么用户使用知乎的时长是否会影响用户点赞知乎的动机?具体来讲,在前面对使用目的的描述性分析中可知,知乎用户点赞回答最看重回答的效用性,那么,用户使用知乎的时长是否与点赞回答的效用性之间有显著关系呢?
假设9:在点赞时,不同使用时长会影响用户的点赞动机
分析方法:ANOVA分析
在效用性上
F =3. ** df1=4, df2=445, P<.05
ANOVA分析显示,使用时长与效用性之间有显著相关关系,F (4,445) =3.19, P<.05. Tukey事后检定结果显示,在点赞的时候,使用知乎1~2年的用户(M=5.33, SD= 1.79)和使用知乎2年以上的用户(M=5.57, SD= 1.62)较使用知乎一年以下的用户更加注重回答的效用性。假设9被验证。
使用知乎时间长的用户为什么更注重效用性?
知乎早期定位是提供专业知识的平台,早期用户是奔着知乎回答的专业有效去的。
而近年来知乎出现大量纯粹的娱乐的内容,用户看多了段子反而没有感觉,效用性才是实际的。
因此,使用时间较长的用户更加注重回答的效用性。
几乎不使用和偶尔使用知乎的用户占了样本数超过一半,那么,知乎使用频率是否会对用户点赞回答的维度产生影响呢?
假设10:在点赞时,不同使用频率会影响用户的点赞动机
分析方法:ANOVA分析
在可信度上
F =3.396 df1=3, df2=446, P<.05
ANOVA分析显示,使用频率与可信度之间有显著相关关系,F (3,446) =3.396, P<.05. Tukey事后检定结果显示,在点赞的时候,几乎不使用知乎(M=4.50, SD=2.11)和偶尔(M=5.03, SD=1.67)使用知乎的用户较有时(M=5.09, SD=1.80)和经常(M=5.43, SD=1.51)使用知乎的用户更加注重回答可信度。假设10被验证。
使用频率少的用户对知乎没有那么了解,只能从基本的可信度判断是否点赞回答。
大部分的知乎用户刷知乎时持续的时间在1个小时以下。
用户刷知乎时的持续时间会对他们点赞回答的动机产生影响吗?
我们在设定用户点赞维度的时候设置了共情度,共情度与用户沉浸程度有关,而用户的沉浸程度又与阅读时间相关,那么,用户刷知乎的持续时间是否与用户点赞回答的共情度有显著相关呢?
假设11:在点赞时,不同持续时间会影响用户的点赞动机
分析方法: ANOVA分析
在共情度上
F =3.095 df1=3, df2=385, P<.05
ANOVA分析显示,每次使用知乎的持续时间与共情度之间有显著相关关系,F (3,446) =3.095 P<.05. Tukey事后检定结果显示,在点赞的时候,使用知乎的持续时间在半小时~1个小时(M=5.22, SD=1.65)、1~2个小时(M=5.60, SD=1.56)和2小时以上(M=5.07, SD=1.93) 的用户较持续时间在半小时以内(M=4.79, SD=1.86)的用户更加重视回答的共情度。假设11被验证。
用户在知乎上的停留时间越长,沉浸程度就越高,更能产生情感共鸣,用户点赞的动机就越强烈。
3、点赞动机不同对点赞频率的影响
问卷调查中获得的样本中,在点赞回答的频率上,选择“从不”和“偶尔”选项的用户占比大于80%
既然用户在点赞频率上有这么显著的差异,那么,点赞频率与点赞动机之间存在显著差异吗?
假设12:用户的点赞动机的六个维度能够总体预测用户的用户点赞回答的频率
分析方法: 多元回归分析
bBatatp常量.9358.223.000效用性.137.3002.944.003社交性-.070-.138-2.127.034感知娱乐性.078.1652.087.037新鲜度-.018-.036-.433.665可信度-.039-.084-.729.467共情度.093.1981.959.051F =18.231 df1=6, df2=443, P<.05
多元回归分析的残差分析图
多元回归分析结果显示,回归方程整体相关性比较显著,即用户点赞动机的六个维度总体上与用户点赞回答的频率之间有显著关系,对应的p=.000<.05,并且能够解释19.8%的用户点赞频率的变动。其中,有三个维度呈现出显著的相关关系,分别是效用性:β=.300>0, t (449)=2.944, p <.05,社交性:β=-.138<0, t (449)=-2.127<0, p <.05,感知娱乐性:β=.165, t (449)=2.087, p<.05,说明这三个维度对用户点赞回答的频率影响较大。而且,残差分析显示,各观测点较均匀地分布在对角线两侧,据此可以判断残差服从正态分布,该回归分析较可靠。假设12被验证。
从上述分析可知,在影响程度明显的三个维度之中,对效用性重视程度越高的用户,点赞频率越高,相反,对社交性和感知娱乐性重视程度越高的用户,点赞频率反而会越低。
三、研究内容—爬取数据
(一)研究步骤
数据将通过以上步骤进行分析
(二)数据概况
数据来源:我们通过爬虫爬取知乎根话题下1000条高赞回答的相关数据并手工录入回答者的详细信息。
抓取时间:2019.5.1-2019.5.7
研究目的:基于数据与实践结合的原则,以生产高赞回答,增加用户影响力和黏性,帮助知乎更好地管理社区为目的研究“怎么写出一条高赞回答”。
(二)爬取说明
1. 首先爬取根话题页面下高赞回答相关信息
2. 再分别进入该回答的页面爬取回答内容的相关信息
3. 最后分别进入该回答者的个人页面爬取信息
(四)具体变量测量
基于收集的数据,我们总结归纳出三类变量,并对每类变量进行具体的划分和操作化。
(五)理论支持
1)问题特征:
问题类别:早期的问答系统提出了不少问句分类的标准,其中Wendy Lehnert提出了概念分类学,包含十三个概念类,如原因、目标、地点等等。本研究通过对疑问词短语分析,将意义和用法相同的疑问词短语归为一类疑问词。我们尝试通过探讨知乎top1000高赞问题的疑问词占比,推测知乎用户关注的问题类别。
例:拥有稀有的姓是种什么体验? 问题类别:体验类
话题中心:通过找出每一个问题的中心,我们可以探讨知乎top1000高赞问题中对象占比,尝试通过该数据推测总体知乎用户关注的问题中心。
例:拥有稀有的姓是种什么体验? 问题中心:生活
问题样式:知乎上提问的固定句式,也被称为知乎体。在每个有问题样式的问题中,都会显示属于哪一类的知乎体。我们可以探讨知乎top1000高赞问题中知乎体占比,尝试通过该数据推测总体知乎用户喜欢的知乎体。
例:拥有稀有的姓是种什么体验? 问题样式:X是种什么体验?
[1]《基于疑问句句型识别的问题理解研究》https://wenku.baidu.com/view/7488c35c52ea551810a687ec.html
[2]《中文问答系统中的问句理解》https:// ** .ixueshu.com/document/439a8ddfce05c041.html#pdfpreview
2)回答特征:
回答图片数:回答中插入图片能够增加文本丰富性,便于读者理解。研究将探讨回答图片数与用户点赞之间是否存在相关关系。
回答引用数:引用外部参考文献有助于提高答案的可信度。[3]研究将计算文本包含超链接、文章和公式数,探讨回答引用数量或者引用类型与用户点赞之间是否存在相关关系。
回答及时性:随着时间的推移, 问题和话题的热度会逐渐消退。[4]回答发布的时间越早,曝光度更高,更可能获得更多点赞数。数据用于探讨回答及时性和用户点赞之间的正向关系。
回答持续关注度:回答发布与更新的时间差一定程度上能够反映回答者对回答的持续关注度,研究将探讨回答者对回答的持续关注与更新与用户点赞之间的关系。
[3]李进华, 张婷婷. 社会化问答知识分享用户感知有用性影响因素研究——以知乎为例[J]. 现代情报, 2018, 38(4): 20-28
http:// ** .cnki.net/KCMS/detail/detail.aspx?QueryID=2&CurRec=1&dbcode=CJFQ&dbname=CJFDLAST2018&filename=XDQB201804003&urlid=&yx=&uid=WEEvREdxOWJmbC9oM1NjYkZCbDdrdW1NT2ljVVNuaFhVSUc3Rm12c2xqMjI=$R1yZ0H6jyaa0en3RxVUd8df-oHi7XMMDo7mtKT6mSmEvTuk11l2gFA!!&v=MTk2NTRxVHJXTTFGckNVUkxPZlkrZHZGeXZuVmJ2TFBTbmFiTEc0SDluTXE0OUZaNFI4ZVgxTHV4WVM3RGgxVDM=
[4]李纲, 陈璟浩.突发事件情境下网络问答社区用户构成和行为分析——基于问题胶囊事件的实证研究[J].图书情报工作, 2013, 57 (24) :95-100.
http://kns.cnki.net/kcms/detail/detail.aspx?dbcode=CJFD&filename=TSQB201324022&v=MTYwNjdmWStkdkZ5dm5Xci9QTVQ3YWJMRzRIOUxPcTQ5SFpvUUtESDg0dlI0VDZqNTRPM3pxcUJ0R0ZyQ1VSTE8=&uid=WEEvREdxOWJmbC9oM1NjYkZCbDdrdW1NT2ljVVNuaFhVSUc3Rm12c2xqMjI=$R1yZ0H6jyaa0en3RxVUd8df-oHi7XMMDo7mtKT6mSmEvTuk11l2gFA!!
3)回答者特征:
回答者可信度:回答者的可信度是其在社会网络中建立信任和增加影 响力的重要因素。知乎社区提供的投票机制和声望体系在一 定程度上为识别回答者的可信度提供了参考。在社会化问答社区中,回答者的可信度越高,浏览者认为其回答有用的可能性越大,就越有可能点赞。[5]
回答者兴趣:在陈娟等人的研究中[6]发现,表征用户兴趣的收藏数、关注话题、栏目数对其提问数和回答数有显著影响。为了探究兴趣广泛度对回答内容和质量的影响,我们试图通过数据表明高赞回答的回答者的兴趣广泛度。
回答者影响力:在信息扩散层面,意见领袖是知识共享平台中积极的信息传播者。他们提供专业优质的答案,吸引大量用户的关注并获得大量赞同和收藏,成为平台中的明星人物。获得赞同数、回答被收藏数、粉丝数这些数据项目能够直接反映知乎意见领袖明显的信息行为特征带来的 社区影响力。[7]对此我们试图通过数据探究高赞回答的回答者的社区影响力。
回答者受知乎认可度:知乎对在特定话题下创作了大量专业内容的用户进行了「优秀回答者」标识,且会推荐和收录特定优秀回答。对此我们试图通过这些数据探究高赞回答的回答者受知乎的认可度。
[5]《社会化问答知识分享用户感知有用性影响因素研究 ———以知乎为例》 http:// ** .cnki.com.cn/Article/CJFDTotal-XDQB201804003.htm
[6]社会化问答用户特征识别与行为动机分析 ——以 “知乎”为例 http:// ** .cnki.com.cn/Article/CJFDTotal-QBKX201705013.htm
[7]社会化问答平台意见领袖的知识共享行为特征探析 https:// ** .ixueshu.com/document/7d93e49fd10499daec8b4f308072b7f5.html
(六)字段名称汇总
原始数据:回答者id、性别、个人简介、知乎收录数、获得总赞同数、获得感谢数、获得收藏数、粉丝数、关注的话题、关注的专栏数、关注的收藏夹数、回答数、提问数、问题、回答、回答发布时间、回答编辑时间、图片引用数、回答获赞数
拓展数据:现居地、曾居地、所在行业、职业经历、是否为优秀回答者、问题样式、话题中心、问题类别、回答发布与编辑的时间差、回答引用数、问题提问时间、回答发布与问题提出时间差
(七)数据说明
1)问题特征:
问题样式:知乎上提问的固定句式,也被称为知乎体。在每个有问题样式的问题中,都会显示属于哪一类的知乎体。
话题中心:通过阅读答案与问题,根据知乎话题广场中的话题和自己添加几个更加贴合的话题划分每个回答的话题中心。
划分的话题中心:生活、经济学、运动、互联网、艺术、阅读、美食、动漫、汽车、足球、教育、摄影、历史、文化、旅行、职业、金融、游戏、篮球、生物学、物理学、化学、科技、体育、商业、健康、创业、设计、自然科学、法律、电影、音乐、地理、明星、政治、神话、计算机、社会、人际交往。
问题类型:通过阅读答案与问题,将问题划分为6个类型,囊括知乎高赞top1000的问题类型。
问题类型:体验类、技能类、科普类、评价类、评价类、脑洞类。
问题方面的手工编码说明:
我们将问题分为问题样式、话题中心和问题类型进行三个方面的分析。其中,问题样式只需要手工录入每个问题中出现的知乎体,没有出现则记为“无知乎样式”。
在手工编码话题中心和问题类型前,小组通过试编码相同的50条高赞问答,检验了手工编码的信度,小组一致相同率达到90%。
2)回答特征:
图片数:通过爬虫得到回答中包含的图片数
引用数:手工编码回答中引用的数量,包含公式、外部链接、文章。
及时性:回答发布与问题提问的时间差。时间差越小表示回答的及时性越强。
对回答的持续关注程度:回答编辑与回答发布的时间差。时间差越大表示回答者持续关注度越高。
对回答的持续关注程度:回答编辑与回答发布的时间差。时间差越大表示回答者持续关注度越高。
3)回答者特征:
关注栏目数:回答者在知乎上关注的专栏(即由知乎网友开设的由其本人写的同一话题的文章 ** )数量。
关注话题数:回答者在知乎上关注的话题数量。
关注的收藏夹:回答者在知乎上的收藏夹里的种类数量。
兴趣广泛度:获赞数:回答者总共获得的赞同数,包括所有回答。
收藏数:回答者的所有回答获得其他知乎网友的总收藏数量。
感谢数:回答者总共获得的感谢数。
优秀回答者:回答者是否被知乎认证为“优秀回答者”,被认证为优秀回答者的用户在某些话题的回答到达特定数值,且回答专业、认证、友善。
知乎收录:回答是否被收录到知乎知识库专栏(知乎知识库专栏会收录除涉及娱乐、情感、时政、商业品牌、或是与主流科学观点相悖的内容外的其他内容,欢迎各位知友投稿)栏目数、话题数、收藏数越多,代表兴趣越广泛
回答获赞数:该回答获得的总赞数。(若某回答者在Top1000中出现多次,则取该回答者的获赞中位数。)
获得赞同数:回答者总共获得的赞同数,包括所有回答。
回答数:回答者回答他人提出问题的总数量。
回答者个人平均获赞数:获得赞同数/回答数
(八)利用tableau研究问题
高赞回答的诞生
1)什么样的回答者:
兴趣广泛的人更容易获得高赞吗?
粉丝多的人更容易获得高赞吗?
被知乎认可的人更容易获得高赞吗?
高赞回答的出现是偶然吗?
2)什么样的问题:
应该回答什么样式的问题?
应该回答什么类别的问题,更有机会获得高赞?
应该回答什么类的问题,能获得更多的赞?
3)什么样的回答:
引用图片和外部资料能获得高赞吗?
发布回答后,持续更新可能会获得更高的赞吗?
(九)假设验证
假设:不同问题类别对回答获赞数的影响程度不同。
分析方法: ANOVA分析
F=3.26,df1=5,df2=975,P<.05
ANOVA分析显示,不同问题类别地问题对回答获赞数影响程度不同,F(5,975)=3.26, P<.05。Tukey事后鉴定结果显示,技能类(M=46383.06,SD=32312.68)较体验类(M=42965.77,SD=21797.45)对回答获赞数的影响更为显著。假设被验证。
假设:回答发布与更新时间差和回答获赞数之间存在相关性。
分析方法: 相关分析
相关分析显示,回答发布与更新时间差和回答获赞数之间存在显著相关,r=.07,p<.05,研究假设得到支持。
(十)结论:如何写出一条高赞回答
四、研究结论
(1)研究显示,用户的点赞行为是十分贴合知乎这一理念的。问卷中,用户最注重的是回答的效用性和可信度,数据分析显示技能类问题是平均点赞数最高的问题种类。
(2)在高赞回答中占比最多的体验类问题,既分享经历,满足本能的窥视欲,又能在提升愉悦感和共情感的同时获得新知或见解。这在用户问卷中也能得到体现,用户在点赞时十分注重回答的效用性和共情度。或许,人们如果能在寻求答案的过程中与他人产生情感共鸣或达成共识,会比简单获得答案带来更多愉悦与满足感。
(3)知乎平台可以结合用户以上信息需求,提高平台内答案的质量水平。主要从以下两方面进行考虑。
保证目前平台精英用户的活跃度,鼓励精英用户提供高质量信息,在一定程度上可以采取奖励机制。提高平台对有用信息的筛选能力,尽可能根据用户的喜好来传播实用且能共情的知识,促使信息的供给和需求的双向汇合。五、反思与不足
(1)不同性别、年龄、学历、职业、收入的用户样本数量不均衡,产生样本偏差。
(2)未对问卷量表题部分进行效度分析以及进一步地修正。
(3)动机研究只针对有限个影响因素,对于影响用户点赞行为的潜在因素未进行严格的考虑分析
(4)由于回答者的居住地、职业经历和教育经历等个人信息大部分缺失,导致无法较为全面研究知乎top1000高赞回答者的情况
(5)由于能力问题无法对知乎top1000高赞回答进行内容分析,本次研究仅从回答者特征、问题特征和回答特征进行浅层分析,无法进入更深一步的分析。
扫码咨询与免费使用
立即获取免费试用
立即咨询