尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 随着网络空间不断扩展,其中传播的信息的可靠性和真实性变得愈发重要,特别是在电子商务方面,这是因为潜在消费者在做出购买决定之前会优先查看在线评论。这些评论可以通过相关网站轻易获取,但由于缺乏对其真实性的验证引发了人们对其可靠性的担忧... 展开 随着网络空间不断扩展,其中传播的信息的可靠性和真实性变得愈发重要,特别是在电子商务方面,这是因为潜在消费者在做出购买决定之前会优先查看在线评论。这些评论可以通过相关网站轻易获取,但由于缺乏对其真实性的验证引发了人们对其可靠性的担忧。此外,一些用户通过发布虚假评论,误导其他用户购买目标产品造成一定经济损失。为了维护网络空间的经济秩序,能够有效地检测出不可靠和虚假的评论具有重要的现实意义。本文从评论数据提取语言特征和行为特征基础上,使用图神经网络提取评论之间的关联特征,并且融合欠采样和随机森林方法对提取的特征进行分类,具体研究内容如下: 1.分析并结合现实世界网站Yelp数据集实体属性,构建有效识别虚假评论的特征集合。该特征集从评论行为、评论文本两个方面出发,首先在时间、评论数量、评分、交互等维度上构建10种行为特征,然后从文本的字词数量、相似度等角度上构建2种特征,这些特征能从不同维度刻画虚假评论,并且实验验证这些特征的重要性。 2.提出EasyEnsemble-RF算法实现对虚假评论的检测。本文首先分析EasyEnsemble中基分类器的特性,考虑使用随机森林替代其基分类器,使其能够对抗少数类中异常数据的干扰,并使用欠采样方式处理数据后以随机森林为基决定分类模型结果,实验表明其有效提高原模型的各项指标。 3.提出一种基于TrustRank改进的图神经网络算法来尽可能找出更多的虚假评论。本文提出可疑值概念来量化评论节点在评论网络中的虚假程度,并以所提特征来初始化节点的可疑值后使用TrustRank在网络中不断传播可疑值直至达到设置的次数,然后根据可疑值分为四种采样策略生成节点邻域,使用自适应采样方式来起到丰富邻域信息和抵抗噪声干扰达到提高邻域质量效果,最后聚合邻域信息生成节点嵌入并与Doc2vec提取的段落嵌入拼接馈入EasyEnsemble-RF中训练和预测。通过实验分析,所提方法具有良好的查全效果。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。