尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 在科学技术研究中,科技发展战略是一个至关重要的问题,其难点在于如何对未来科技趋势做出准确判断。现有的科技趋势判断主要由专家经验得出,主观性较强而且不够全面;此外,判断结果主要以科技咨询报告的形式呈现,且报告需要多名专家参与撰写,耗... 展开 在科学技术研究中,科技发展战略是一个至关重要的问题,其难点在于如何对未来科技趋势做出准确判断。现有的科技趋势判断主要由专家经验得出,主观性较强而且不够全面;此外,判断结果主要以科技咨询报告的形式呈现,且报告需要多名专家参与撰写,耗时耗力。针对科技趋势判断中的上述问题,论文对自然语言处理领域的科技文本自动生成技术开展研究,从而为专家撰写科技咨询报告提供前置支撑。 本文研究内容主要有三个部分,一是构建价值评估指标体系,根据场景需求,多维度科学评估科技信息的价值;二是基于自然语言处理技术中的GPT-2模型,研究自动生成科技文本的方法,以根据特定的科技话题生成与其相关的文本概述;三是提出一种科技长文本质量评估指标,用于评估自动生成的科技长文本质量。 针对科技趋势需要多维度评估判断的问题,通过分析科技专利价值的固有属性,提出了一种价值评估指标体系,该指标体系具有技术、经济、法律、专利权人4个一级指标,以及与之对应的10个二级指标和41个三级指标。该指标体系可以从多个维度对科技内容进行较为全面的评价。 针对科技文本撰写过程成本高昂的问题,通过分析自然语言处理中的静态词向量和动态词向量模型,提出了一种科技长文本的自动生成方法。该方法结合动态词向量模型的GPT-2技术与BERT模型的中文分词表进行构建。实验结果表明,该方法可以根据输入生成一段相关科技文本,且原始数据规模越大、与主题关联程度越高,模型所生成的文本质量就越好,该方法可以降低时间与人力成本。 针对传统指标无法对科技长文本进行评估的问题,通过分析基于词向量方法的评估指标、基于深度学习GAN方法的评估指标以及机器翻译领域的BLEU指标,提出了一种科技长文本质量评估指标。该指标通过用词的准确性、语句的连贯性、文章结构的合理性与科技文本内容的关联程度四个方面对科技长文本进行评估,可以对生成的多个科技长文本质量进行比较。实验结果验证了评估指标的可行性。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。