尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 近年来随着电子商务和众包技术的迅猛发展,用户产生的地址数据呈现爆炸性增长。在各种基于位置的业务(如外卖服务和快递)中,地址匹配是一项至关重要的任务,其目的是识别地址数据库中具有相同位置的地址。由于中文地址表述有很多可能的方式,所以这... 展开 近年来随着电子商务和众包技术的迅猛发展,用户产生的地址数据呈现爆炸性增长。在各种基于位置的业务(如外卖服务和快递)中,地址匹配是一项至关重要的任务,其目的是识别地址数据库中具有相同位置的地址。由于中文地址表述有很多可能的方式,所以这是一项具有挑战性的任务。传统的地址匹配方法依靠字符串相似性和学习匹配规则来识别同一位置的地址,然而很难解决地址冗余,地址不完整或地址错误表达的情况。 针对以上问题,本文研究了数据采集、文本嵌入、地址匹配等技术,实现了POI(Point,of Interesting)中文地址模糊匹配系统,具体内容包括以下几个方面: 1.为了学习地址字符串的地理语义表示,本文提出了通过搜索引擎从网络获取丰富的地址上下文,这可以极大地丰富可以学习的地址语义。 2.本文提出了一种基于句子嵌入的地址匹配算法。该算法使用编码器一解码模型来学习每个地址字符串的语义向量表示,并且注意机制也被应用到模型中,用来突出地址在语义表示中的重要特征。 3.更进一步,本文还提出了基于图嵌入的地址匹配算法,该算法把地址语料库中所有的地址构造一个大图,其中包含地址要素节点和地址节点,节点之间的边的权重是通过学习词语之问的共现信息得到。然后通过训练图神经网络得到图上所有节点的嵌入表示。本文在两个真实的地址数据集上进行实验。实验表明,相比以前的方法,本文提出的方法大大提高了准确率(高达8%)和召回率(高达12%)。 4.实现了一个自动进行模型训练和地址匹配的系统,能够更好展示实验结果和更方便在其他数据集上做实验。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。