- 一种基于节点密度分割和标签传播的Web页面挖掘方法被引量:15收藏
- 作者:张乃洲 曹薇 李石君
- 机构:河南财经政法大学计算机与信息工程学院;武汉大学计算机学院
- 来源:《计算机学报》 2015
- 关键词:页面分割 节点密度 标签传播 DOM树 块分类 社会计算 社交网络
- 摘要:获取Web页面中的重要内容如文本和链接,在许多Web挖掘研究领域有着重要的应用价值.目前针对该问题主要采用Web页面分割和区块识别的方法.但现有的方法将Web页面中重要文本和链接的识别视为两个相互独立的问题,这种做法忽略...
- 基于时间点击图挖掘的查询建议方法被引量:4收藏
- 作者:张乃洲
- 机构:河南财经政法大学计算机与信息工程学院
- 来源:《计算机工程》 2015
- 关键词:查询意图 查询建议 时间点击图 随机游走模型 查询日志 搜索引擎
- 摘要:采用查询建议技术表现用户查询意图的多样化,并自动向用户提供多种选择,是当前搜索引擎普遍的做法。但当前的查询建议研究鲜有考虑时间因素对生成查询建议的影响,而实际上在很多情况下,用户的查询意图会随着时间的推移发生改变。为此,...
- 一种基于时间感知的搜索引擎模型被引量:1收藏
- 作者:张乃洲 曹薇 陈珂锐 李石君
- 机构:河南财经政法大学计算机与信息工程学院;武汉职业技术学院计算机学院;武汉大学计算机学院
- 来源:《山东大学学报:理学版》 2013
- 关键词:信息时效性 搜索引擎模型 查询日志挖掘 页面排序
- 摘要:目前许多用户查询与网页信息的时效性密切相关,但当前的搜索引擎在处理许多具有时间属性的查询时还不尽如人意。通过引入基于时间感知的用户查询理解、索引结构和页面排序算法,提出一种基于用户查询日志挖掘的时间感知搜索引擎模型,来克...
- Fusion of user recommended web data for entity search被引量:0收藏
- 作者:Zhang, Naizhou Zhang, Yadong Cao, Wei
- 机构: College of Computer and Information Engineering; Computer College
- 来源:Journal of Computational Information Systems 2012
- 关键词:Algorithms - Data fusion - Search engines - Semantic Web - Semantics
- 一种基于文本语义扩展的记忆网络查询建议模型被引量:0收藏
- 作者:张乃洲 曹薇
- 机构:河南财经政法大学计算机与信息工程学院
- 来源:《山东大学学报(理学版)》 2023
- 关键词:查询建议 文本语义扩展 环境感知 记忆网络 编码器-解码器模型
- 摘要:提出了一种新的基于文本语义扩展的记忆网络模型,用于生成环境感知的查询建议。采用基于注意力机制的分层编码器-解码器模型,利用外部记忆网络,生成查询与查询相关文档之间的神经注意力向量。模型融合了查询层、会话层和文档层语义信息...
- 一种基于节点密度分割和标签传播的Web页面挖掘方法被引量:0收藏
- 作者:张乃洲 李石君
- 机构:河南财经政法大学计算机与信息工程学院
- 来源:《2012中国计算机大会》 2012
- 关键词:页面分割 节点密度 标签传播 DOM树 块分类
- 摘要:获取Web页面中的重要内容如文本和链接,在许多Web研究领域有着重要的应用价值。目前针该问题主要采用Web页面分割和区块识别的方法。但现有的方法将Web页面中重要文本和链接的识别视为两个相互独立的问题,这种做法割裂了We...
- 基于交叉注意力多源数据增强的情境感知查询建议方法被引量:0收藏
- 作者:张乃洲 曹薇
- 机构:河南财经政法大学计算机与信息工程学院
- 来源:《北京大学学报(自然科学版)》 2024
- 关键词:查询建议 数据增强 交叉注意力 情境感知 Transformer模型
- 摘要:当前基于神经网络模型的查询建议研究往往单独采用查询日志会话中的查询序列作为训练数据,但由于查询本身缺乏句法关系,甚至缺失语义,导致神经网络模型不能充分挖掘和推理查询序列中各种词或概念之间语义关系。针对这一问题,提出一种基...