全自动生成网页信息抽取包装器的主要技术方法研究

Citation:

李广建, 乔建忠. 全自动生成网页信息抽取包装器的主要技术方法研究. 情报理论与实践. 2010;(1):100-104.

摘要:

网页信息抽取包装器的生成方法很多,按自动化程度可分为手工、半自动和全自动三类,该文旨在研究全自动生成网页信息抽取包装器的主要技术方法,首先构建了对应的分类体系;其次对近年来主流的15种包装器生成技术进行了定性分析和分类比较;最后提出5点发展趋势.
收录:PKU