乐动平台官网_乐动(中国)

国家实验室

数字图书馆

您现在的位置: 中国铁道科学研究院

刊物出版近期目录与摘要

铁路计算机应用

正文

2006年增刊期

2010年09 期

标题

网页信息自动抽取技术的研究(19 卷)

英文标题

Research on automatic extraction technology of Web information

摘要

在网络舆情分析中，经常要从大量的网页信息中抽取出有用的数据。但一般的网页信息抽取技术都是基于对HTML文档的分析。本文提出网页信息自动抽取的方法，可以滤除网页噪声，快速准确地获取所需要的网页信息。该方法首先将HTML转换为结构化的XML文档，然后结合DOM4J和XPath语言

作者

新闻作者:胡少荣，孟嗣仪，刘云，张彦超，丁飞

关键字

关键词:自动抽取网页信息解析模板 XPath 网络舆情

COPYRIGHT©2001-2025 CHINA ACADEMY OF RAILWAY SCIENCES CORPORATION LIMITED，ALL RIGHTS RESERVED

乐动平台官网版权所有
京ICP备05020493号

星空体育·(中国)官方网站 | mk体育（中国）官方网站 | 开云体云APP官网入口 | 安博官网 | 安博平台 | 安博手机网页版登录入口 | 开云在线登录 | 安博在线 | 开云线上平台（集团）官方网站 |