叶子网络bbs论坛

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 10712|回复: 0
打印 上一主题 下一主题

请问随便互联网上的一个页面,像搜狗,搜搜是不是根据哪些技术来提取该页面的核心...

[复制链接]

47

主题

110

帖子

1571

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1571
跳转到指定楼层
楼主
发表于 2014-9-1 22:35:20 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

问题:请问随便互联网上的一个页面,像搜狗,搜搜是不是根据哪些技术来提取该页面的核心内容的?是不是根据权重标签或者看到数量最多的关键词

参考答案:

好比谷歌这种知名搜索引擎,数据库里会有容量很大的常用词语资料库和核心内容识别方法,会把所有每个资讯文字的标题,去数据库比较,主要关键词,网站段落文字等谈得上该页面特性的东西来一一对比,从而计算出一篇独立页面的核心内容。 如果仅仅是不是根据文章标题又或是主要的词语,假如遭遇写这些文字的编辑不严谨,或某意义不怎么能表达的关键词多次出现,进而判断失效。


回复

使用道具 举报

手机版|Archiver|叶子官网|杭州轩翼网络科技有限公司 ( 浙ICP备17027999号

GMT+8, 2024-4-19 17:37 , Processed in 0.271229 second(s), 26 queries .

Powered by Discuz! X3.3

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表