叶子网络bbs论坛

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 11554|回复: 0
打印 上一主题 下一主题

像百度凭借按照哪些技术来判断一篇文章的核心内容

[复制链接]

47

主题

114

帖子

1803

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1803
跳转到指定楼层
楼主
发表于 2014-9-1 22:35:58 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

问题:请问我这里有一篇文章,像百度依靠哪些技术来提取这个文章的最突出的文字的?依靠代码内容还是统计频率最高的关键词

参考答案:正如搜搜这样的成熟运营的引擎服务商,他们会有容量很大的关键词库与语言提取算法,能够将记录到的每篇文章的主要文字,对比重要部位的,相关词语,站内相关内容等主要特征来比较,使得得出一篇独立页面的最突出的文字。

如果单纯地依靠文章标题又或是主要的词语,假如遭遇写这些文字的编辑不怎么精准,或表现情景意义不大的词语大量展示,导致提取不正确。


回复

使用道具 举报

手机版|Archiver|叶子官网|杭州轩翼网络科技有限公司 ( 浙ICP备17027999号

GMT+8, 2024-12-5 18:41 , Processed in 0.268353 second(s), 24 queries .

Powered by Discuz! X3.3

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表