毕尔巴鄂对阵皇家社会:两支近邻球队将于西甲联赛 “巴斯克德比”中为捍卫荣耀而战贝壳第三季度营收226亿元 经调净利润17.8 亿元 同比下降17.46%AI营销,让科技巨头尝到了大模型商业化的甜头安恒信息范渊在乌镇峰会谈AI:以工具视之、以工具用之、以工具治理之诺基亚与微软再合作,为 Azure 数据中心供货延长五年天岳先进发布业界首款 300mm(12 英寸)N 型碳化硅衬底三星介绍内部安全团队 Project Infinity 攻防演练项目,高效修复 Galaxy 手机平板漏洞上海市将推进低空飞行服务管理能力建设,2027 年底前累计划设相应航线不少于 400 条岁末,海尔给您备好一套“小红花”为什么说Q10K Pro是今年最值得入手的电视?看完这几点就明白了!“小墨方·大不凡”!Brother“小墨方”系列彩喷一体机全新上市黄仁勋:AI智能需求强劲,“物理定律”限制英伟达芯片增长诺基亚与微软再合作,为Azure数据中心供货延长五年国家数据局:到2029年基本建成国家数据基础设施主体结构中国已发展成为全球最大的互联网市场,拥有全球最多的网民和移动互联网用户中国铁塔:计划按照10:1的比例合股美国FCC正式划定5.9GHz频段用于C-V2X技术在AI领域奋起直追!苹果要对Siri大革新 2026年正式发布日本机构公布量子专利榜单:本源量子、国盾量子位居全球第1中国联通:拟向华为、中兴展开5G网络设备竞争性谈判采购
  • 首页 > 延展阅读 > 2016归档

    互联网冗余页面超百亿 360搜索上线“后羿算法”保护原创

    2016年12月26日 12:04:30   来源:中国网

      互联网的快速发展离不开原创和稀缺的优质原创资源。但采集网站采取疯狂而低劣的手段,短时间内拼凑出大量低质量网页,不仅严重影响了用户的浏览体验,也极大挫伤原创作者和原创网站的积极性。近日,360搜索发布站长公告,宣布上线后羿算法,对低劣的采集站点加以控制,对原创和稀缺性网页进行保护和提权,与站长共同建设良好的互联网生态环境。

      互联网冗余信息已达百亿 严重挫伤原创积极性

      “原创+转载+信息分类聚合”已经成为互联网新闻网站的最常见内容产出模式,比如新浪、搜狐、网易这些传统门户,和今日头条等移动APP。原创内容保证了网站的独特性,而转载内容保证网站信息的足够全面,大量的分类聚合工作,让互联网信息条理清楚类目分明。

      网站之间常规的转载,要求转载网站在醒目位置列出文章出处和原创页面入口,用户可以直接跳转到原创页面。但采集站,往往隐瞒或者篡改文章出处,且不分条理的盲目抓取互联网信息。为了获得流量收益,采集站会在页面中夹杂大量的广告和弹窗信息,不仅浪费了搜索引擎的收录资源,侵害了原创作者的版权,用户搜索体验也大打折扣。

      据估计,用户喜欢的高质量原创内容,互联网每天会诞生数十万个页面,与之成鲜明对比的是,采集网站带来互联网上的冗余信息则高达上百亿个页面,与冗余信息相比,原创内容可谓九牛一毛。

      采集站的内容分布领域非常广泛,常见的领域有普通问答类,商品购物类,娱乐新闻类,企业商情类,成人色情类,赌博诈骗类,私服外挂类,违法违禁类等,涵盖了互联网内容的各大领域。与此同时,移动互联网的采集和垃圾网页,虽然其数量级要比PC端要低,但在行为模式方面与PC端区别不大。

      “后羿算法”倡导原创,控制恶意采集

      12月26日,360搜索发布站长公告,宣布上线抑制采集保护原创的高级算法“悟空算法”,该算法将对低劣的采集站点加以控制,对原创和稀缺性网页进行保护和提权。360搜索表示,愿与无数专心做好站的站长共同建设良好的互联网生态环境

      “后羿算法”上线后,对于内容丰富的优质网页(如原创、稀缺资源、精心编辑的内容页等),会增加其在用户面前展现的机会;对于滥用采集手段的行为(如整站大规模采集,页面内容拼凑、含有大量广告干扰用户阅读、恶劣弹窗跳转、大量堆砌无关热词、站内搜索结果页等),会显著降低其展现机会和网页收录量;对于新闻网站正常的转载行为,采取了合理引导和规范控制,而不是一棒子打死。

      据悉,后羿算法采取了业界领先的大规模并行机器学习算法,通过亿万维度特征的刻画,结合对搜索领域问题的不断探索和实践,对海量文本数据进行主题和内容倾向性分析,对用户喜好程度进行全面建模和应用,能够对原创信息进行快速而精准的鉴别,能够对采集行为和垃圾网页进行定向的约束和管控。

      360搜索一直以来都掌握着采集类站点的完整索引量和历史行为模式,并对之进行长期的密切的关注和监控,一旦发现有恶劣作弊倾向就会进行严肃处理,用“后羿“命名该算法,就是为了秉承了英雄后羿的“去除冗余,除暴安良”精神。

      原创收录异议 可求助站长平台

      公告中,360搜索表示将矢志不移地与无数专心做好站的站长共同建设良好的互联网生态环境。360搜索建议那些存有恶意采集行为的站长,能够从长远发展考虑,积极完善网站建设,提供更多时效性高、内容丰富的原创内容,引擎将随着网站完善,不断提升收录量。

      360搜索同时也欢迎原创网页的作者,通过360站长平台主动提报收录缺失的信息。对于原创网站和作者,如发现自己的内容被恶意采集,对采集判定结果及收录状况存在异议时,360搜索建议通过站长平台的反馈中心及360搜索论坛版主进行反馈:

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    [编号: ]
    分享到微信

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。