会发现很多时候我们只知道这些医院的俗称、简称,百度公立机构官网保护计划

发布时间:2020-01-01  栏目:办公  评论:0 Comments

9月11日午间消息,百度宣布升级“公立机构官网保护计划”,进一步加强对公立机构官方网站百度搜索结果的保护。通过该计划,网民在百度搜索政府机关、事业单位等公立机构时,百度将优先展示经过认证的公立机构官网或相关信息,并对搜索结果标注官方认证标识。

图片 1

10月17日,百度发布9月信息安全综合治理月报,向网民周知百度在处理网络虚假有害信息、保护网民权益方面的相关行动和信息。

据介绍,截至目前,百度“公立机构官网保护计划”已引入超过10万家公立机构官网,涉及700万个搜索词,覆盖了政府机关、事业单位、医院、殡仪馆、学校、博物馆、景区等公立机构,未来覆盖范畴还将持续增加。

提起城市中熟悉的医院,相信大家会脱口而出一连串诸如“某某三院”、“某军某院”、“几零几医院”等一系列名字。我们很容易发现,其实我们所熟悉的医院名字基本都是俗称、简称。除去这些,还有些全国知名医院的俗称几乎让人摸不着头脑:例如因为房顶是红色所以被称为“红房子医院”的复旦大学妇产科医院和一直用着曾用名“南京皮研所”的中国医学科学院皮肤病医院。

报告显示,9月,百度内容安全中心通过全方面手段打击清理百度全产品线的有害信息,其中利用AI人工智能技术挖掘打击色情、赌博等相关有害信息共36亿余条;人工巡查色情、赌博等相关有害信息共571万余条。

“在百度搜索中,每天有上千万次的搜索是寻找官方网站的。网民对搜索服务的权威性要求,永远是百度搜索最重要的进化方向之一。”百度搜索产品部负责人表示,百度通过“基础数据+搜索策略+前端展现”等手段,来保证公立机构官网的优先呈现。

有时仔细想想,会发现很多时候我们只知道这些医院的俗称、简称,而不知道他们的全名。对于那些跨省就医的人来说,更是很难分辨信息。而被这些复杂名称弄糊涂的,不仅仅有普通人,还有搜索引擎。

百度还公布了“公立机构官网保护计划”的最新进展。百度公立机构官网保护计划,是网民在搜索政府机关、事业单位等公立机构时,百度会优先展示经过认证的公立机构官网或相关信息,并对搜索结果标注官方认证标识。9月,百度宣布升级这一计划,首次推出“公立机构官网保护共建平台”,引入公众力量,共同建设公立机构官网保护生态。

据其介绍,首先,作为搜索引擎,百度的爬虫系统和日志系统会尽可能地穷尽网络上的海量信息数据,包括从网站的标题、内容、图片、音视频到网页间的链接指向关系等,并通过人工智能、大数据等手段,进一步分析各类数据中内外部之间的关联信息。

此前百度已经对超过21000家公立医院实行了品牌保护。在百度中搜索这些公立医院的全称时,搜索结果的第一位是这些公立医院的官方网站。百度希望以此来保证搜索用户可以准确地找到自己想找的公立医院。

共建平台上线一个月以来,已经收到了来自600多位用户主动提交的748个网站数据,覆盖了1674个公立机构名称的搜索词,经百度审核后,已成功上线了662个有效官网,包含1249个公立机构的常用搜索名称。这些由网民提交的官网信息,覆盖了政府机关、事业单位、医院、学校等多个类别的公立机构,其中大多数为诸如“第一完全学校”、“山一大二附院”等当地居民惯用的公立机构简称,以及一些较难统计的小城镇地区的公立机构,有效完善和补充了百度已收录的官网信息库。

其次,在数据之上,百度通过自研的各种策略,进一步过滤清洗数据,降低互联网中不良数据对各类搜索效果的影响,同时进一步建立围绕官网识别和排序的自动化策略,当用户发起搜索需求时,相关官网的信息会优先展现。

但问题很快出现了:在搜索公立医院时,很多用户不知道这些医院的全称,或者习惯性地使用民间称呼去搜索,导致有可能无法准确找到自己真正想要就医的医院官网。

若网民在使用百度搜索过程中,发现有暂未被百度收录的公立机构官网,都可以登录“百度公立机构官网保护共建平台”进行自主反馈和数据提交。

最后,在前端展现上,百度会对公立机构官网增加“官网”标志、优先展示等方式。

如何确保用户在不搜索全称的情况下也能准确搜索到自己想找的公立医院?百度必须尽可能全面地统计不同公立医院的简称、俗称。在没有现成统计数据的情况下,百度开始尝试“集思广益”。先是百度内部员工开始收集提交自己所知道的医院俗称,接下来又号召身边的亲戚朋友收集信息。

此外,百度各产品也在持续打击清理有害信息。其中,通过机器挖掘和人工巡查等手段,百度搜索在9月共清理20余亿条以危害社会安全等违法类为主的有害信息,百度网盘共清理有害链接53万余条,百家号共清理4.5万余条以色情低俗、赌博诈骗等为主的有害信息。

此前,百度于2018年上线了公立医院品牌保护计划。据百度搜索产品部负责人介绍,截至今年5月,百度已对超过14.5万个公立医院名称进行保护。当用户搜索这些受保护的公立医院名称时,将不会出现其他医院的商业推广。

来自全国的公立医院资料被陆陆续续地汇总起来。但很快百度又发现,很多用户会从自己理解角度去“创造”出一些搜索关键词,光靠百度自己的力量,很难实现对于这些关键词的全面覆盖。于是百度干脆发动了群众的力量,对外公开收集信息,并在双微上打开沟通窗口。得来的信息,也要根据卫健委的名单反复核验,甚至去实地走访。

在网络营销方面,百度9月打击医疗变体词6600万个,拒绝不合规广告3.19亿条。2019年百度打击医疗变体词总量达到3.06亿个,拒绝不合规广告总量达到25.42亿个。

同时,当网友搜索到还没有认证的公立机构官网时,百度在结果页会给予“暂无认证的官方网站”的提醒,并提示用户登陆“百度公立机构官网保护共建平台”进行反馈、共建。

目前,百度已经为超过3万家公立医院、14.5万个词条提供保护,覆盖率高达99%。

百度表示,若网民在上网过程中,发现任何非法、虚假和有害信息,都可通过百度举报中心

此外,就公立机构官网整体环境而言,由于部分公立机构官网存在建站不规范、封禁IP、robots声明等问题,百度在保护公立机构官网上,仍然面临一定的挑战。

这一场“名称之战”,才刚刚吹响战歌。

对此,百度方面也表示,将借助技术手段不断优化基础数据和搜索策略、前端展现等环节,尽力提升搜索体验问题。

公立机构官网保护:以权威之名

实际上,除了公立医院之外,学校、景点、政府机关等公立机构都会面对类似的问题。百度“公立机构官网保护计划”正是为解决这些问题而生。通过该计划,网民在百度搜索政府机关、事业单位等公立机构时,百度将优先展示经过认证的公立机构官网或相关信息,并对搜索结果标注官方认证标识。

截至目前,百度“公立机构官网保护计划”已引入超过10万家公立机构官网,涉及700万个搜索词,覆盖了政府机关、事业单位、医院、殡仪馆、学校、博物馆、景区等公立机构,未来覆盖范畴还将持续增加。

相关文章

留下评论

网站地图xml地图