中国数据产量占全球10.5% 巨量信息催生“算法创新”

发布时间:2024-11-01 18:53:39 来源: sp20241101

  中国数据产量占全球10.5%,巨量信息催生“算法创新”

  网络“大数据”,不只“数据大”(“融”观中国)

  ——透视“算法”系列报道之一

  本报记者 卢泽华

  在各类网络平台上,“算法”成为一项广泛应用的技术。通过数据分析和精准推荐,它改变了过去“人找信息”的搜索模式,逐步实现“信息找人”。

  关于“算法”,人们观点不一。有人认为,它方便了用户,提供了更精准的网络服务;有人认为,它在“算计”用户,造成“信息偏食”等问题;还有人认为,作为一项技术,它并无好坏之分,关键在于如何用正确价值和规范去驾驭。

  自今日起,本版推出“透视‘算法’”系列报道,解读“算法”带来的变化与影响。系列报道第一篇,关注大数据时代网民获取信息习惯的变迁。

  现状

  内容更丰富,平台更多元

  “以前遇到问题,第一反应是打开浏览器搜一下。现在除了搜索网页,也会去微信或短视频平台找答案。”北京市民王瑛向记者展示了一段短视频:“你看,前两天下厨,想做一道鱼香肉丝,抖音一找,教学视频就出来了。”

  王瑛今年36岁,从2000年左右开始接触互联网。最初10多年,她获取信息的方式主要有两种,一是在搜索引擎上检索,二是浏览门户网站。但最近几年,这种习惯开始改变。“现在网上信息太多,让人眼花缭乱,甄别起来比较费力。有时需要特定信息时,在手机软件中更容易找到结果。”她边介绍,边打开手机界面:“比如,想找购物信息,就去淘宝逛逛;想看电影,就去猫眼找找;想了解明星动态,就去微博看看;想获取专业知识,就去知乎搜搜……”

  在王瑛看来,这种改变是不知不觉形成的。每天频繁使用各类手机软件,“顺手搜一下”并不费力。久而久之,就形成了用多个平台搜索信息的习惯。最重要的是,“搜”完之后,手机应用会记住自己的需求,主动推荐感兴趣的信息,省时省力。

  王瑛的用网经历具有一定代表性。记者针对120名用户的搜索行为作了一项小型调研,结果显示:所有人均有使用搜索引擎的习惯,但将其作为唯一选择的仅占15%。多数人表示,自己会在各类手机应用中检索信息,并时常浏览各平台推荐的信息。比如,获取生活经验类信息,很多人都会选择刷短视频,“遇事不决,视频来学”。

  行业数据也印证了这一点。截至2023年6月,中国搜索引擎用户规模已达8.41亿人。但近七成用户也会通过短视频完成搜索,微信“搜一搜”月活跃用户也已超过8亿,几乎与搜索引擎用户总量相当。另一项调查也显示,用户平均每天会在 3.8个平台上搜索信息。

  挑战

  信息杂芜与“平台壁垒”

  虽然网上信息量更大了,获取信息的渠道更多了,但不少用户仍表示“存在使用体验不佳的情况”。

  信息杂芜是原因之一。“现在网上营销信息较多,虽然大多标注了‘广告’字样,但毕竟需要甄别,影响使用效率。”王辉是一名金融分析师,经常需要在网上检索信息,且对信息质量要求较高。但他发现,现在找到一张“纯净的网页”非常困难,这在一定程度上拖慢了他的工作节奏。

  王辉的情况并非个例。记者调查发现,在网上检索信息时,显示结果中很多都是广告链接。比如,搜索“培训”二字,排名最靠前的两个结果均为商业培训机构广告。

  据了解,各大搜索网站也都注意到这个问题,但如何改变行之有年的商业模式,还是个尚待破解的命题。“广告是网站主要盈利来源,目前业界只能尽量优化广告信息,提升用户体验,但要彻底转型,还需一定时间探索。”一家互联网公司的销售经理告诉记者。

  除了信息杂芜,互联网界还不同程度存在“平台壁垒”现象。

  据了解,过去,综合类搜索网站是各类网络平台获取流量的主要入口,通过一个搜索框、一个关键词,用户可以搜到全网各个平台的信息。而随着移动互联时代来临,美食、家居、旅游、短视频等垂直平台用户规模越来越大,每个平台都形成了自己独有的“大数据库”,这个“大数据库”不仅包含海量优质信息,还囊括了用户使用习惯等数据。动辄坐拥上亿用户的网络平台不再需要其他平台“引流”,这些数据便被视为独家资源,不再对外开放。这导致用户很难通过综合类平台搜到所有需要的信息。

  趋势

  向智能化与精准化发展

  如今,中国已经成为数据量最大、数据类型最丰富的国家之一。国家数据局日前发布的信息显示:我国数据产量已占全球数据总量的10.5%。更有研究机构预测,到2025年,中国数据总量或占全球近30%。

  “数据作为新型生产要素,已快速融入生产、分配、流通、消费和社会服务管理等各环节,但目前在发展过程中也存在数据应用潜力释放不够、数据供给质量不高、流通机制不畅等问题。”国家数据局副局长沈竹林表示。

  在这一背景下,仅仅“数据大”已经无法满足社会需要,还要进一步实现“数据精”“数据准”,从而有效降低用户获取信息成本,提供更加个性化、精细化的内容服务。在这种需求驱动下,“算法”技术应运而生。

  “算法”是人工智能技术与大数据技术的关联节点。中国科学院科技战略咨询研究院院长潘教峰认为,人工智能正在科研、贸易、交通、医疗等诸多场景中改变人们沟通的方式。其“活字典”、移动的“大百科全书”的特性,加上越来越接近人类水平的语言理解和生产能力,让其“答复”既有常识性,又呈现出集成创新性。

  因此,在互联网海量数据基础上,“算法”可以通过人工智能技术对用户兴趣偏好和需求进行分析归纳,描绘出用户画像,打上特性“标签”,进而以此为依据,进行精准化、个性化的定制推荐。

  在“算法”技术的调配下,用户每次打开手机应用,都可以收到针对个人需求的信息推送。同时,平台通过不间断收集信息,会变得越来越“懂”用户——打开购物网站,近期想要购买的产品已被推荐到首页;进入短视频平台,接踵而至的都是自己喜欢的视频内容;浏览旅游软件,想去的地方一一列在眼前,连机票购买链接都放好了……这一切,正是凭借日渐成熟的算法技术才得以实现。

  然而,有人担心,“算法”在大数据时代精准调配网络信息、提升服务水准的同时,也带来了“信息偏食”、网络沉迷、数据泄露、技术滥用等隐患。这些问题多大程度存在?又有哪些破解之道?我们将在“透视‘算法’”系列报道第二篇进行解读,请大家持续关注。(人民日报海外版) 【编辑:田博群】