手机ip代理怎么更改

ip代理2周前全球ip代理4

全网最佳IP代理服务商- 9.9元开通-稳定的代理服务
如果您从事外贸、海外视频博主、海外推广、海外广告投放,欢迎选择我们。
让您轻易使用国外主流的聊天软件、视频网站以及社交网络等等

  平台授权单向性与第三方行动者日益增长的数据需求之间的矛盾,推动了未授权的数据采集方式兴起。作为更隐蔽的数据流动方式,未授权的数据采集与平台数据开放权力之间的运作关系尚未得到足够的关注。从平台社会中的数据基础设施和可供性理论脉络出发,本研究旨在考察未授权情境下行动者与平台方的技术互动,揭示其背后所隐含的平台数据开放特征,并由此审视平台权力边界。通过走查法与半结构化访谈发现,未授权的数据采集对平台与用户“双重隐蔽”。行动者挑战平台既定框架并进行技术实践的再创造,这种未授权数据的可获取性成为数据可供性“再隐蔽”的表现形式。平台对技术手段的权衡与使用促成了“分层可供”的数据开放特征,形成技术性的权力边界,并将其与行动者在技术层面上的对抗关系转化为社会性的合作关系,以巩固自身权力。

  随着互联网治理研究从关注信息、内容、行为等浅层表征,转向注重数据、算法等隐性的深层问题,数据背后的权力边界与再平衡成为数字时代的重要议题。平台社会中,人们进入“数字化生存”状态,其生产生活与日常实践产生的海量数据由平台捕获、储存、流转并利用,体现了数据作为“基础设施”的特征,并由此引发了对数据确权与开放的大量讨论。相比平台“获取了什么”之类的浅层表征,数据“流向哪里”“用作什么”等深层问题更值得关注。当前,尽管少量研究关注应用程序接口(Application program interface, API)这一数字平台的关键要素,探讨数据在不同平台间经授权的流动关系,却忽视了以网络爬虫技术为主要手段的未经授权的数据流动。

  在大语言模型迅速发展背景下,模型训练对海量数据的依赖,进一步凸显了未授权的数据流动问题。平台通过API对行动者开放部分数据,但对数据获取频率、数量等有所限定,更有平台(如X,原Twitter)为维护用户数据安全与市场地位而停止提供免费的数据采集API服务。平台对数据开放拥有近乎绝对的话语权,其数据权益保护边界与第三方行动者数据需求之间的冲突使得网络爬虫技术不可避免地成为获取数据的重要手段。因此,平台数据开放与权力边界问题势必成为大语言模型时代的核心议题。

  由此,本文试图借助由第三方行动者推动的未授权数据流动这一特殊现象,以可供性理论为基础,以及由平台数据流动延伸出的“隐蔽可供性”的概念,对以技术为中介的第三方行动者、平台方互动关系进行考察,分析未授权情境下平台数据开放的表现形式与特征,并进一步审视平台数据开放的权力边界。

  以大数据、移动互联网、人工智能等信息技术为基础,围绕数字平台展开的各类社会实践活动催生了平台社会这种新型的信息化社会形态,并日益成为透视媒介和社会变革的新棱镜。平台社会是不同层面平台化的集合,以数据平台为基础,嵌入政治、经济、文化等社会系统。作为物质基础的数字平台在不同学科视域下具有不同的内涵。经济管理领域将其概念化为“双边市场(two-sided markets)”,买卖双方经由平台聚集在一起进行交易。计算机科学领域将平台视为可(再)编程的软件系统,通过模块化的集成为第三方软件开发者提供服务,并最终供用户使用。传播学学者不仅仅将平台界定为构建应用程序的基础设施,还是赋予更多表达和互动机会的社会和政治空间,都特别注重促成用户、广告商和第三方开发者等不同行动者的连接与互动。这一概念的界定强调了平台具有数字化、中介性、可供性三个层面的特征,即平台作为数据基础设施,以数据为主要的社会资源并使其货币化流通,以模块化集成为主要的服务形式;充当中介的角色,促成原本难以关联的行动主体通过平台建立连接关系;通过提供“连接”的技术支持,推动社会资源与生产关系的重组,并作为一种技术物为行动主体提供一定程度的行为可能性。

  数据基础设施,作为技术架构的最底层支撑,是数字平台得以正常运行的基础。它隐藏于可见的应用软件交互界面背后,将各种用户行为转化为标准化的数据,自动汇入平台数据库。此外,它不仅基于对海量数据的筛选、分类、处理与洞察决定应用软件界面内容的呈现,同时以应用程序接口(API)和软件开发工具包(SDK)等形式控制着第三方应用软件,这表明:数据基础设施不仅仅是平台本身技术层面的数据基础,同时掌握着社会层面的连接权限,拥有数据开放权力。因此,数据对于平台而言是重要资产,对其市场竞争地位具有重要价值。

  正是由于充分意识到平台巨大的权力和价值,作为数据基础设施的平台巨头采取“双重围猎”策略,一方面通过数据追踪技术积累大量用户数据获取竞争优势,另一方面构建强大的平台合作生态系统以巩固竞争优势。由此,随着平台系统间渗透程度的逐步加深,以及与现有社会制度结构的积极融合,平台的数据基础设施成为公共价值日益增强的平台社会生态系统的重要组件,进而对整个社会系统的运作发挥着越来越大的影响力。当前,平台如何权衡自身商业利益与社会公共价值边界,把控权益保护与数据开    放的尺度,是面临的首要问题。

  数据的价值在于流动,理想状态下的开放数据能够被任何主体免费、重复使用,创造更大的公共价值。然而,现实中用户数据以免费的形式汇入平台转化为平台的合法资产,但平台数据却并不具有无偿开放特征。平台通常采用“开放但封闭”的战略,通过对数据开放的范围、类型、内容加以管理,以API为数据开放的唯一官方途径,行使其对数据的权力。行动主体在遵循平台服务条例的前提下,向平台申请使用API的权限,获取平台允许的数据。然而,通过平台授权才可获取数据的方式体现了平台对信息权的掌控,即数据流动与使用由平台决策,用户被迫将个人信息权让渡于平台。具体来看,API可获取数据量的限制、访问权限授予的不透明性、随时更改撤销的条例规则,均凸显了授权情境下平台数据开放的单向性与强制性。为了突破平台授权的限制,一些行动主体开始通过网络爬虫等非公开的未授权渠道获取数据。网络爬虫是指允许自动下载和解析互联网页面显示内容的技术,与API相比,网络爬虫技术出现的时间更早,灵活性更高,但易用性相对较差,需模仿真实用户请求数据的方式,进行数据捕获、解析等复杂工作。平台方为维护自身数据资产安全,避免隐私数据泄露损害用户权益,减少服务器被高频访问而消耗有限的带宽资源,通常会设置反爬措施拦截网络爬虫。

  当前,平台数据开放的相关研究主要集中于API这一需授权的数据流通方式,而对未授权的数据采集行为关注较少。授权情境下,平台的数据开放程度呈现差异化特征,并处于动态变化过程。例如,Facebook在运营的初期阶段,数据开放程度较高,可借助API获取用户个人资料、好友列表以及与用户相关的其他信息;2010年推出的Graph API则引入了更为结构化的数据访问方式;但从2014年起,Facebook逐步收紧了API权限,开发者只能通过用户直接授权访问好友数据,部分敏感数据(如好友列表、用户活动详情等)不再对第三方开发者开放;同时,Facebook还引入了Access Token的细化管理,进一步限制开发者的数据访问范围和时间,由此逐步演变为复杂的分层治理方式。与之类似,平台对未授权数据采集的治理可能也具有差异化特征,即对部分数据制定严格的保护机制,对其他数据的保护机制则相对宽松。然而,当前鲜有研究关注未授权情境下平台的数据开放与权力行使状况。

  “可供性(Affordance)”概念最早由美国学者Gibson提出,其认为可供性是环境与主体互动的产物,生物在特定环境下行动的可能取决于生物与环境之间,经由生物的感知形成了特定的关系。Gibson对可供性的定义突破了主客二元对立框架,为理解人与技术的关系提供了新视角。自可供性概念提出,其具体内涵的发展演化显露出两种不同维度。一方面,研究者们强调可供性的本体属性,指向技术物的具体功能。Gaver提出的“技术可供性(Technology affordance)”概念,则将可供性作为分析技术属性的有效工具,作为技术的媒介形塑了传播与行动。因此,在将可供性作为本体属性的研究中,可供性常以复数形式出现。如低阶可供性指向某个平台的具体功能或技术特征,高阶可供性强调社交、内容、平台等指征。另一方面,研究者们强调可供性作为行动者与技术物之间的关系属性。对可供性“关系”属性的强调强化了其作为一种认知概念的色彩。如Schrock提出“传播可供性”概念,突出技术客观属性和个体感知间的互动关系,以及互动关系对传播实践的调适。Willems提出“关系可供性”,将情境、人群等关系属性纳入对可供性的考察。

  对可供性概念的差异化界定,一方面显示了理解人与技术的不同方式,另一方面显示出概念本身蕴含的巨大解释潜能。因此,可供性理论被广泛用于理解各种新兴技术环境下基于平台数据可供的用户交往与行为。例如,平台通过生产可供性、社交可供性、移动可供性分别赋予用户生产内容,建构社交关系网络,获取场景化服务的权力,通过第三方应用程序接口允许数据访问,最终实现平台边界扩展与数据垄断。与此同时,平台控制着用户社交数据的访问规则与条件,将“可见性”转化为商业模式(即付费会员机制),创建了基于不同可见性身份的监控可能性,并进一步影响人们对于人际关系的理解及行为。

  基于可供性理论的平台数据基础设施研究,从平台固有属性、平台与用户关系等不同侧面推进了对平台数据可供性的理解,但主要集中于人们在可见的交互界面中与技术的互动。数据基础设施的可供性具有不可察觉的隐藏性,数据以不可见的方式潜在地影响社会。因此,有学者进一步提出“隐蔽可供性”的概念,认为作为数据基础设施的“数据中台”隐藏在用户可见的交互界面之下,一方面将用户行为转化为不可见的数据,另一方面通过接口、权限等方式推动数据的再利用。“隐蔽可供性”聚焦于授权情境下的数据流动,推动了可供性理论在纵深维度上的再发展。但这一概念仅仅关注到平台终端用户视角下的浅层隐蔽,尚未触及更具隐蔽性的本体属性及其与多元行动者间的互动关系,存在以下几点局限。

  第一,“隐蔽可供性”顺应了当前多数平台研究对“用户”的定义,将行动者限定于使用平台终端的普通用户,忽略了平台社会中的多元行动者。可供性的实现涉及“异质性实体(heterogeneous entities)”之间的动态交互,包括个人用户、商业用户等人类行动者以及以功能、算法形式存在的非人类行动者。数字平台作为用户与企业等多方行动者的整合性基础设施,在普通用户与第三方市场主体的双边市场环境中起到连接作用。相关研究多强调对普通用户的讨论,但对其他主体(如第三方企业等)与技术的互动对其行动可能性的影响关注较少。就数据流动而言,对普通用户可见的技术对象是平台的操作界面,数据基础设施并非直接可见,具有“隐蔽”特征。但是,对于平台企业与经授权的第三方市场主体,由“数据中台”承载的数据基础设施却是可见的交互界面。从这一视角来看,授权情境下的数据流动是可见的,并非以不可觉察的方式影响社会。相比之下,未经授权的数据流动过程中,平台未授权数据开放的技术环境对行动者并非直接可见,即平台并未向行动者提供明确的交互界面,同时后者与技术的互动过程于平台而言亦不可见。由此推断,“隐蔽可供性”对行动者的狭义理解导致其对可供性理论纵深维度上的拓展浅尝辄止,忽视了未授权情境下数据流动反映的“可供性再隐蔽”对平台与多元行动者的双向深层隐蔽。

  第二,仅涉及既定框架范围内的人之能动,未能涵盖未授权数据流动中行动者与技术互动的高度能动性。越来越多的学者意识到不能将可供性等同于简单的工具属性,强调人的能动性在可供性理论范畴下的重要性。然而,无论技术环境是稳定的还是动态变化的,人的能动仍然在既定框架内进行。即人与技术交互感知的可供性无法超越技术客观属性的范畴,能动范围有限。授权情境下,基于数据流动供求双方的协议,平台限定了第三方主体获取数据的方式、内容、规模与用途,后者的能动性以遵循协议为前提。在未授权情境下,行动者与技术互动的能动性,一方面体现于平台未明确提供未授权数据流动的操作界面,要求行动者自主定义并搭建与技术交互的界面,如开发模拟真实用户请求数据的工具;另一方面体现于行动者与技术的互动过程不断挑战与突破数据获取的范围,如破解数据加密算法从而获取并未明确开放的数据。此外,行动者在借助网络爬虫抓取数据的过程中,可以洞察平台内部的数据结构与流动关系,理解“数据中台”的运作机制与分层可供特征,进而影响其后续数据获取与使用的可能性。

  第三,仅限于技术环境变化的影响范围可控性,忽视了其与伪装身份的行动者之间的博弈。新近研究对可供性的讨论不再满足于Gibson提出的“稳定的”环境,而是关注技术环境持续变化的“动态性”,强调人与技术环境的共同进化。授权情境下,平台直接掌握着数据流动的控制权,平台对特定行动者技术环境的改变未必直接影响到其他行动者的可供性感知及其后续行为。例如,第三方市场主体通常仅需获得平台授权即可获取部分不涉及用户隐私的数据,平台通过调整授权范围改变对特定行动者的数据开放技术环境,无需请求普通用户的授权,但普通用户未必能直接感知这一技术环境的变化。在未授权的数据流动情境下,行动者通常将自身藏匿于普通用户的身份之下,平台难以区分数据请求方是否为真实的普通用户。因此,未授权数据开放的技术环境变化将影响平台承载多元行动者的技术环境,由此引发平台与未授权行动者之间的博弈行为。

  总体而言,现有研究主要针对授权情境下的平台数据开放进行讨论,对具有潜在大规模需求并日益广泛地存在于现实社会中的未授权数据流动关注有限。在行动者界定、行动者能动性、技术环境这三个可供性理论的关键要素上,当前结合“数据中台”、可供性理论所发展的“隐蔽可供性”分析框架对平台未授权情境下的数据流动解释力度有限。因此,本研究基于“隐蔽可供性”,在可供性理论的纵深维度上进一步深化,提出“可供性再隐蔽”,并尝试回答“平台未授权数据开放具有何种特征,如何审视其权力边界”的问题。

  截至2024年3月,我国移动互联网活跃用户数超过12.3亿。其中,即时通讯类平台微信、微博社交类平台微博,以及垂类社区交友类平台小红书、知识问答类平台知乎,用户活跃量和平台影响力位居前列,存储了海量用户生成内容与交互行为数据,成为第三方行动者数据获取的重要来源。此外,初步探索发现,上述平台授权情境下的数据开放程度具有典型性与代表性:微博设立开放平台提供官方的数据获取API,小红书设立开放平台但仅提供功能调用的SDK而不提供数据获取API,知乎既不设立开放平台也不提供API,微信则需使用其专有的微信浏览器才可浏览完整数据。因此,本文主要关注微信、微博、小红书、知乎四个代表性平台。

  本研究采用走查法(walkthrough method)和半结构化深度访谈相结合的质性研究方法,并进一步获取、分析平台用户协议与政策条例、技术文档,高管及安全相关团队的公开演讲、媒体报道手机ip代理怎么更改,试图全面呈现多元行动者间的博弈局面。

  其中,走查法是指研究者直接与应用程序界面互动,核心在于对应用程序的屏幕、功能和活动流程逐步观察和记录,以审查应用程序的愿景、运营模式和治理策略。走查法为本研究理解行动者与技术互动模式,考察平台未授权数据开放提供了基础。研究者于2023年12月对微博、微信、小红书、知乎四个平台的未授权数据获取方式进行走查,分析平台的未授权数据开放特征。为了便于平台间对比,主要走查多数平台共有或相似的页面模块,包括推荐、搜索、话题、用户主页、内容详情页等,重点关注各模块可采集的数据内容与规模、采集方式与要求,特别是对数据传输接口的考察。由于APP的数据接口普遍设置了严格限制,其数据相对难以爬取,因此,本研究重点走查数据爬取常用的各平台网页端。

  在对各平台未授权采集数据方式有了整体把握之后,研究者开展了半结构化深度访谈。对于爬虫实践者,主要考察行动者与技术互动中对平台未授权数据开放的感知、与平台方的互动关系。本研究在社交媒体平台与技术社区爬虫经验交流帖的讨论区中随机招募受访者,并结合滚雪球方式获取符合要求的访谈对象。共有6名爬虫实践者接受访谈(A1—A6),包括4名男性,2名女性,大多具有1—5年不等的爬虫经历(受访者基本信息见表1)。同时,本研究对互联网企业安全风控团队的产品经理、运营、研发工程师等进行访谈,试图从平台方视角揭示平台数据权力的运作特征。由于平台安全治理具有一定敏感性,同时受研究者社会资源限制,最终访谈了4位从业人员,应受访者要求隐去企业名称,所有的受访者匿名化依次处理为S1—S4(从业者基本信息见表2)。上述访谈时间为20至45分钟不等,以线上语音形式为主,面访形式为辅。

  行动者与技术之间的互动关系影响其行为的可能性,人与技术之间的关系是可供性的核心属性。在未授权数据流动情境下,行动主体包括未经授权的数据采集者与平台方,因此涉及数据采集者、平台方与技术分别的互动关系,以及二者经由技术中介的互动关系。本文基于走查法、半结构访谈收集的经验材料,以上述三对互动关系为分析框架,阐释未授权情境下行动者对平台数据开放的感知方式、平台未授权数据开放特征,并审视其权力边界。

  技术并非单向作用于行动者,行动者能够在技术框架内发挥能动性进行技术实践的再创造。在未授权数据获取的情境下,平台未提供明确的数据开放技术界面,要求行动者自主搭建获取数据的界面,这一行为本身体现了行动者突破既定框架再创造的技术实践。

  受限于平台对数据访问的控制力度以及防护措施的严密性,行动者通常灵活地通过两类途径开展实践。一类是直接爬取平台数据,行动者通过定义可用于伪装成真实用户访问的工具与平台进行技术互动,如抓包采集、直接抓取网页元素等。抓包采集需要监听HTTP/HTTPS流量,构造请求数据的参数(如User-Agent中的操作系统、浏览器等信息,身份识别的Cookie、IP地址及加密签名等),模拟真实用户发起请求并获取平台返回的数据包。不同平台或同一平台内不同数据类型对请求参数的要求及其生成方式存在差异,直接影响未授权数据获取的难度。直接抓取网页元素需行动者模拟点击、输入等真实操作来收集数据。然而,平台的动态渲染增加了用户行为模拟的难度。例如,微博的三个子域名站点对页面进行了不同程度的动态渲染(图1),要求行动者开发相应的模拟功能来适应平台的交互界面及其变化。常用的抓包采集以及行为模拟工具(如Python的Selenium库)通常具有一定的自动化特征(如固定的请求频率、鼠标操作轨迹等),极易被平台识别,因此行动者需结合更多工具(如代理IP池、验证码破解工具AntiCaptcha等)进行深度伪装,以避免身份暴露。另一类是间接通过第三方平台爬取数据,如通过搜狗微信搜索采集微信公众号文章。行动者需先自行探索信息聚合的第三方平台,并与其技术环境进行互动,随后采用与直接爬取平台数据相同的方式搭建界面。然而,第三方平台提供的数据可能会过滤或简化某些字段(如第三方浏览器不显示微信公众号文章的评论列表),也反映了未授权数据的获取难度。

  从行动者的视角来看,6名受访者均提及其在数据爬取实践过程中能够感知平台存在一定的数据开放且具有平台间的差异。如A1所言:“微博是爬虫的新手村,太开放了,微信和小红书的数据很难爬。”同一平台内不同用户端获取未授权数据的难度也存在差异。一方面,某些子域名所承载的页面数据没有进行严格的访问控制,因此行动者多通过切换平台的不同子域名绕过一些反爬措施。受访者A5提到:“APP的反爬做得很厉害,我不会硬怼,通常会换个路子,找找有没有移动端的网站,这些页面一般比较简洁,没怎么做反爬。”另一方面,行动者还会通过切换不同的用户身份采集未授权数据,“我之前想爬微信公众号的历史发文信息,用个人微信号抓包很难,教程说可以自己注册个公众号,编辑文章页面有个引用功能,可以抓到接口”(A2)。利用走查法研究发现(表3),微博对未授权数据的开放程度较高,各数据传输接口均仅需提供基础参数即可抓取数据,而知乎对不同类型的数据接口设置了无需参数、基础参数、加密参数三个层次的传输要求。小红书与微信公众号平台对未授权数据开放程度较低,各模块可采集的数据内容相比其他两个平台更为有限,前者对各接口均要求传递加密生成的参数,后者则设置了专用的微信浏览器限制数据访问。此外,各平台对不同模块的数据单次加载量基本进行了一定的差异化设置,这影响了未授权数据的采集效率。

  总体来看,行动者主要通过抓包采集、直接抓取网页元素、间接通过第三方平台采集三种方式获取未授权的平台数据。在自主搭建技术互动界面的过程中,行动者不仅深入理解平台的数据结构及流动方式,还通过可采集数据的内容、规模及采集要求感知不同数据类型、不同用户端之间的数据获取难度。这一未授权情境下数据的可获取性展示出平台“隐蔽”的数据开放形式,并推动了行动者形成对各个平台未授权数据开放的整体印象。

  数据是企业运作的关键资源,平台企业通过不断地收集、存储、分析人们在互联网中的行为,借此被赋予了前所未有的数据权力,产生了新的权力关系。尽管几乎所有平台都在用户使用协议中明确规定“未经许可不得擅自抓取数据”,但仍难以完全杜绝未授权行动者的数据爬取行为。一方面,遵循Robots协议的数据爬取属于平台的许可范围,善意的数据爬取(如搜索引擎爬虫)有助于推广平台内容,扩大影响力;另一方面,由于取证困难,平台无法完全依赖法律手段来阻止未授权的数据抓取行为,促使其不得不在更大程度上采取技术层面的防御措施。从业者S3坦言:“Robots协议只是‘君子之约’,只能防住表明自己身份的爬虫,我们的工作主要是识别出异常行为的用户,在技术上限制他们非法获取平台数据。”

  当前各平台的反爬措施主要包括主动设置的技术屏障,以及面对正在进行中的数据爬取的被动防御。前者基于身份识别、数据特殊化处理进行反爬,后者是基于爬虫行为的反爬。根据从业者(S2和S4)介绍,基于身份识别的反爬是指识别数据请求来自人类还是自动化的爬虫工具。一方面,服务器可根据数据请求所传输的特定参数识别。人类用户正常操作时,客户端可自动生成并向服务器传递数据请求的参数;使用爬虫时这些参数需自行构建,用以伪装成人类用户。基础参数生成难度小,其中user-agent用于表明访问者通过何种工具请求数据,提供浏览器版本等基础信息即可;cookie参数一般在用户登录账号后生成,易于获取。加密参数(如x-s,x-t)涉及特定的加密算法,生成难度较大。每次请求都将生成一些随机值和不可逆的加密字符串,并由服务器验证,爬虫需破解加密算法才能生成正确参数。另一方面,可通过主动弹出滑块、图片等验证码进行身份识别,自动化工具通常难以通过验证。基于数据特殊化处理的反爬是指对数据进行css偏移、自定义字体、图片化、特殊编码格式等处理,客户端在视觉上向普通用户仍展示正确的数据,但爬虫获取的数据为乱码,需根据特定的映射规则还原。相比之下,针对爬虫行为的反爬面临的是数据正在被非法采集的情境,更具有紧迫性,要求平台在请求数据的用户中识别出具有自动化行为的用户并及时干预。S3指出:“平台通常有两道防线,一是网关,只能拦截一些简单的恶意请求,主要用于确保流量正常、减轻后端的负担,二是风控,我们需要进行深度的数据分析和建模,识别复杂的异常行为,对可疑的请求进一步处理验证,识别是不是由真实用户发送的请求。”

  然而,为了确保正常运营与长期发展,作为技术框架设计者与把控者的平台面对未授权数据采集行为必须谨慎考虑技术手段的使用。首先,平台方需要在更新迭代反爬措施的频率上做出合理的决策。技术环境并非静态的一成不变,而是需要根据技术进步和安全威胁的变化进行动态调整。例如,从业者S4指出:“各种技术网站和社区有大量的爬虫教程,特别是对我们加密算法的破解,我们需要不定期去更新算法,但工作量很大,所以频率不会很高。”其次,平台业务扩张对反爬策略部署起到牵制作用。随着数据接口逐渐增多,平台需要对各个业务采取针对性的反爬措施。业务扩张带来的不断变化还要求平台在技术设计上保持高度的灵活性,确保在不同场景下的技术防御能够适应新的需求。例如,从业者S1提到:“数据接口越来越多,但每个接口的业务需求和风险特征都可能不一样,需要针对性地设计,还要严格地测试和验证,客户端改版了还面临兼容性问题,这些都需要时间。”最后,平台在反爬措施实施过程中,还必须在爬虫拦截率与误伤率之间找到适当的平衡点。虽然严格的拦截机制可以有效减少数据泄露和滥用的风险,但过于严格的措施也可能导致正常用户的访问受限,从而影响用户体验。“有种反爬叫数据投毒,是让爬虫只能抓到错误的数据,这几年大家常提到‘大数据杀熟’,有些可能是反爬策略太严格导致误伤了。”(S3)与此同时,面对数据与业务逻辑高度关联的现状,一味地采取技术防御手段无法解决性能与业务逻辑冲突的问题,并限制数据要素价值的释放。因此,在平台对技术手段的权衡使用过程中,未授权数据通过反爬策略的严苛程度呈现出“分层可供”的开放特征,即平台无法对所有数据传输接口与数据呈现页面采取统一的反爬技术手段,其技术防御的差异性形成了差异化的未授权数据开放程度。

  平台数据权力基于数据和算法生成,是具有数字控制能力的新型社会权力,承担建构数字社会关系、维护数字空间秩序的重要功能。社会科学领域的边界研究则更关注特定群体如何通过社会职能获得实践中的权威与控制,特别涉及对社会地位的争夺。作为数据基础设施,平台凭借其提供连接多元主体的基本功能,以此形成以技术为中介的多元主体互动关系。其中,平台与用户、第三方应用等主体之间建立的是合作关系,而未授权行动者突破平台既定框架的行为则体现了二者的对抗关系。因此,在未授权情境下,平台对数据开放的权力可以理解为面对未授权行动者的数据采集行为,通过实施多种技术手段,限制数据访问、控制数据流动的权力。这种以技术手段实现对数据开放的权威与控制行为构成了一种技术性的权力边界,通常不以显性的方式表现,而是体现在算法设计、数据架构和访问控制等隐性的技术操作中。

  尽管未授权数据开放的感知途径与特征均强调了人与技术的互动,但不应简单地将平台与未授权行动者的关系理解为技术性攻防,而是需要在二者的社会关系中理解平台数据开放的权力边界。正如S2所言:“世界上没有完全不可以被爬的网站,做反爬一定要时刻记住竞争对手是人,不是机器。”未授权行动者的目的不在于对平台反爬技术的破解,而在于获取目标数据。在授权情境下难以满足的数据需求将促使其采取未授权的数据获取行为,反映了二者争夺数据资源的社会互动关系。一方面,行动者可能不属于平台授权数据的开放对象。通过查阅微博、小红书和微信的开放平台发现,当前在授权情境下各平台的开放对象主要为企业用户。相比之下,海外平台企业数据开放的主体更为多元,如TikTok和X为学术研究者提供了数据获取API。两名学生受访者(A1和A2)都表达了选择爬取数据的原因是难以申请API调用的权限。另一方面,行动者对数据的需求可能不在平台授权数据的开放范围之内。“授权的数据开放平台无法解决所有数据需求的问题。合作方对数据需求的变化总是很快,我们也需要时间去评估一个接口是否适合开放,等不及的合作方可能就会在未获得授权的情况下自行爬取数据。”(S4)走查发现,以微博评论区为例(图2),抓包获取的评论数据接口返回的用户信息比前台展示、官方API可获取的数据更丰富,甚至可获取官方API明确显示“暂未支持”的数据字段。

  与此同时,平台将技术层面的对抗关系转化为社会性的合作关系,以巩固其技术性的权力边界。当前,平台的安全治理面临着环境配置不当、不同客户端接入带来的防护差异以及不断增加的流量攻击等多重挑战,对其安全防护机制提出了更高的要求。在内部,平台组建模拟攻击者的蓝军团队,在真实网络环境中开展实战攻防演练,以此检验其安全防护策略,发现并评估潜在的安全风险。“专门负责数据安全的蓝军团队会在采集、传输、存储、共享、销毁等全生命周期对企业数据进行全面的安全风险评估。”(S4)在外部,越来越多的平台(包括微博、小红书、知乎、微信)推出了漏洞赏金计划,将外部行动者对其系统的攻击转化为推动平台技术防御的动力。根据各平台安全中心发布的公告,平台鼓励行动者提交在数据爬取过程中发现的安全漏洞,并提供礼品、奖金等形式的激励。从业者S2表示:“白帽黑客能用独特的视角挑战我们的系统,有时他们发现的漏洞是我们内部都没察觉的。”行动者通过未授权手段获取数据,挑战了平台的技术性权力边界,但面对未授权行动者的持续挑战与冲击,平台将这种技术上的对抗关系转化为巩固自身权力边界的力量,以此不断加强对数据的防护措施,从而限制未授权行动者的行为。

  平台作为数据基础设施,协调多元行动者的互动,掌握着数据访问权限的授予规则与话语权,在这一过程中也涌现出对数据权力的角逐。在授权情境下,数据平台对应用平台企业的数据开放基于实际利益进行资源置换,具有集中性与单向性的分层控制特征。然而,这种平台数据权力行使的强制性与日益增长的数据需求之间存在矛盾,促使未授权的数据采集行为愈发频繁。在此背景下,平台社会的数据流动以及平台对数据开放的权力运作也更为隐蔽。基于此,本研究主要关注未授权情境下行动者与平台展开的互动实践,意图剖析平台隐性的数据开放形态并审视其背后潜藏的权力边界。

  鉴于未授权数据采集行为的隐蔽性,本文提出“可供性再隐蔽”的概念,强调以平台社会中异质性行动者视角讨论可供性的重要性,揭示高度能动的行动者与技术的互动机制,并为理解平台数据开放及其权力提供了新的视角,进一步推动了可供性理论在纵深维度上的深化。尽管既有研究在授权的数据流动情境下发展了“隐蔽可供性”的概念,但局限于普通用户视角下的“隐蔽”,忽视了异质性行动者界定“隐蔽”的差异。同时,当前可供性理论研究大多将行动者与技术的互动限定于既有的技术框架之下,未能探讨高度能动的行动者对既定框架的突破,特别是其对平台权力边界的挑战。本文认为,未授权行动者隐藏于“普通用户”的身份之下,对平台、普通用户及其他主体均不可见,通过自主搭建与技术互动的界面体现其行为的高度能动性,是当前平台社会不可忽视的多元主体之一,更是揭示平台社会下“隐蔽”的数据流动与权力运作的重要切入点。

  基于此,本文通过“走查”微信、微博、小红书、知乎这四个代表性平台以及半结构化访谈发现,行动者在突破数据获取既定框架的过程中感知平台数据的“隐蔽”开放,平台对技术防御手段的权衡与使用使得未授权数据呈现“分层可供”的开放特征。然而,这种未授权的数据开放并非平台自愿的意志体现,而是平台在面对未授权行动者的挑战时,出于技术、管理以及兼顾普通用户与合作伙伴的利益等多重博弈所呈现的动态结果。因此,平台在未授权情境下并非完全封锁数据,而是在“可供性”与“保护性”之间不断调适,形成了不同层次的数据开放,延续了授权情境下数据开放的“分层可供”机制。这种对未授权数据开放的权力边界调整是一个多维度、多主体参与的复杂过程,既是技术性的,也是社会性的。现有研究通常从法律视角探讨平台数据开放的权力边界,分析平台在数据采集与使用中的合法性、合规性以及隐私保护问题。然而,随着技术发展和平台数据开放的复杂性增加,媒介技术视角下的平台数据开放尺度,以及平台与未授权行动者如何以技术为中介进行互动,为理解平台社会中的数据基础设施与行动者实践提供了新视角。在未授权情境下,平台通过技术防御来控制数据的开放程度,形成技术性的权力边界,并将技术层面的对抗关系转化为社会性的合作关系,进而巩固其权力。这一技术视角的补充,使得平台数据开放的权力边界讨论不仅仅局限于法律框架,还扩展至以技术为中介的多元主体互动博弈的过程,成为理解平台数据治理的重要组成部分。

  综上所述,本文主要贡献包括三方面:第一,在“隐蔽可供性”的基础上提出“可供性再隐蔽”的理论概念,指出未授权情境下行动者的高度能动性与技术环境的动态变化特征,并强调从异质性行动者视角发展可供性理论;第二,通过考察行动者-技术、平台-技术的互动关系,揭示了平台对未授权数据开放的感知途径与“分层可供”的特征;第三,对当前平台权力边界的讨论补充了技术视角,认为技术是平台未授权数据开放的权力行使方式,并以此形成技术性的权力边界。同时,研究仍存在以下不足:首先,未能对各平台进行长期持续性地走查,对其未授权数据开放的动态性特征考察不足。其次,仅关注国内代表性的社交媒体平台,尚未涵盖国际平台及娱乐、购物等各垂直领域的代表性平台。未来研究将进一步对多领域的代表性平台进行长期、大规模的纵向考察,为多元行动者视角下未授权数据的“可供性再隐蔽”理论发展提供动态、稳健的经验材料支撑。

  作者:方园,复旦大学新闻学院博士研究生,上海200433;孙铭菲,复旦大学新闻学院博士研究生,上海200433

全网最佳IP代理服务商- 9.9元开通-稳定的代理服务
如果您从事外贸、海外视频博主、海外推广、海外广告投放,欢迎选择我们。
让您轻易使用国外主流的聊天软件、视频网站以及社交网络等等

相关文章

ip代理平台l2tp

  进入2025年以来,短剧上桌已是大势所趋,外在表现也是多种多样。就比如,过去贵圈人菜瘾大的影剧联动,到今年都变成了长短同题:   有过成功动漫改编的七英俊小说《成何体...

静态住宅ip代理口碑分析

静态住宅ip代理口碑分析

  随着直播行业的飞速发展,尤其是近年来直播电商、内容创作等场景的广泛应用,AI(人工智能)技术逐步成为其背后的核心驱动力。智享 AI 直播代理模式便是利用了 AI 技术的强大功能,推动直...

ip代理价格陆金苹果下拉

ip代理价格陆金苹果下拉

  当《流浪地球2》在抖音发起#行星发动机启动挑战收获120亿播放量,当《长安十二时辰》通过微博热搜矩阵连续霸榜17天ip代理价格陆金苹果下拉,影视行业的流量战争早已升级为“全域内容基建”...

国际动态ip代理

  回顾近3个交易日,天赐材料期间整体下跌1.84%,最高价为18.18元,总市值下跌了6.32亿元。2025年股价下跌-10.23%。   在近3个交易日中,多氟多有2...

 1